-
AI 에이전트 평가, 왜 기존 LLM 벤치마크로는 부족한가
AI 에이전트 평가에 LLM 벤치마크만으로 충분하지 않은 이유를 정리했습니다. 벤치마크 점수와 실제 서비스 품질의 불일치, 비결정성, 행동 과정 검증까지 AI 에이전트 검증이 달라야 하는 지점을 개발자 관점에서 살펴봅니다.
-
AI 에이전트 신뢰성 검증: AI를 만드는 시대에서, AI를 검증하는 시대로
“이 AI, 믿고 맡겨도 될까?” 복지 수급 자격을 안내하는 AI 에이전트가 있다고 해보자. 한 시민이 자신이 지원 대상인지…
-
에이아이웍스, ‘AW 2026’ 참가로 제조 AI 혁신 선도
AI 전문기업 에이아이웍스(AIWORKX, 대표 윤석원)가 오는 3월 4일부터 6일까지 서울 코엑스에서 열리는 ‘AW 2026(스마트공장·자동화산업전)’에 참가해 제조 현장에서 실제…
-
자율주행의 게임 체인저, 3D Occupancy Prediction이 만드는 새로운 가능성
테슬라 로보택시가 보여준 미래, 그 핵심 기술은? 최근 테슬라는 자율주행 택시(로보택시) 서비스를 시범 운행하며, 자사의 기술이 실제 도로…
-
도시 빅데이터와 AI를 활용한 인구 소멸 분석 연구
도시 빅데이터와 인공지능 기술을 활용한 인구 소멸 탐색과 분석 연구를 위한 데이터 셋 구축 사례
-
사람을 돕는 자율주행 로봇을 만드는 기업
업무 생산성과 효율성을 높이기 위한 자율주행 로봇 솔루션
-
골프 산업에 혁신을 이끄는 기업 엑스업(X-UP)
AI 기반 잔디 손상 진단부터 로봇을 통한 자동 수리까지
-
‘제2회 인공지능 신뢰성 대상’ 수상
테스트웍스, ‘블랙올리브’로 우수상 수상
-
‘2024 대한민국 인공지능대상’ 수상
테스트웍스, ‘2024 대한민국 인공지능대상’에서 ‘정보통신기획평가원장상’ 수상
-
[blackolive] 사용자 기능 업데이트
블랙올리브의 최신 업데이트된 사용자 기능을 소개합니다.
-
[blackolive] 데이터 분포 시각화 업데이트
blackolive의 데이터 분석과 관련된 업데이트 기능을 소개합니다.
-
SOVAC과 함께한 대한민국 사회적 가치 페스타
선한 기술 혁신으로 주목 받은 테스트웍스




