본문으로 건너뛰기
배경 이미지

하이라이트

엔터프라이즈 AI 에이전트 성능 평가 가이드 : 인포그랩 NEXA의 LLM-as-a-Judge 실전 적용 사례

AI 에이전트는 프롬프트, RAG, MCP, 도구 호출, 다단계 추론 등을 결합해 자율적으로 동작합니다. 따라서 성능을 정확히 측정하려면 이러한 특성을 고려한 전용 평가 방법이 필요합니다. 이 글은 에이전트 성능 평가 시 고려 사항, LLM-as-a-Judge 평가 방식, 도구 호출·사용 능력 평가 방법, NEXA 적용 사례와 결과를 다뤘습니다.

ai에이전트NEXA

자세히 보기

포스트

HOME/BLOG
GitLab Commit SF 2020 현장리뷰GitLab Commit SF 2020 현장리뷰

뉴욕, 런던을 거쳐서 세 번째 GitLab Commit이 샌프란시스코에서 개최되었습니다. 약 400명 이상의 등록 고객과 13곳의 기업 스폰서, 그리고 3개 트랙에서의 24개의 세션이 진행되었습니다. GitLab 사용 고객들이 직접 전하는, 어떻게 GitLab 활용해서 제품 개발 시간을 절감하고 보다 효율적으로 개발 자원들을 활용할 수 있었는지에 대한 노하우를 확인해보세요!

Mus
Mus | DevOps Engineer
인포레터에서 최신 DevOps 트렌드를 격주로 만나보세요!