AI 코딩 도구는 이제 소프트웨어 개발 워크플로의 핵심 수단으로 자리매김했습니다. 그중에서도 Claude Code는 요즘 엔지니어가 많이 사용하는 인기 AI 코딩 도구죠.
Claude Code를 사내 개발 도구로 도입한 조직은 구체적인 사용 패턴, 도구 성능, 가치를 정확하고 직관적으로 모니터링할 필요가 있는데요. 체계적인 모니터링은 비용 예측, 활용도 개선, ROI 입증에 도움이 되죠. 이를 위해 시중에는 다양한 모니터링 도구가 제공되고 있습니다.
먼저, Claude Code 자체가 모니터링과 옵저버빌리티(Observability)를 위한 OpenTelemetry 메트릭과 이벤트를 지원합니다. Claude Code에서 모니터링과 옵저버빌리티를 활성화하고, OpenTelemetry를 사용해 로그와 메트릭을 외부 모니터링 플랫폼으로 내보낼 수 있는데요. SigNoz가 그 예죠. SigNoz에서는 코딩 세션 활동, 로그 출력 등을 추적해 개발 워크플로의 성능 트렌드, 에러율, 사용 패턴을 파악할 수 있고요.
Datadog도 AI Agents Console로 Claude Code 사용 모니터링, 안정성 분석, 지출 추적과 ROI 측정을 지원합니다. 오픈 소스 도구인 ‘claude-code-otel’도 조직 단위 모니터링에 활용할 수 있죠. 이 글에서는 위에서 소개한 네 가지 도구의 Claude Code 모니터링 기능을 자세히 살펴보겠습니다.
1. Claude Code 자체 OpenTelemetry 지원
Claude Code는 모니터링과 옵저버빌리티를 위한 OpenTelemetry 메트릭과 이벤트를 지원합니다. 모든 메트릭은 OpenTelemetry의 표준 메트릭 프로토콜로 내보내는 시계열 데이터고요. 이벤트는 OpenTelemetry의 로그/이벤트 프로토콜로 내보내죠. 사용자는 환경 변수를 활용해 OpenTelemetry를 구성할 수 있습니다. 관리자는 관리형 설정 파일로 모든 사용자를 위한 OpenTelemetry 설정을 구성할 수 있는데요. 이로써 조직 전체의 Telemetry 설정을 중앙에서 제어할 수 있습니다.
Claude Code가 내보내는 메트릭은 다음과 같습니다. 시작된 CLI 세션 수, 수정된 코드 라인 수, 생성된 Pull request 수, 생성된 git 커밋 수, Claude Code 세션 비용(미국 달러), 사용된 토큰 수, 코드 편집 도구 권한 결정 수, 총 활성 시간(초)입니다. 아울러 Claude Code는 OpenTelemetry 로그/이벤트로 다음 이벤트를 내보내는데요. 사용자 프롬프트 이벤트, 도구 결과 이벤트, API 요청 이벤트, API 에러 이벤트, 도구 결정 이벤트가 그 예죠.
위와 같은 메트릭과 이벤트 데이터를 분석하면, Claude Code의 사용 패턴과 생산성, 개발 워크플로 영향, 비용, 성능과 관련해 인사이트를 얻을 수 있습니다. 아울러 ‘Claude Code ROI Measurement Guide’라는 GitHub 리포지터리에서는 Telemetry 설정, 비용 분석, 생산성 메트릭, 자동화된 리포팅을 포함해 Claude Code ROI 측정과 관련된 가이드도 제공하는데요. 여기서는 Docker Compose 구성, Prometheus와 OpenTelemetry 설정, Linear와 통합된 생산성 리포트 생성용 템플릿을 구할 수 있습니다.
2. SigNoz 기반 대시보드 구축

Claude Code에서 모니터링과 옵저버빌리티를 활성화하고, OpenTelemetry를 사용해 로그와 메트릭 을 SigNoz로 내보낼 수 있습니다. 설정을 완료하면, SigNoz에서 대시보드로 자세한 Claude Code 사용 현황을 파악할 수 있는데요. Claude Code 사용 패턴, 성능 메트릭, 팀 도입 관련 사항을 모니터링할 수 있고요. 토큰 소비, 비용, 성공률, 개발자 참여도, 리소스 활용도를 확인할 수 있죠. SigNoz는 VSCode와 터미널 환경에서 실행되는 Claude Code의 모니터링을 지원합니다.
SigNoz 대시보드에서 제공하는 Claude Code 주요 메트릭은 다음과 같은데요. 첫째, 총 토큰 사용량입니다. 이는 입력 토큰과 출력 토큰으로 구분해 Claude가 얼마나 많은 작업을 수행하는지 보여주죠. 둘째, 세션과 대화인데요. 세션은 개발자의 Claude 사용 빈도, 대화는 상호작용의 깊이를 포착합니다. 셋째, 총 비용입니다. 토큰 소비를 실제 지출 달러로 변환한 수치죠. 넷째, 명령 지속 시간인데요. 이는 속도 저하, 급증, 성능 저하를 파악하는 데 도움이 됩니다.
다섯째, 요청 성공률입니다. 요청의 성공 빈도를 보여주는 수치고요. 여섯째, 터미널 유형인데요. 여기서는 개발자가 작업하는 도구(VSCode, Apple 터미널)를 알 수 있죠. 일곱째, 모델 분포입니다. 이는 개발자가 실제 호출하는 모델을 보여주고요. 여덟째, 사용자 결정인데요. AI 제안의 수락 대 거부 결정을 추적해 개발자의 Claude 출력 신뢰도를 가늠할 수 있는 메트릭입니다.
3. Datadog AI Agents Console, 성능·비용 최적화

Datadog은 AI Agents Console로 Claude Code 사용 모니터링, 안정성 분석, 지출 추적과 ROI 측정을 지원합니다. Claude Code의 Telemetry를 활성화하면, AI Agents Console에서 Claude Code 세션의 실시간 Telemetry를 볼 수 있는데요. 모든 사용자의 총 지출과 토큰 사용량, 시간 경과에 따른 사용자 활동 트렌드, 에러율과 레이턴시 패턴, Claude Code 활동과 관련된 Git 커밋과 Pull request를 확인할 수 있죠. 참고로 AI Agents Console에서는 Claude Code 외에도 다른 AI 코딩 도구와 엔터프라이즈 AI 에이전트의 성능, 안정성, 도입 현황을 모니터링할 수 있습니다.
AI Agents Console은 Claude Code의 응답성과 안정성을 자세히 모니터링합니다. 이는 주요 성능 메트릭을 집계해 레이턴시 백분위수, 에러율 트렌드, 최상위 실패 bash 명령, 성공률을 표시하죠. 또 리포지터리별 요청을 표시해 문제가 발생하는 위치와 다양한 코드베이스가 Claude Code와 상호작용을 하는 방식과 관련해 프로젝트 수준의 인사이트를 제공합니다. 높은 에러 수나 레이턴시를 관찰하면, 추가 컨텍스트와 트러블슈팅을 위해 관련 로그로 즉시 전환할 수도 있고요.
아울러 AI Agents Console은 Claude Code의 경제적 영향도 상세하게 보여주는데요. 총 지출, 사용자별 지출, 모델별 비용 트렌드(Sonnet vs. Opus vs. Haiku), 시간 경과에 따른 누적 비용 트렌드를 파악할 수 있죠. 예를 들어, 고가 모델이 필요하지 않은데도, 지난 한 달 동안 Opus 모델의 사용이 Haiku 모델보다 3배 더 빠르게 증가한 사실도 확인할 수 있는데요. 이는 단순 작업에 사용하는 모델과 복잡한 리팩토링 작업에 사용하는 모델을 구분하는 Claude Code 비용 절감 정책의 근거로 활용할 수 있습니다.
4. claude-code-otel 오픈 소스 모니터링 스택
오픈 소스 도구인 ‘claude-code-otel’은 셀프 호스팅 옵저버빌리티 솔루션입니다. 이 도구도 Claude Code의 OpenTelemetry 기본 지원을 활용해 모니터링하는데요. OpenTelemetry, Prometheus, Loki, Grafna의 사전 구성된 설정을 제공하고요. 비용, 사용자 활동, 도구 성능, 생산성 메트릭, API 레이턴시, 에러 등의 심층 분석을 위해 사전 구축한 Grafana 대시보드를 함께 지원하죠. 이는 여러 사용자의 데이터를 집계하도록 설계돼 조직 단위에서 활용하기에 적합합니다.
claude-code-otel은 몇 가지 환경 변수를 설정하면, 자세한 메트릭과 로그를 내보내도록 Claude Code CLI를 구성할 수 있습니다. 이는 데이터를 수신하고 처리하기 위해 전체 백엔드를 가동하는 Docker Compose 설정을 제공하죠. “claude-code-otel 설정은 Docker 덕분에 간소화됐다”는 평가도 받습니다.
동작 방식은 다음과 같은데요. OpenTelemetry Collector가 모든 사용자의 Claude Code 인스턴스에서 Telemetry 데이터를 수신하고요. Prometheus가 메트릭(토큰 수, 비용, 레이턴시)을 스크랩하고 저장합니다. 그다음, Loki가 이벤트 로그(사용자 프롬프트, 도구 결과, API 에러)를 수집하고 저장하고요. 마지막으로 Grafana가 Prometheus와 Loki를 쿼리해 대시보드에 데이터를 시각화하죠. 이로써 Claude Code의 다양한 사용 현황을 직관적으로 확인할 수 있습니다.
맺음말
지금까지 팀을 위한 Claude Code 모니터링 방법 4가지를 살펴봤습니다. 이 글의 요점은 다음과 같은데요.
- Claude Code 자체 OpenTelemetry 지원을 활용하면 환경 변수나 관리 설정으로 메트릭과 이벤트를 수집하고, GitHub의 ROI 측정 가이드를 활용해 사용 패턴과 생산성, 비용 인사이트를 얻을 수 있습니다.
- SigNoz를 기반으로 대시보드를 구축하면 총 토큰 사용량, 세션과 대화, 비용, 명령 지속 시간, 요청 성공률, 터미널 유형, 모델 분포, 사용자 결정 등 다양한 메트릭을 시각화해 개발 워크플로의 성능 트렌드와 사용 패턴을 직관적으로 파악할 수 있습니다.
- Datadog의 AI Agents Console을 활용하면 응답성과 안정성을 레이턴시 백분위수, 에러율, 성공률로 모니터링하고, 총 지출과 사용자별·모델별 비용 트렌드를 추적해 경제적 영향을 자세히 확인할 수 있습니다.
- claude-code-otel의 오픈 소스 모니터링 스택을 사용하면, OpenTelemetry Collector, Prometheus, Loki, Grafana로 구성된 사전 구축 스택을 Docker Compose로 간편하게 배포하고, 여러 사용자의 데이터를 집계해 조직 단위 모니터링을 구현할 수 있습니다.