
LLM·하네스로 더 좋은 n8n 워크플로 생성하기
LLM에 정확한 정보와 도구를 제대로 쥐여 주면 더 높은 품질의 n8n 워크플로를 생성할 수 있습니다. 이 글은 LLM의 작업 환경 전체를 설계하는 접근 방식인 '하네스(Harness)'를 만들어 실험한 내용을 다뤘습니다. 같은 모델과 같은 요청을 두고 하네스 수준만 바꿨을 때 모델이 생성한 n8n 워크플로 품질이 어떻게 달라지는지 소개합니다.

LLM에 정확한 정보와 도구를 제대로 쥐여 주면 더 높은 품질의 n8n 워크플로를 생성할 수 있습니다. 이 글은 LLM의 작업 환경 전체를 설계하는 접근 방식인 '하네스(Harness)'를 만들어 실험한 내용을 다뤘습니다. 같은 모델과 같은 요청을 두고 하네스 수준만 바꿨을 때 모델이 생성한 n8n 워크플로 품질이 어떻게 달라지는지 소개합니다.
이 글은 에이전트 옵저버빌리티의 개념과 동작 방식, APM·LLM 옵저버빌리티와의 차이, 구현 도구를 살펴봅니다. 아울러 Langfuse와 Google Gemini로 PR 리뷰 에이전트의 활동을 추적·평가하는 실습을 다룹니다. 또 에이전트 옵저버빌리티를 원활하게 운영하기 위해 유념할 사항도 알아봅니다.
자세히 보기 →폐쇄망 CI 환경에서 NAT 게이트웨이 뒤에 Maven 빌드를 돌리다 보면, 다른 빌드 도구에 비해 자주 멈추는 패턴을 마주합니다. 이 글은 폐쇄망 빌드의 의존성 수급 단계에서 발생하는 Maven 빌드 중단 문제를 GitLab Maven Virtual Registry로 해결한 과정과 실전 팁을 다뤘습니다.
자세히 보기 →개발팀 성과를 경영진 보고로 정리하는 데 며칠씩 걸리시나요? 2024년 이후 BI에서 DevOps로 확장된 생성형 AI 데이터 분석, 그리고 GitLab Data Analyst Agent와 인포그랩 Mantis가 이를 자연어 한 줄로 바꾸는 방식을 살펴봅니다.
자세히 보기 →
LLM에 정확한 정보와 도구를 제대로 쥐여 주면 더 높은 품질의 n8n 워크플로를 생성할 수 있습니다. 이 글은 LLM의 작업 환경 전체를 설계하는 접근 방식인 '하네스(Harness)'를 만들어 실험한 내용을 다뤘습니다. 같은 모델과 같은 요청을 두고 하네스 수준만 바꿨을 때 모델이 생성한 n8n 워크플로 품질이 어떻게 달라지는지 소개합니다.

이 글은 에이전트 옵저버빌리티의 개념과 동작 방식, APM·LLM 옵저버빌리티와의 차이, 구현 도구를 살펴봅니다. 아울러 Langfuse와 Google Gemini로 PR 리뷰 에이전트의 활동을 추적·평가하는 실습을 다룹니다. 또 에이전트 옵저버빌리티를 원활하게 운영하기 위해 유념할 사항도 알아봅니다.

폐쇄망 CI 환경에서 NAT 게이트웨이 뒤에 Maven 빌드를 돌리다 보면, 다른 빌드 도구에 비해 자주 멈추는 패턴을 마주합니다. 이 글은 폐쇄망 빌드의 의존성 수급 단계에서 발생하는 Maven 빌드 중단 문제를 GitLab Maven Virtual Registry로 해결한 과정과 실전 팁을 다뤘습니다.

개발팀 성과를 경영진 보고로 정리하는 데 며칠씩 걸리시나요? 2024년 이후 BI에서 DevOps로 확장된 생성형 AI 데이터 분석, 그리고 GitLab Data Analyst Agent와 인포그랩 Mantis가 이를 자연어 한 줄로 바꾸는 방식을 살펴봅니다.

이 글은 AI 코딩 도구의 ROI를 측정하는 4가지 핵심 지표를 응용해 비엔지니어의 Claude Code 활용 ROI 베이스라인을 측정하는 방법을 다뤘습니다. 오픈 소스 CLI 도구인 ccusage와 Claude Code 자체 기능을 각각 활용해 사용자별 토큰 소비량, 세션·요청당 비용, 작업 유형별 도구 호출 분포, 세션당 메시지 수 베이스라인을 측정했습니다.

이 글은 AI 코딩 도구의 ROI를 측정하는 4가지 핵심 지표를 다뤘습니다. LinearB·Faros AI·DX 등 엔지니어링 측정 플랫폼이 활용하는 지표 중 비용과 품질을 균형 있게 다룬 지표를 선정했습니다. 사용자별 토큰 소비량, 세션·요청당 비용, AI 제안 채택률, 코드 재수정 비율을 차례로 다루며, 각 지표의 의미·한계를 정리했습니다.

Routines는 Claude Code가 정해진 시점이나 이벤트에 따라 Anthropic 클라우드에서 자동으로 작업을 시작하고 결과를 전달하는 기능입니다. 추론이 필요한 반복 작업을 사람 개입 없이 자동으로 처리합니다. 이 글은 Routines의 개념과 동작 방식, n8n과 차이점을 다뤘습니다. 또 DevOps 워크플로용 3가지 실습으로 Routines의 실무 활용법과 운영 시 유의 사항을 살펴봤습니다.

Claude Code의 Checkpoints 기능은 사용자가 프롬프트를 입력할 때마다 관련 작업이 시작되기 전의 파일 상태와 그때까지 대화 내용을 기록으로 남깁니다. 이 기록을 바탕으로 이전 시점의 작업 상태를 복원할 수 있습니다. 이 글은 Checkpoints의 동작 방식, 사용법 실습, 효과적인 Checkpoints 활용법을 다뤘습니다.

GitLab Duo Agent Platform은 여러 AI 에이전트가 협업해 이슈 기획, 코드 리뷰, 보안 분석, CI/CD 점검 등과 같은 엔지니어 업무를 자율적으로 처리하는 플랫폼입니다. 이 글은 GitLab Duo Agent Platform의 특징과 핵심 구성 요소, 파운데이셔널 플로 활용, 에이전트 커스터마이징, 컨텍스트 확장, 세션 모니터링 방법을 다뤘습니다.

이 글은 Claude Code 에이전트에서 세션 캐시(claude-mem)와 외부 저장소(Vault KV·Milvus·Mem0)를 다양한 방식으로 조합한 메모리 계층 구성을 비교했습니다. 약 2,650회 실험으로 토큰 사용량·응답 시간·정확도를 측정하면서 메모리 계층 구성이 에이전트의 응답 비용과 품질에 어떤 영향을 주는지 다뤘습니다.

기술 문서의 독자가 바뀌었습니다. 이제 사람만 문서를 읽지 않고, AI 검색 엔진과 AI 코딩 어시스턴트도 기술 문서를 직접 소비합니다. 이 글은 AI의 문서 소비 메커니즘, AI 시대에 달라져야 할 문서 구조와 작성 원칙, 문서 인프라 점검과 AI 인용 측정 방법을 다뤘습니다.

Claude Code에서 /loop, Hooks, Auto memory를 연결하면 주기적 점검, 정책 강제, 세션 간 학습을 하나의 자동화 루프로 구성할 수 있습니다. 이 루프는 설정 파일 검증과 같은 주기적 확인이 필요한 작업에 적용할 수 있습니다. 이 글은 Hooks, /loop, Auto memory를 조합한 점검 자동화 루프의 구조와 설계 방법, 유의 사항, 한계를 다뤘습니다.