인포그랩은 올해 2월 ‘GitLab 공식 기술 문서 한글판 by 인포그랩(이하 GitLab 공식 기술 문서 한글판)’이라는 신규 서비스를 선보였습니다. 이 서비스는 미국 연구 기업 OpenAI의 생성형 인공지능(AI) 모델 gpt-3.5-turbo-1106을 사용해 GitLab 기술 문서 총 2000여 개를 한글로 자동 번역해 제공하죠. 인포그랩은 사내 프로젝트로 GitLab 공식 기술 문서 한글판을 개발했는데요. 저는 이 프로젝트 리더로 마일스톤 설정, 아이디어 취합, AI 번역 로직 구현을 비롯해 여러 개발, 배포 업무를 수행했습니다.
DevOps 엔지니어인 저는 평소 GItLab CI/CD 파이프라인과 여러 DevOps 도구를 다루는데요. 업무 특성상 GitLab 기술 문서를 많이 봐야 합니다. 영어 원문으로만 읽으면 시간이 오래 걸려 번역 서비스인 DeepL 이나 구글 번역도 활용하는데요. 이 도구들은 내용을 엉뚱하게 번역하거나 엔지니어가 이해할 수 없는 단어로 번역해 불편했습니다. 저와 비슷한 고충을 겪은 분들 계시죠?
저는 이러한 불편을 해소하고자 GitLab 기술 문서 한글판 개발 프로젝트에 참여했습니다. GPT로 GitLab 기술 문서를 자동 번역하도록 프롬프트 설계, AI 번역 로직 구현 등을 진행했는데요. 이 글에서는 GPT로 GitLab 기술 문서를 번역한 배경과 효과적인 프롬프트 작성 요건, ‘번역용 GPT’를 설계한 방법과 GitLab 특수 마크다운 문법을 번역용 GPT에 적용한 방법을 소개하겠습니다.
GPT로 GitLab 공식 기술 문서 번역한 배경
모든 행동에는 이유가 있습니다. 인포그랩이 GPT로 GitLab 공식 기술 문서를 자동 번역한 이유도 당연히 있죠.
1.GitLab 기술 문서 이용 편의 ↑

GitLab은 기술 문서를 한글로 정식 번역해 제공하지 않습니다. 국내 GitLab 사용자 다수는 GitLab 공식 홈페이지에서 기술 문서 원문(영문)을 읽거나, 이를 따로 번역해서 보죠. 영어가 능숙하지 않으면 원문을 빠르고 정확하게 이해하기 어려울 수 있습니다. 이에 국내 많은 GitLab 사용자가 DeepL, 구글 번역 등 번역 서비스로 기술 문서 원문을 번역해 읽는데요. 원문과 한글 번역본을 번갈아 보기도 합니다.
저는 화면 왼쪽에는 기술 문서 원문을, 오른쪽에는 한글 번역본을 두고 읽는데요. 목차와 문맥은 한글 번역본으로 파악하고요. 번역할 수 없는 전문 용어와 코드 블록은 원문을 보며 내용을 확인합니다. 이러한 방식은 시간이 오래 걸리고, 높은 집중력이 필요합니다. 할 일도 많은데 문서를 읽고 이해하는 데 너무 많은 시간을 쓰는 건 아깝죠. 이러한 문제를 개선해 국내 GitLab 사용자의 시간을 절약하고 싶었습니다.
2.GPT ‘저투자 고효율’ 번역 가치

인포그랩은 GitLab 기술 문서를 처음부터 한글 번역본으로 제공하면 이러한 문제를 해결할 걸로 기대했습니다. 한글 번역본이 있으면 사용자가 기술 문서 원문을 복사해 번역 서비스에 일일이 붙여 넣고 번역하지 않아도 되고요. 문서 목차와 핵심 내용을 더 빨리 파악할 수 있죠. 또 ‘원문을 꼭 확인해야 할 문서가 뭔지’ 더 신속하게 발견할 수 있고요. 이로써 기술 문서를 읽는 시간을 아껴 다른 중요한 업무에 집중할 시간을 확보할 수 있습니다.
우리는 이를 구현할 수단으로 GPT에 주목했습니다. 생성형 인공지능(AI)으로 번역을 자동화하면 기술 문서를 한글로 더 빠르게 번역할 수 있고요. 2000개가 넘는 GitLab 기술 문서를 하나도 빠짐없이 한글 번역본으로 제공할 수 있죠. 아울러 GitLab 버전이 업데이트될 때마다 기술 문서의 변경 사항을 더 신속하게 반영할 수 있고요. 참고로 인포그랩은 전부터 GitLab 한글 가이드를 수동으로 제작, 제공했는데요. 모든 GitLab 기술 문서를 한글 번역본으로 수동 제작하려면 한계가 있었습니다.
gpt-3.5-turbo-1106은 요금, 번역 분량 등을 고려했을 때 우리 비용과 품질 기준을 충족했습니다. 이는 GPT 상위 모델보다 10배 더 저렴하지만 번역 결과는 비등비등했죠. 아울러 GPTs 기능을 활용하면 나만의 맞춤형 GPT를 만들 수 있는데요. 여기서 GPT 기능과 역할, 조건 등을 구체적으로 설정하면, 내가 원하는 결과물을 도출하도록 GPT를 유도할 수 있습니다. 예를 들어, ‘Disabled’를 ‘장애가 있는’이 아닌 ‘비활성화’로 번역하거나, 소스 코드를 빼고 번역하도록 GPT를 설계할 수 있고요.
3.사내 OKR 달성

GPT를 활용한 GitLab 기술 문서 번역 자동화는 인포그랩 OKR을 달성하는 핵심 활동이었습니다. 인포그랩은 조직의 목표 달성과 성과 창출을 촉진하고자 OKR 방법론을 도입, 운영하는데요. OKR은 Objective(목표)와 Key Results(핵심 결과)를 각각 의미하죠. 인포그랩은 1년 혹은 분기마다 회사의 목표를 수립합니다. 이에 맞춰 세부 목표도 설정하고요. 목표 달성 여부를 확인하도록 목표별 핵심 결과도 계획하죠.
인포그랩은 “지속 가능한 성장 동력을 갖춰 매년 2배 성장한다”는 목표에 따라 ‘한국에서 GitLab은 인포그랩에서 익힌다’는 세부 목표를 도출했는데요. ‘GitLab 기술 문서의 80% 이상을 자동 번역한다’를 이 목표의 핵심 결과로 설정했습니다. GPT로 GitLab 기술 문서를 자동 번역하면 이러한 핵심 결과를 충족할 수 있었습니다. 나아가 ‘한국에서 GitLab은 인포그랩에서 익힌다’라는 세부 목표도 달성해 회사의 지속 가능한 성장 동력에 기여할 수 있고요.
효과적인 프롬프트 작성 요건

GPT로 GitLab 공식 기술 문서 번역을 자동화하기에 앞서, 저는 프롬프트 엔지니어링부터 공부했습니다. GPT에 프롬프트로 구체적인 작업 수행 방식을 지시해야 GitLab 기술 문서를 번역할 수 있으니까요. 저는 Udemy에서 프롬프트 엔지니어링 강의를 듣고, 샘플을 만들어보며 프롬프트 작성 방법을 연구했습니다. 프롬프트를 올바르게 작성해야 GPT가 오류를 덜 일으키고, 정확한 답변을 제공할 수 있는데요. 여러 강의와 매체 자료를 조사하면서 효과적인 프롬프트 작성 요건으로 아래 내용을 배웠습니다.
- Examples: 사용자가 기대하는 결과의 예시를 적습니다. GPT는 간단한 예시만 봐도 복잡한 작업을 일관성 있게 처리합니다.
- Direction: 작업 순서나 규칙을 상세하게 적습니다. 절차가 있는 작업을 ‘1번’, ‘2번’으로 번호를 매겨 지시하면 GPT가 잘 수행합니다.
- Parameters: 생성형 AI에는 여러 파라미터를 설정할 수 있습니다. 파라미터는 ‘같은 질문에 다양하게 답변할지(temperature)’, ‘얼마만큼 확률이 높은 답변을 제시할지(top-p)’ 등입니다.
- Format: 답변의 형식을 지정합니다. Markdown, JSON, 혹은 CSV 형식을 원하면 그렇게 만들어달라고 요구하세요.
- Chaining: 프롬프트나 생성형 AI를 연결해서 사용합니다. ChatGPT에 이미지 생성용 프롬프트를 요청하고, 이미지는 Midjourney에서 얻을 수 있습니다. 각 영역에 특화된 AI를 엮어서 사용하세요.