인포그랩은 지난 4월 ‘Mattermost 공식 기술 문서 한글판 by 인포그랩(이하 Mattermost 공식 기술 문서 한글판)’이라는 서비스를 선보였는데요. 이는 OpenAI의 생성형 인공지능(AI) 모델 GPT로 Mattermost 기술 문서 총 600개를 한글로 자동 번역해 제공합니다. Mattermost는 미 항공우주국(NASA)과 삼성전자가 사용하는 글로벌 기업용 메신저인데요. 인포그랩은 Mattermost의 공식 리셀러로, 국내 사용자에게 이 서비스를 널리 알리고 편리한 이용을 돕고자 Mattermost 공식 기술 문서 한글판을 개발했습니다.
저는 이 서비스의 개발 과정에서 AI 번역 로직 구현과 RST(reStructuredText) 문법 교정 스크립트 개발 업무를 수행했는데요. 이번 Mattermost 기술 문서 번역 작업은 RST 형식의 기술 문서를 가공하는 데 중점을 뒀습니다. 이 작업은 지난 프로젝트인 ‘GitLab 공식 기술 문서 한글판 by 인포그랩(이하 GitLab 공식 기술 문서 한글판)’에 이어 진행 했는데요. 이제 인포그랩 내부에 기술 문서 번역 자동화 워크플로가 정착했고요. AI 번역 작업에 요령이 생겨 이번에는 RST 문법을 정확히 이해하고, 효과적으로 변환하는 데 주력했습니다.
RST 형식의 기술 문서를 GPT로 번역하는 과정은 녹록지 않았는데요. 오늘 그 이유를 설명해 드리려 합니다. 지금부터 제가 Mattermost 기술 문서를 번역하며 겪은 시행착오와 이를 해결한 과정을 자세히 말씀드리겠습니다(Mattermost 공식 기술 문서 한글판의 개발 배경은 'Mattermost 공식 기술 문서 한글판 by 인포그랩’을 소개합니다'를 봐주시면 좋겠습니다. 😊).
번역용 프롬프트 작성했지만
저는 GPT에 입력할 기술 문서 번역용 프롬프트를 작성하기 위해 Mattermost 기술 문서 구조를 먼저 파악했습니다. Mattermost 기술 문서는 Markdown 형식이 아닌 RST 형식인데요. 저는 ‘RST 형식이라고 Markdown 형식과 얼마나 다르겠어’라고 생각했고요. 이에 GitLab 기술 문서를 GPT로 번역할 때 사용한 프롬프트를 Mattermost 기술 문서 번역용으로 수정, GPT에 적용했습니다. 프롬프트에는 역할, 지켜야 할 규칙, 예시를 입력했고요. 관련 응답만 생성하도록 설정했죠.
그 결과..! 멀쩡하게 진행되던 Mattermost docs site의 빌드가 실패하고 말았습니다. 😢