"DevOps" 태그와 연관된 60개의 게시물이 있습니다.

오늘날 많은 팀이 인프라를 코드로 관리하기 위해 Infrastructure as Code(IaC) 도구를 사용합니다. 이 가운데 Terraform과 AWS CloudFormation 같은 도구는 강력하고 유용한 기능을 제공하죠. 그러나 특정 도구의 전용 언어로 인프라를 구성하는 과정은 번거로울 때가 많은데요. 최근 나온 ‘Pulumi’라는 IaC 도구는 인프라를 편리하게 구성하고 관리하는 데 도움이 되는 기능을 다수 지원합니다. 이 글에서는 Pulumi의 특징을 알아보고, 이 도구로 AWS의 스토리지 서비스인 ‘S3’를 생성하는 방법을 살펴보겠습니다.

2023.10.26

#IaC

#DevOps

#Pulumi

John | DevOps Engineer

인포그랩 DevOps 엔지니어는 어떻게 온보딩할까

안녕하세요? 저는 지난 5월 인포그랩에 합류하여 DevOps 엔지니어로 일하고 있는 Chad입니다. 새로운 조직에 적응하는 일은 쉽지 않습니다. 업무에서 자기 능력을 100% 발휘하려면 예상보다 더 많은 시간이 필요할지 모릅니다.

조직에서는 새로운 직원이나 사용자가 조직 또는 서비스에 적응하고, 직원이 업무를 원활히 수행하도록 돕기 위해 온보딩 프로그램을 운영하는데요. 인포그랩에서도 신규 입사자를 대상으로 3개월 동안 온보딩 프로그램을 진행합니다.

인포그랩 기술 블로그 독자 가운데에는 기업 문화와 DevOps 엔지니어의 업무 수행 방식을 궁금해하는 분들도 많은데요. 이 글에서는 지난 3개월 동안 인포그랩 DevOps 엔지니어로서 제 온보딩 과정을 회고하고요. 인포그랩의 온보딩 방식과 DevOps 엔지니어로서 온보딩 하며 제가 느끼고 변화한 점을 공유하고자 합니다.

2023.10.23

Chad | DevOps Engineer

GitLab으로 Value Stream Management 구성하기

복잡한 현대 소프트웨어 개발 환경에서 Value Stream(가치 흐름)을 추적, 관리하려면 상당한 시간과 노력이 들어갑니다. GitLab을 활용하면 이 작업을 효율적으로 수행할 수 있습니다. GitLab은 전체 DevSecOps 플랫폼을 단일 애플리케이션으로 제공합니다. 이에 엔드투엔드 가시성에 필요한 모든 데이터를 GitLab에서 편리하게 볼 수 있습니다. 아울러 GitLab은 향상된 가치 흐름 관련 기능을 지원합니다. 이 기능을 활용하면 더 쉽고 빠르게 Value Stream Management 환경을 구성할 수 있습니다.

GitLab에서는 다양한 대시보드와 세분화된 데이터를 제공합니다. 이로써 고객은 가치 흐름을 다각도로 자세하게 추적하고 관리할 수 있습니다. 이는 소프트웨어 공급을 최적화하고, 고객에게 더 빠르게 가치를 제공하는 데 도움이 됩니다. 이 글에서는 소프트웨어 개발 라이프사이클 전반에 걸쳐 비즈니스 가치를 파악하도록 GitLab의 Value Stream Management 기능을 활용하는 방법을 알아보겠습니다.

2023.09.20

#GitLab

#DevOps

#Value Stream

Rei | DevOps Engineer

GitLab CI/CD와 Jenkins는 무엇이 다를까?

현대 소프트웨어 개발 환경에서는 빠른 속도와 높은 품질을 동시에 달성하는 것이 매우 중요합니다. 이를 위해 DevOps 문화와 CI/CD(Continuous Integration/Continuous Deployment) 접근 방식이 강조되고 있고요. 오늘날 개발 속도를 높여 고품질 소프트웨어를 만드는 데 도움이 되는 다양한 도구가 개발되고 있습니다. 그중에서도 GitLab CI/CD와 Jenkins는 CI/CD 파이프라인을 구축하고 관리하는 데 널리 사용되는 도구인데요. 이는 개발팀과 운영팀의 협업 프로세스를 자동화하여 생산성을 높입니다.

2023.08.10

Jeff | DevOps Engineer

소프트웨어 개발에서 지속적 테스트

소프트웨어 테스트는 개발한 소프트웨어가 요구사항을 잘 반영하였는지, 기능이 정상적으로 작동하는지, 안정적인지 등을 확인하여 품질을 유지하고 결함을 확인하는 활동으로 개발 라이프사이클에서 중요한 과정 중 하나입니다. 개발 초기에 버그와 결함을 감지할수록 개발 시간 단축, 비용 최적화, 품질 향상 등의 이점이 있지만 늦게 발견할수록 잠재적 부채가 증가하여 품질이 떨어지고 위험도가 증가하게 됩니다. 따라서 개발 초기부터 주기적으로 테스트 오류와 결함을 줄이는 것이 장기적으로 중요합니다. 이 글에서는 소프트웨어 테스트를 자동화하고 주기적으로 실행하는 지속적 테스트를 알아보겠습니다.

2023.07.27

#DevOps

#CI/CD

Rei | DevOps Engineer

DevOps 쉽고 빠르게 구현하는 노코드, 로코드 도구

이 글에서는 DevOps를 쉽고 빠르게 구현하도록 돕는 노코드, 로코드(no code, low code) 도구 4가지를 다뤘습니다. DevOps 자동화 플랫폼 ‘Humalect’, CI/CD(지속적 통합/지속적 배포) 파이프라인 관리 플랫폼 ‘R2Devops Platform’, 인포그랩의 CI/CD 파이프라인 에디터 ‘Plumber’, ****AWS 배포 플랫폼 ‘OpsFlow’가 그 주인공인데요. 각 도구는 DevOps 프로세스를 간소화하고, CI/CD 템플릿을 바로 쓸 수 있도록 제공하며, 파이프라인을 빠르게 실행하도록 돕고, AWS로 간편하게 배포하도록 지원합니다. 이는 노코드, 로코드에 기반했기에 마우스를 클릭하거나 드래그 앤드 드롭하며 쉽게 이용할 수 있죠. 지금부터 각 도구의 기능과 특징을 하나하나 살펴보겠습니다.

2023.07.27

#노코드

#로코드

#DevOps

Grace | Technical Writer

노코드, 로코드가 DevOps에 미치는 영향

최근 몇 년 새 IT 업계에서 급속도로 떠오른 키워드가 하나 있습니다. 바로 ‘노코드, 로코드(no code, low code)’인데요. 이는 코딩을 최소화하고, 간소화한 것이죠. 노코드, 로코드 도구를 활용하면 코딩할 줄 모르는 비개발자도 소프트웨어를 간단히 개발할 수 있습니다. DevOps 업계에서도 ‘노코드, 로코드를 DevOps에 적용하는 방안’을 모색하고 있는데요. 그 결과물은 노코드, 로코드 기반의 DevOps 플랫폼, CI/CD 파이프라인 에디터 등 서비스로 나오기도 합니다. DevOps 업계는 노코드, 로코드의 어떤 점에 주목해 이를 DevOps에 접목하려는 걸까요? 노코드, 로코드는 DevOps가 발전하는 데 도움이 될 수 있을까요? 이 글에서는 DevOps 업계가 노코드, 로코드를 주목하는 배경과 노코드, 로코드가 DevOps에 미치는 영향, 그리고 둘을 결합할 때 일어날 수 있는 문제를 함께 살펴보려고 합니다.

2023.07.26

#노코드

#로코드

#DevOps

Fabbro | Software Engineer

ChatGPT 잠재력 활용해 DevOps 워크플로 개선하기

OpenAI에서 개발한 ChatGPT가 출시된 지 반년이 조금 지났습니다. 반년 동안 ChatGPT를 필두로 여러 인공지능(AI) 모델이 하루가 멀다하고 등장하는 중이며, 다양한 산업에서 파동을 일으키고 있습니다. 우리는 이를 견뎌내기 위해 빠르게 대처하고 있지만, 마치 빠르게 달리는 열차를 쫓는 느낌을 받습니다.

이렇게 끊임없이 학습과 적응이 필요한 상황에서, 생산성 향상을 위해 많은 사람이 ChatGPT를 사용하고 있습니다. 마케팅 팀은 ChatGPT로 새로운 인사이트를 얻고, 고객 서비스(CS) 팀은 ChatGPT를 이용하여 고객 질문에 답변을 더욱 빠르게 제공할 수 있습니다.

DevOps 엔지니어도 ChatGPT를 업무에 활용할 줄 알아야 합니다. 엔지니어는 그 누구보다도 발빠르게 새로운 기술을 학습하고 변화하는 환경에 적응해야 하기 때문입니다. ChatGPT가 바로 그 ‘새로운 기술’입니다. DevOps 엔지니어가 ChatGPT로 효율적이고, 생산적인 작업 흐름을 만들려면 어떻게 해야 할까요?

2023.06.27

#ChatGPT

#DevOps

#자동화

Chad | DevOps Engineer

DevOps 측면에서 Observability와 Monitoring 의미

거의 모든 최신 소프트웨어 인프라에는 필수적으로 모니터링 또는 로깅이 존재합니다. 1980년대에 Unix 시스템에 syslog가 출시되면서 ‘시스템 내부에서 무슨 일이 일어나고 있는지 감사하고 이해할 수 있다’는 가치와 이러한 메커니즘 분리의 아키텍처적 중요성이 모두 확립되었습니다.

그러나 시스템 동작의 가시성의 가치와 중요성에도 불구하고 모니터링과 로깅은 자주 우선순위가 뒤로 밀릴 때가 많습니다. 거기다 중요한 정보를 수집하거나 로그를 분석하지 않고 로그를 내보내는 시스템의 사례는 무수히 많습니다. 또는 레거시 모니터링 시스템이 10년 전에 설치되어 최신 표준으로 업데이트되지 않은 인프라도 있습니다.

최근 운영 환경의 변화로 인해 Observability라는 개념이 등장했습니다. 엔지니어가 정적 측정값을 사용해 애플리케이션의 성능 자체에 가정을 세우는 대신, Observability로 애플리케이션 동작의 전체 그림을 볼 수 있습니다. 아울러 사용자가 성능을 어떻게 인식하는지를 알 수 있습니다.

Observability 란?

Observability의 가치를 이해하려면 먼저 ‘모니터링이 무엇인지’, ‘정보와 콘텍스트 측면에서 모니터링이 제공하는 것과 제공하지 않는 것이 무엇인지’에 대해 이해하는 게 도움됩니다.

모니터링의 핵심은 특정 시스템 또는 소프트웨어 스택의 다양한 값과 출력의 측정 결과를 제시하는 것입니다. 측정의 일반적인 메트릭은 CPU 사용량, RAM 사용량, 응답 시간 또는 Latency 등입니다. 기존 로깅 시스템도 이와 유사하며, 시스템 작동 중에 발생한 이벤트의 정적 정보를 제공합니다.

모니터링은 시스템의 더 큰 문제를 나타낼 수 있는 제한된 콘텍스트 측정값을 제공합니다. 기존 모니터링 도구를 사용하여 집계 및 상관관계를 파악할 수 있지만, 전체적인 관점을 제공하려면 일반적으로 수동 구성 및 튜닝이 필요합니다. 업계가 발전함에 따라 효과적인 모니터링의 개념은 CPU, RAM과 같은 정적인 측정값을 넘어서는 수준으로 발전했습니다. 유명한 사이트 신뢰성 엔지니어링(Site Reliability Engineering·SRE) 책에서 Google은 "Golden Signals"로 알려진 네 가지 주요 지표에 집중해야 한다고 강조합니다.

Latency: 요청을 처리하는 데 걸리는 시간
Traffic: 전체 네트워크를 측정한 것
Errors: 요청이 실패하는 비율
Saturation: 리소스 사용량을 전체의 일부분으로 측정하는 것, 일반적으로 제한된 리소스에 중점을 둠.

이러한 메트릭은 전반적인 시스템 성능을 더 잘 파악하는 데 도움이 됩니다. 완전한 모니터링 시스템을 설계, 구축, 통합, 구성하려면 적지 않은 엔지니어링 투자가 필요합니다. 장애 상황을 측정하려면 상당한 노력이 필요합니다. 간단한 상황에도 올바른 상관관계를 정의하고 연결하는 데는 많은 시간이 소요될 수 있습니다.

이러한 데이터와 지표를 기반으로 시스템의 내부 상태를 파악하고 추론하는 능력이 바로 Observability입니다. Observability로 빠른 문제 파악, 해결, 의사 결정에 도움을 줘 시스템 안전성이나 확장성에 기여할 수 있습니다. 또한 CI/CD 실행 중에 중요한 성능 피드백을 제공하여 개발자에게 코드 운영 피드백을 제공합니다. 이로써 소프트웨어 개발 수명 주기(SDLC)를 더 확장할 수 있습니다. 궁극적으로 Observability는 더 전체적인 디버깅과 시스템 이해를 지원합니다. Observability가 중요한 '이유'를 더 자세히 알아보기 위해 다음 섹션에서 모니터링만으로는 부족할 경우를 소개합니다.

Observability가 중요한 이유

Observability에 집중하면, 가동 중단을 줄이고 평균 해결 시간(MTTR)을 단축할 수 있습니다. 이로써 애플리케이션 성능을 개선하고 고객 경험을 개선할 수 있습니다. 모니터링이 같은 이점을 제공하는 것처럼 보일 수 있지만, 다음과 같은 사례가 있을 수 있습니다.

Observability는 비기술 분야 이해관계자 및 비즈니스 부서에도 중요합니다. 기술이 주요 수익 사일로와 더욱 밀접하게 얽히면서 소프트웨어 인프라 KPI는 비즈니스 KPI가 되었습니다. Observability는 KPI 성과에 더 나은 인사이트를 제공할 뿐만 아니라 여러 팀용 셀프 서비스 옵션을 제공할 수 있습니다.

한 엔지니어링 조직이 회계 부서에서 이메일을 받았습니다. '클라우드 서비스 청구서가 너무 비싸서 CFO가 이를 알아차릴 정도다.' DevOps 엔지니어는 모니터링 시스템을 면밀히 살펴봤지만 메모리, CPU, 디스크 I/O 등 시스템의 모든 부분이 지속적으로 정상으로 보고되었습니다. 알고 보니 근본 원인은 또 다른 'Unknown' 이벤트였습니다. CI/CD 파이프라인의 DNS 지연으로 인해 빌드 실패율이 높아진 것입니다. 더 많이 빌드를 함으로써 많은 클라우드 리소스를 소모했습니다. 그러나 이러한 영향은 모니터링 시스템에 반영될 만큼 오래 지속되지 않았습니다. Observability 도구를 추가하고 환경의 모든 이벤트 유형을 수집함으로써 운영팀은 문제의 원인을 정확히 파악하고 문제를 해결할 수 있었습니다. 기존 모니터링 시스템에서는 조직이 DNS 지연 문제를 사전에 알고 있어야 했습니다.

최신 소프트웨어와 애플리케이션은 우수한 사용자 경험(UX)을 제공하는 데 크게 의존합니다. 이전 사례에서 알 수 있듯이, 정적 메트릭을 모니터링한다고 해서 UX 또는 시스템 성능의 완전한 이야기를 항상 알 수 있는 것은 아닙니다. 겉보기에 정상적으로 보이는 지표 대시보드 뒤에 심각한 문제가 숨어 있을 수 있습니다.

Observability 메트릭

Observability 도구를 구현하기로 결정한 조직은, 다음 단계로 Observability 의 핵심 목표와 이를 스택 전체에서 가장 잘 구현할 방법을 식별할 수 있습니다. 다은 Observability의 세가지 기본 요소로 시작하는 것이 좋습니다.

Logs: 정보 및 이벤트
Metrics: 특정 메트릭 및 성능 데이터의 측정
Tracing: 런타임 동안 엔드투엔드 성능 요청

이 작업이 부담스러울 수 있습니다. 그러나 OpenTelemetry 같은 프로젝트는 Logs, Metrics, Tracing의 광범위한 표준 수용을 촉진합니다. 이로써 Observability를 구현하는 조직이 OpenTelemetry 표준에 기반한 도구를 사용해 더 일관된 생태계를 구축하고, 가치 실현 시간을 단축하도록 돕고 있습니다

추가적인 Observability 데이터 및 요소는 다음과 같습니다.

Error 추적: 집계가 포함된 더욱 세분화된 Log
지속적인 프로파일링: 세분화된 코드 성능 평가
실제 사용자 모니터링(RUM): 실제 사용자의 관점에서 애플리케이션 성능 이해

이러한 요소를 살펴보면 중심 주제가 드러나기 시작합니다. 최신 분산 시스템에서는 더 이상 시간과 공간의 작은 조각을 보는 것만으로는 충분하지 않습니다. 전체적인 10,000 피트 뷰가 필요합니다. 애플리케이션 성능의 이해는 실제 고객이 경험하는 대로 샘플링한 다음, 소프트웨어와 상호 작용할 때 전체 성능과 동작을 추가로 모니터링하는 것에서 시작됩니다.

기존의 애플리케이션 모니터링을 넘어 Observability는 모든 엔지니어링 조직의 운영 환경을 개선하는 데 도움이 될 수 있습니다. 잘 만들어진 알림 및 인시던트 관리 프로그램은 대개 실제 중단을 통해 얻은 혹독한 교훈에서 비롯됩니다. 카오스 엔지니어링을 구현하면 결과가 알려진 통제된 환경에서 실제 장애가 발생하는 동안 Observability 플랫폼을 테스트할 수 있습니다. 프로덕션 워크로드뿐만 아니라 CI/CD 파이프라인, 공급망, DNS 등 'Unknown'이 숨어 있을 수 있는 시스템에 카오스 엔지니어링을 도입하면 운영 기반에서 상당한 이점을 얻을 수 있습니다.

Observability의 중요성

Observability는 데브옵스뿐만 아니라 조직 전체에 매우 중요합니다. Observability는 레거시 모니터링 솔루션의 정적 데이터를 대체하여 애플리케이션 인프라의 전체 스펙트럼을 보도록 지원합니다.

DevOps 팀은 이해관계자와 협력하여 조직 전체에 도움이 되는 방식으로 Observability 메트릭을 공유하고 구현을 개선하는 조치를 취해야 합니다. 앱 계측의 이점을 학습하고 개발 팀에 전파하면 Observability를 더욱 효과적으로 만들 수 있습니다. 또한 DevOps 팀은 프로덕션 인시던트의 근본 원인을 더 빨리 파악할 수 있으며, 잘 계측된 애플리케이션 코드는 인프라 문제와 쉽게 구분할 수 있습니다. 마지막으로, CI/CD 파이프라인을 따라 Observability가 달라집니다. 잠재적인 서비스 수준 목표(SLO) 델타를 프로덕션에 도달하기 전에 발견할 수 있습니다.

애플리케이션 성능과 비즈니스 성과에 의미 있는 개선을 제공하고자 하는 DevOps 팀은 두 가지를 모두 제공하는 방법으로 Observability를 고려할 수 있습니다.