본문으로 건너뛰기
배경 이미지

하이라이트

SRE 3.0 - AI가 바꾸는 장애 대응·신뢰성·운영 패러다임

한때 '디지털 소방관'으로 불리던 SRE가 AI의 발전으로 큰 변화를 맞이했습니다. 이제 AI는 전통적인 시스템 신뢰성 정의를 바꾸고, AI·예측 기반 운영으로 SRE가 장애에 선제적으로 대응하도록 돕습니다. 이 글은 AI 시대의 신뢰성 개념 변화와 주요 AI 신뢰성 사례, AI 기반 SRE 업무의 변화와 AI 한계, 향후 발전 방안을 다뤘습니다.

AISRE자동화

자세히 보기

"SRE" 태그와 연관된 2개의 게시물이 있습니다.

모든 태그 보기
SRE 3.0 - AI가 바꾸는 장애 대응·신뢰성·운영 패러다임SRE 3.0 - AI가 바꾸는 장애 대응·신뢰성·운영 패러다임

IT 업계에서 SRE(Site Reliability Engineer, 사이트 신뢰성 엔지니어)는 한때 ‘새벽 3시에 전화받는 사람’으로 불렸습니다. 시스템 장애가 발생하면 가장 먼저 호출돼 문제를 해결해야 했기 때문이죠.

Fabbro
Fabbro | Software Engineer
GitLab DR, 재해복구 시스템 만들기GitLab DR, 재해복구 시스템 만들기

GitLab 에는 중요한 비즈니스 자산 데이터가 저장되어 있습니다. 제일 중요한 소스 코드를 포함해서 말이죠.

GitLab DR (Disaster Recovery). 즉 재해 복구는 자연재해와 사람에 의한 재난! 에 의해 GitLab 을 사용할 수 없는 경우에 복구 할 수 있는 프로세스에 따라 연속성을 갖고 GitLab을 사용 할 수 있도록 해주는 재해 복구 기능을 가지고 있습니다.

GitLab 엔터프라이즈 버전인 Premium 이상에서 사용 가능합니다. 보통의 엔터프라이즈 회사들은 이 기능 때문에 라이센스를 구입 하게 됩니다. 자체적으로 DR을 구축하는 비용 vs GitLab DR(Geo) 비용 따져보면 싸기 때문이겠지요?

GitLab 은 Geo 노드를 별도로 만들어서 재해 상황에 조치 할 수 있습니다. 재해 복구 솔루션을 설정하려면 투자가 필요합니다. 아직 GitLab 은 모든 것들을 복제하지 않습니다. 시스템 관리자는 Geo로 복제가 자동으로 되는 부분과 아닌 부분이어서 백업이 필요한 내용을 알고 있어야 합니다. 그럼 지금 부터 GitLab DR에 대해 알아볼까요?

Dexter
Dexter | SAFe & DevOps Consultant
인포레터에서 최신 DevOps 트렌드를 격주로 만나보세요!