클라우드 운영

2021. 6. 7. 12:25기업분석

코드 관리‧배포 및 모니터링으로 고객 클라우드 운영 돕는다

클루커스는 마이크로소프트(MS)의 클라우드 서비스 ‘애저(Azure)’에 대한 운영‧관리 서비스를 제공하고 있다. 클루커스에서 제안하는 효율적인 클라우드 운영 방안으로는 코드 관리‧배포 자동화와 모니터링, 랜딩존을 구성해야 한다는 것 등 3가지다.

클루커스는 코드를 쉽게 관리‧배포하기 위해 ‘테라폼(Terraform)’이라는 오픈소스를 제공한다. ‘테라폼’은 하시코프(Hashicorp)에서 오픈소스로 개발한 ‘코드형 인프라(IaC, Infrastructure as Code)’를 위한 도구로, 인프라 자동화를 목표로 설계됐다. 서버 등과 같은 기본적인 인프라 배포에 최적화돼 있다. 이 솔루션을 통해 클라우드를 운영할 때 고객이 고민하는 서버 관리를 쉽게 할 수 있다.

한 예로 클라우드를 운영하는 고객이 애플리케이션 개발과 운영에 필요한 인프라를 코드로 작성해 자동으로 생성·배치·관리할 수 있다. 인프라에 대한 정보가 담긴 코드들을 하나의 스크립트에 작성하면, 테라폼과 같은 IaC 툴이 스크립트에 맞춰 CSP의 클라우드 서비스와 연동해 인프라를 생성한다. 고객이 클라우드 콘솔에 접속해 하나하나 인프라를 생성하는 작업을 없애줄 수 있다는 얘기다. 이를 통해 개발에 필요한 인프라를 팀에 보다 빠르고 신속하게 제공해 개발팀과 운영팀의 운영 효율성을 높일 수 있다.

클루커스의 ‘클루옵스 모니터링 서비스’ (출처: 클루커스)


다음은 클라우드 환경에 특화된 모니터링 서비스를 사용해야 한다는 것이다. 클루커스의 경우 ‘클루옵스(ClooOps)’라는 솔루션으로 모니터링 서비스를 제공하고 있다. 클루커스는 그라파나(Grafana)’라는 오픈소스로 이뤄진 모니터링 서비스를 제공하고 있다. 흔히 CSP에서 제공하는 모니터링 솔루션을 사용하고 있지만, 클루커스는 ‘그라파나’라는 오픈소스를 사용하고 있다.

이에 대해 이강수 클루커스 부사장은 “MS에서 제공하는 포털을 통해 모니터링을 하게 되면, 실시간 데이터의 사이즈가 크기 때문에 지연시간이 존재한다. 실제로 CPU 리소스, 메모리 리소스 등을 모니터링하더라도 그걸 보고 데이터를 판단하기까지 적게는 몇 십초에서 5분정도가 소요된다”면서, “하지만 클루커스가 제공하는 모니터링 서비스는 그라파나를 기반으로 하고 있다. 이는 리소스에 대한 정보를 API로 쉽게 불러올 수 있어 실시간 데이터를 확인하는데 지연이 발생하지 않는다”고 설명했다.

클루커스는 그라파나를 사용하면서, 모니터링하고자 하는 서버에 ‘텔레그라프’라는 모니터링 에이전트를 설치한다. 이 에이전트는 CPU, 메모리 등 고객이 지정한 부분을 모니터링하며, 리소스에 대한 정보를 서버에 보내게 된다. 서버는 리소스에 대한 데이터를 받은 후 대시보드를 구성해 모니터링 에이전트가 설치된 서버의 CPU, 메모리 등에 대한 정보가 담긴 화면을 그래픽화해 보여주게 된다. 클루커스는 이 같이 오픈소스를 활용해 모니터링을 함으로써 고객이 운영하는 곳 혹은 리소스 사용량을 확인하고자 하는 곳에 설치해 고객이 원하는 종류로 설치해 서비스를 제공하고 있다.

한편, 클루커스는 효율적인 클라우드 운영 방안을 고민하는 기업들을 위해 ‘랜딩존’ 설계에도 집중하고 있다.

박항서 클루커스 컨설턴트는 “집을 처음 지을 때 자재, 높이, 방의 개수, 크기 등 기본 설정을 하듯, 클라우드에도 이러한 기초 설정 작업이 필요한데 이를 랜딩존 설계라고 한다”면서, “크게 운영 정책, 보안 정책, 로그 관리 등을 설정할 수 있다. 구체적으로는 계정 권한 관리, 보안 관리, 운영 정책, 블루 프린트, 로그관리 등이 있다. 무엇보다 국제 표준에 맞는 정책에 대한 모음집을 받을 수 있고, 이러한 정책들이 제대로 지켜지고 있는지 자동으로 점검된다. 클루커스에서 제공하는 ‘랜딩존’을 선택할 경우, 한 달 이내 구성이 가능하다”고 설명했다.

 


[인터뷰] “3가지 차별점 토대로 고객 운영 지원 선봉장 될 것”

클루커스 이강수 부사장(좌측), 박항서 컨설턴트


Q. 효율적인 클라우드 운영을 위해 갖춰야 할 것은 무엇인지.
A. 클라우드를 효율적으로 운영하기 위해서는 구축단계에서부터 클라우드 운영을 염두에 두고 정확한 평가가 이뤄져야 하며, 모니터링을 반드시 구축해야 한다. 온프레미스 환경에서 사용되던 인프라의 크기, 성능 분석 등을 통해 클라우드 환경에서 원활히 운영되도록 크기와 성능을 맞춰야 한다. 이렇게 제대로 된 사이징이 이뤄지면 어느 정도 비용이 최적화되기 시작하지만, 여기에 클라우드 환경에 적합한 모니터링을 구성해야 한다.

실제로 한 곳에서는 8대 규모를 생각하고 클라우드를 운영했다. 하지만 모니터링을 통해 2대만 필요하고, 6대는 특정 이벤트시 확장하면 된다는 것을 알게 됐다. 그렇게 비용을 최적화 하게 된다. 보통 우리 고객들은 주로 모니터링 구축하고 2주 뒤에 큰 폭으로 비용을 절감할 수 있으며 이 비용절감은 계속된다.

아울러 랜딩존도 설계해야 한다. 랜딩존을 구성한다는 것은 하나의 기초 샘플이 되는 기본 거푸집을 제공받는 것이다. 단순히 이렇게 끝나는 것이 아닌, 기업 자체 환경과 비즈니스를 대입시켜, 최적화된 아키텍처를 만드는 것이다. 한 사례로 랜딩존에는 네트워크 관리에 대한 내용도 설계된다. 네트워크 관리가 정말 잘 설계된 랜딩존의 경우 온프레미스에서 수행하던 네트워크 보안 정책을 비슷하게 만들 수 있다.

Q. 타 클라우드 업체와의 차별점은 무엇인지.
A. 우리가 생각하는 차별 요소는 3가지다. 먼저, 애저 영역에서는 ‘애저 익스퍼트 인증’부터 ‘리눅스 및 오픈소스 DB 마이그레이션’ 고급 전문자격 등 MS에게 부여받은 인증의 수가 세계적인 톱 레벨의 회사와 동일한 수준이다. 그만큼 우리가 보유한 애저 기술력이 뛰어나다는 얘기다.

다음으로는 운영‧관리 서비스를 제공하는 데 있어서 MSP 전문 팀을 보유하고 있다는 점이다. 꽤 많은 기업들이 운영‧관리 서비스를 제공한다고 하지만, 실제로 보면 별도로 구성이 돼있지 않은 곳도 많고, 컨설턴트가 운영‧관리를 담당하는 곳도 많다. 하지만 저희는 전문 MSP 팀을 구성했다. 또 그 팀원들은 애저 인증 자격증을 여러 개 보유하고 있다. 마지막으로는 국내에서 애저 레퍼런스를 가장 많이 보유하고 있다는 점이다. 이 같은 3가지 차별점을 토대로 고객의 프로세스와 우리의 프로세스를 일치시켜, 고객에게 어울리고 잘 맞는 서비스를 계속 제공해 나갈 것이다.

Q. 효율적으로 클라우드를 운영하고 있는 기업의 사례를 소개해달라.
A. 효율적으로 클라우드를 운영하고 있는 고객 중 대표사례로 A사가 있다. A사는 온프레미스에서 시작했다가 리호스트라고 하는 방법으로 클라우드로 VM을 그대로 옮겼다. 그 다음 PaaS를 사용한다는 목표로 랜딩존을 구성했고, 모니터링 서비스도 사용하고 있다. 최근에는 PaaS를 통해 빅데이터 분석 PoC도 수행했다.

A사가 잘 운영하고 있다고 판단한 근거는 바로 2종의 모니터링을 사용해 비용을 절감시키고 있기 때문이다. 모니터링과 관련해 고객사 담당자가 먼저 우리에게 제안했다. 보통 클라우드 모니터링은 운영과 서비스 사이에서 사용되는 리소스에 대한 모니터링이 주를 이룬다. 하지만 A사는 클라우드 플랫폼(VM, CPU, 서비스의 활성화 유무)에 대한 모니터링을 진행했고, 이후 OS 로그, 리눅스 로그 등 OS 리소스에 대한 모니터링도 진행했다.

독특하게도 A사는 오픈소스보다는 MS 애저에서 제공하는 모니터링 툴을 사용하고 싶다고 제안했다. 이에 클루커스에서 ‘커스텀 모니터링’이라고 하는 맞춤형 모니터링을 제공했다. 현재 모니터링에 대한 결과 알람도 제공하고 있다.

'기업분석' 카테고리의 다른 글

SK C&C, 'MS 클라우드 애저' 공인자격 인증 획득  (0) 2021.07.19
클라우드 운영  (0) 2021.06.07
클라우드 운영  (0) 2021.06.07
클라우드 이용 모음  (0) 2021.06.07