데이터는 VMware 고객이 수행하는 모든 작업의 핵심이다. 데이터는 현대 기업의 생명선과 같으며, 여기서 가치를 추출하는 능력에 따라 기업의 성공 여부가 결정되는 경우가 갈수록 증가하고 있다. 즉, 클라우드 인프라의 가치는 단순한 데이터 저장을 넘어 데이터 관리, 공유, 분석으로 확장되고 있다.
오늘날 고객은 여러 유형의 인프라에 대응하면서 사일로 현상을 겪을 수 있다. 사일로는 물리적 인프라뿐만 아니라 운영 모델, 보안 및 규정 준수에서도 발생하고, 이러한 현상에서 애플리케이션을 실행하는 것은 복잡하고 비용이 많이 들며 위험하다. 이와 같은 상태를 ‘클라우드 카오스’라고 한다. VMware의 주요 전략은 운영을 위한 공통 추상화 계층과 모든 유형의 클라우드와 애플리케이션을 실행할 수 있는 공통 플랫폼을 제공하여 ‘클라우드 스마트’로 전환하는 것이다.
이러한 공통 추상화는 고객의 디지털 전환의 중심에 있는 데이터와 관련되어 있다.
VMware는 이미 스토리지, 스토리지 관리, 데이터 보호를 위한 다양한 멀티 클라우드 옵션을 제공하고 있다. 하지만 데이터가 소비, 관리되는 방식은 크게 변화하고 있다. 애플리케이션(및 개발자)은 POSIX 파일 시스템 대신 SQL API를 사용하는 것과 같이 더 높은 수준의 추상화를 활용하여 데이터를 소비한다. 대부분의 최신 애플리케이션은 데이터 지속성 계층을 구현하지 않는다. 대신 이들은 데이터 지속성 계층이 의존하는 클라우드 서비스의 일부로 제공된다고 가정한다. 실제로 업계VC, 애널리스트, 고객)에서는 데이터베이스, 데이터 레이크, 데이터 웨어하우스와 같은 데이터 서비스를 ‘클라우드 인프라’의 일부로 간주한다.
이 글에서는 VMware의 멀티 클라우드 데이터 관리 전략을 살펴본다. 먼저 데이터베이스 서비스에서 시작하여 VMware 클라우드 핵심 데이터 서비스를 지원하는 것을 목표로 하는 VMware의 메인 클라우드 플랫폼(vSphere)의 새로운 확장 기능과 데이터 서비스를 상호 연결하고 사내 R&D 및 파트너 생태계의 조합을 통해 보다 포괄적인 데이터 관리 솔루션을 제공할 수 있는 기회에 대해 알아본다.
핵심 데이터 서비스
오늘날 VMware 고객은 점점 더 많은 데이터베이스 유형과 사례를 관리하고 있다. 이러한 추세는 기업의 디지털 현대화와 비즈니스의 중심이 되는 최신 애플리케이션의 등장으로 인해 더욱 가속화되고 있다. 고객의 요구사항은 관계형 데이터베이스에서 시작하여 인메모리 데이터베이스, 데이터 웨어하우스, 키값 저장소, 스트리밍 및 메시징 시스템 등으로 포함되거나 확장된다. 이를 통칭하여 “핵심 데이터 서비스”라고 부른다.
VMware는 이미 VMware Greenplum, SQL, GemFire, RabbitMQ 등 피보탈의 데이터 소프트웨어 자산으로 구성된 포괄적인 포트폴리오를 보유하고 있다. 고객은 이러한 제품을 사용하여 온프레미스, 프라이빗 클라우드, 퍼블릭 클라우드에서 실시간으로 대규모 데이터 리소스를 저장, 이동, 처리와 문의를 할 수 있다.
최근 VMware는 애플리케이션 개발자에게 필요한 민첩성과 클라우드 네이티브 소비 모델을 지원하면 급증하는 데이터베이스 자산 관리 방법이라는 시급한 문제를 해결하기 위한 소프트웨어로 포트폴리오를 확장했다. 실제로 일반적인 엔터프라이즈 IT 조직은 10년 전 소수의 오라클 DB(데이터베이스)를 관리하는 것에서 오늘날 수백 가지 유형의 DB로 구성된 거대한 DB 팜을 관리해야 하는 상황에 이르렀다. 동시에 애플리케이션 팀은 프로그래밍 방식으로 데이터베이스를 제공하고 IT 부서가 보장하는 특정 서비스 수준 목표(SLO)에 따라 데이터베이스를 사용하기를 원한다. 또한 일반 IT 전문가가 데이터베이스 관리 업무를 수행하면서 확장에 어려움을 겪고 있는 데이터베이스 관리자(DBA)의 수는 점점 줄어들고 있다.
VMware는 고객이 언급한 두 가지 문제를 해결할 수 있도록 지원하는 제품 첫 번째 버전을 출시한다. VMware Data Service Manager(DSM)는 브이스피어(vSphere)의 기본 확장이며, 다른 VMware 관리 제품과 통합된다. 고객은 이 제품을 사용하여 가장 많이 활용하고 있는 세 가지 DB를 관리할 수 있다. Postgres, MySQL, SQL Server(*). DSM 기능은 아래와 같이 세 가지 주요 유형을 지원한다.
DBA는 예상되는 SLO(서비스 수준 목표)에 따라 데이터베이스 템플릿을 설정하고 데이터베이스 수명 주기에 따라 데이터 보호 및 가용성에 대한 정책을 수립한다. 데이터베이스 수명 주기의 번거로운 작업은 자동화되고 인프라 관리와 조율된다.
- IT 관리자는 인프라 및 리소스 관리를 계속 제어할 수 있다. 주요 인프라 및 데이터베이스 메트릭에 대한 엔드 투 엔드 가시성을 확보하고 이를 통해 데이터베이스 소비자에게 필요한 SLO를 효과적으로 제공할 수 있다.
- 앱 개발자는 프로그래밍 방식의 셀프 서비스 기능을 통해 대규모로 빠르게 앱을 만들 수 있다. 데이터베이스 프로비저닝 및 관련 관리 기능(예: 복제본 생성)을 개발 프로세스 및 CI/CD 파이프라인과 통합할 수 있다. 개발자는 원하는 SLO를 달성하고 다양한 데이터 보호 및 거버넌스 요구 사항을 준수하기 위해 IT 팀에 의존한다.
요약하자면, DSM의 목표는 IT/DBA 팀이 내부 고객(주로 애플리케이션 팀)에게 온프레미스에서 진정한 DBaaS(서비스형 데이터베이스)를 제공할 수 있도록 역량을 강화하는 것이다.
거시 경제 환경의 변화로 인해 고객은 클라우드 지출에 대해 훨씬 더 신중한 태도를 취하게 되었고, 이에 따라 데이터 서비스를 위한 비용 효율적인 온프레미스 대안으로 VMware가 주목받게 되었다. 또한 비용에 민감한 고객이 증가하면서 IT 팀의 기술이 통합되어 일상적인 DB 운영은 점점 더 IT 제너럴리스트의 몫이 되는 반면, 기존의 DBA 역할은 데이터베이스 아키텍처와 내부 소비자를 위해 데이터에서 가치를 추출하는 방법에 더욱 집중하게 되었다.
고객 사용 사례:
- 문제점: 유럽의 한 최상위 의료 서비스 기업은 심각한 ‘데이터 스프롤 현상’에 직면해 있다. 개발자 및 서비스 요구 사항이 다양해지면서 브이스피어에서 DB 팜이 급증하여 DBA 리소스를 초과하는 반면, 맞춤형 자동화 솔루션을 시도했지만 실패했다. 이는 점점 더 일반화되고 있는 고객의 고충 유형이다.
- 솔루션: 이 고객은 자체 개발 툴에서 VMware Data Service Manager로 전환하여 개발자가 원하는 셀프 서비스 기능과 IT 부서에 필요한 자동화 및 모니터링 기능을 제공하고 있다.
VMware의 비전은 고객이 성능, 비즈니스 연속성, 보안을 위해 동일한 운영 모델과 SLO를 사용하여 프라이빗과 퍼블릭을 포함한 모든 클라우드에서 데이터 인프라를 구축, 배포, 운영할 수 있도록 지원하는 것이다. 과거에 컴퓨팅, 스토리지, 네트워킹에서 그랬던 것처럼 데이터를 쉽게 소비하고 관리할 수 있도록 하는 것이 핵심이다.
현재 DSM은 고객이 내부 ‘최종’ 고객(주로 애플리케이션 팀)에게 DBaaS를 제공하는데 사용하는 소프트웨어 제품을 제공한다. 또한 VMware 관리형 데이터 서비스와 같은 다른 운영 모델도 모색하고 있다. 이러한 데이터 서비스를 고객에게 제공할지에 대한 여부와 방법을 결정하기 전에 내부적으로 시험해보고 있다. 2022 VMware 익스플로어 유럽 세션인 “최신 애플리케이션을 위한 데이터 인프라”에서 프로젝트 모네타의 기술 프리뷰를 통해 이러한 아이디어 중 일부를 시연했으며, VMware 익스플로어 2023에서 현재 진행 상황을 공유할 예정이다.
다음 단계는 무엇인가?
VMware의 장기적 비전은 고객이 특정 클라우드 또는 벤더 수직 솔루션의 제약을 받지 않고 데이터에서 완전히 가치를 추출할 수 있도록 지원하여 실질적인 멀티 클라우드 데이터 관리 리더가 되는 것이다. VMware는 고객이 다양한 운영 데이터베이스부터 데이터 웨어하우스 및 데이터 레이크에 이르기까지 다양한 클라우드 및 데이터 저장소에서 데이터를 찾고, 액세스하고, 활용할 수 있도록 지원하는 데이터 관리 플랫폼을 구축하여 고객이 목표에 달성할 수 있도록 지원한다. 이 과정은 아래 그림 4에서 세 번째 물결이다.
멀티 클라우드 데이터 관리는 현재 VMware 플랫폼이 지원하는 핵심 데이터 서비스(데이터베이스)를 넘어섰다. 여기에는 데이터 카탈로그 및 검색, 계보 추적, 메타데이터 관리, 클라우드 간 데이터 액세스 및 전송, 거버넌스, 규정 준수 등을 위한 기술 및 솔루션이 포함된다.
여러 소스, 더 나아가 여러 클라우드에 걸쳐 데이터를 읽고 선택적으로 여러 대상에 기록해야 하는 등 새로운 요구사항이 등장하면서 해결해야 할 복잡한 문제가 생긴 것이다. 다양한 세대의 쿼리 엔진, 데이터 형식 및 스키마를 지원하면서 데이터 소스 전반에서 리소스 경합 및 속도 제한을 관리하고, 퍼블릭 클라우드의 높은 송신 요금을 포함한 클라우드 경제에 최적화하며 보다 고객 친화적인 이니셔티브를 지원하고, 데이터 최신성과 데이터 품질 메트릭을 보장해야 한다. 또한 데이터를 작성하면 데이터 라우팅, 트랜잭션 관리, 비즈니스 로직 변환 해결과 같은 과제가 추가된다.
VMware의 궁극적 목표는 VMware 내부에 구축된 솔루션 및 서비스 외에도 광범위한 파트너 생태계를 활용하여 고객에게 더 많은 가치를 제공하는 방식으로 데이터 플랫폼을 발전시키는 것이다.