VMware가 오픈 소스 기반의 대규모 데이터 병렬 처리 분석 플랫폼 그린플럼 7(Greenplum 7)의 새로운 기능을 발표했다. 그린플럼 7은 한층 향상된 데이터 확장성과 배포 유연성을 제공하며 다중 워크로드 처리가 가능해 고객이 최첨단 리소스 관리와 정교한 분석에 활용할 수 있도록 설계된 것이 특징이다.
VMware 그린플럼
VMware 그린플럼(Greenplum)은 출시 이후 다양한 조직에 확장 가능한 고성능 분석 솔루션을 제공하기 위해 꾸준히 발전해 왔다.
그린플럼은 빅데이터 시대가 막을 올린 2000년대 초반에 시작됐다. 당시 기업들은 빠르게 증가하는 데이터 자산의 막대한 잠재력을 깨닫기 시작했으며이를 활용하기 위해전통적인 데이터베이스 및 소프트웨어와는 확연히 다른 고급 데이터 관리 및 분석 도구를 필요로 했다.
이 같은 기업들의 요구에 따라, VMware는 기존 시스템 성능을 넘어선 빅데이터 워크로드를 처리할 수 있는 데이터베이스를 구축할 수 있도록 그린플럼 프로젝트에 착수했다. 오픈소스 포스트그레SQL(PostgreSQL)에 기반한 VMware의 그린플럼 데이터베이스(Greenplum Database)는 주로 비즈니스 인텔리전스 및 데이터 웨어하우징에 중점을 둔 대규모 병렬 처리(MPP) 데이터베이스 시스템으로 설계됐다.
지난 수년간 그린플럼은 광범위한 빅데이터 분석 솔루션과 고급 데이터 사이언스 도구를 제공하기 위해 기능 확장을 거듭해왔다. 오늘날 그린플럼은 다양한 분석 요구 사항을 충족하는 확장 가능하고 유연한 최첨단 데이터 플랫폼으로 자리 잡았다. 또한 비즈니스 인텔리전스부터 머신러닝 애플리케이션까지 기업이 데이터 자산의 잠재력을 최대한 활용할 수 있도록 지원하고 있다.
VMware 그린플럼 7
그린플럼은 지속적인 발전과 성장을 통해 다양한 데이터 워크로드의 변화하는 요구사항을 충족할 뿐만 아니라 빅데이터 분석의 미래를 예측하고 구체화해 왔다. VMware가 새롭게 발표한 그린플럼 7은 그린플럼 발전의 연장선상에 있는 차세대 솔루션이다.
새로운 그린플럼 7은 기본적으로 신뢰할 수 있고 안정적이며 유연한 SQL 기반 온라인 분석 처리(OLAP) 플랫폼을 구축 및 발전시키기 위한 VMware의 노력을 보여준다. 이 혁신적인 플랫폼은 정형, 반정형, 비정형 등 다양한 데이터 유형에 대한 최첨단 리소스 관리 및 정교한 분석 기능에 중점을 두고 다양한 개선 사항과 추가 기능을 도입했다.
그린플럼 7의 주요 혁신 기능은 다음과 같다.
- 원활한 데이터 확장성 –확장성에 중심을 둔 그린플럼 7은 테라바이트에서 페타바이트에 이르는 데이터 볼륨을 수용하도록 정교한 아키텍처로 설계됐다. 이 같은 확장성으로 그린플럼 7은 빠른 성장을 경험한 기업의 운영 확장을 지원하는 최적의 솔루션이다.
- 다중 워크로드 처리 –기업은 그린플럼 7으로 간단한 트랜잭션, 대용량 데이터 웨어하우징, 머신러닝, 고급 분석 등 다양한 워크로드를 효율적으로 처리 가능하다. 관리 용이성 개선으로 데이터베이스 관리자는 시스템을 더 쉽게 유지 및 모니터링할 수 있으며, 백업, 복구 및 시스템 상태 확인을 위한 도구도 개선돼 시스템 유지 보수 프로세스를 간소화하고 총 소유 비용을 절감할 수 있다.
- 배포 유연성 –그린플럼 7은 퍼블릭 클라우드, 프라이빗 클라우드, VMware 브이스피어(vSphere), 베어메탈 등 다양한 인프라에 배포할 수 있는 범용성을 자랑한다. 다양한 플랫폼과 호환되는 그린플럼 7은 레퍼런스 아키텍처 및 전용 최적화를 기반으로 한다. 가령 기업은 베어메탈 배포에 최적화된 그린플럼 솔루션을 통해 더 강력한 성능과 리소스 활용할 수 있다. 또한 그린플럼 7은 퍼블릭 클라우드에서 배포 시 클라우드 네이티브 기능을 기반으로 높은 확장성, 내구성 및 비용 효율성을 지원한다. 브이스피어 기반 프라이빗 클라우드 솔루션의 경우, VMware가 제공하는 가상화 및 관리 기능과 긴밀히 통합돼 유연하고 관리하기 쉬운 데이터 플랫폼을 제공한다.
그린플럼 7의 새로운 기능
그린플럼 7의 대표적인 기능 중에는 그린플럼 시스템의 핵심 구성 요소인 오픈소스 포스트그레SQL 소스 코드와의 통합이 있다. 이는 그린플럼 7이 제공하는 고급 기능의 강력한 기반을 구축하고, 포스트그레SQL 고유의 강력함과 유연성, 보안 기능을 활용할 수 있도록 한다.
vmware-greenplum-7-announcement그린플럼 7은 최첨단 리소스 관리부터 정형, 반정형 및 비정형 데이터에 대한 정교한 분석 등 다양한 개선 사항과 추가 기능을 도입해, 성장 중인 기업이 미래에 대비할 수 있도록 지원한다. 그린플럼 7의 새로운 리소스 관리 기능은 까다로운 환경에서도 효과적인 리소스 분배와 워크로드 관리가 가능해 최상의 성능을 유지할 수 있도록 돕는다.
주요 보안 기능으로서 멀티 데이터 센터 재해 복구(Multi Data Center Disaster Recovery) 솔루션도 도입됐다. 이 기능은 예상치 못한 재해 발생 시 신속하고 효율적으로 데이터를 복구해 비즈니스 복원력과 안정성을 유지함으로써 비즈니스 연속성을 제공한다.
인공지능으로 생성된 벡터 임베딩 기반의 비정형 데이터에 대한 스토리지, 인덱스 및 유사성 검색을 위한 AI 기능도 추가돼, 기업이 방대한 양의 비정형 데이터를 이해하고 다량의 정보에 기반한 의사 결정과 더 나은 비즈니스 성과를 달성하도록 지원한다.
이 밖에도 그린플럼 7은 ▲비트리(Btree) ▲해시(Hash) ▲BRIN(Block Range Min-Max Indices) ▲텍스트 인덱스(Text Indices) ▲지리공간 인덱스(Geospatial Indices) ▲AI 벡터 기반 인덱스 등 다양한 인덱스 유형을 지원해 기업이 데이터를 더욱 효율적으로 처리 및 검색하며, 응답 시간을 단축하고 생산성을 높여준다.
또한 데이터와 쿼리를 여러 노드에 분산해 쿼리 응답 속도를 높이고 데이터 분석 기능을 향상시키는 MPP 아키텍처를 적용해, 대용량 데이터를 다루는 기업에도 적합하다.
VMware는 그린플럼 7이 제공하는 다양한 고급 기능과 기능 개선을 통해 기업 데이터 분석에 새로운 발전을 가져올 것으로 기대한다. 향상된 기능과 확장성, 다양한 기술과의 원활한 통합으로 그린플럼 7은 기업이 데이터 자산의 잠재력을 최대한 발휘할 수 있도록 지원하며, 데이터 웨어하우징, 분석, 리스크 관리 등 다양한 사용 사례에 적용 가능하다.