클라우데라, REST 카탈로그를 통한 제로-카피 데이터 공유와 통합 메타데이터 인텔리전스로 Iceberg 혁신 선도

클라우데라 레이크하우스 옵티마이저 (Cloudera Lakehouse Optimizer), 오픈 데이터 레이크하우스 내 Apache Iceberg 테이블에 자동 최적화 및 테이블 관리 제공

캘리포니아주 산타클라라, Sept. 26, 2025 (GLOBE NEWSWIRE) -- 어떤 환경의 데이터 환경에서도 AI를 구현하는 유일한 기업인 클라우데라(Cloudera)가 오늘 자사의 플랫폼 업데이트를 발표했다. 이번 업데이트에는 Cloudera Iceberg REST Catalog와 Cloudera Lakehouse Optimizer가 포함되며, 이는 아이스버그(Iceberg) 기반의 최고의 오픈 데이터 레이크하우스를 제공하겠다는 클라우데라의 의지를 더욱 강화하는 것이다. 이번 개선을 통해 Iceberg REST Catalog는 데이터를 원활하게 공유할 수 있는 개방형 상호운용성을 제공하며, Lakehouse Optimizer는 모든 엔진이 데이터를 액세스할 때 최적화와 비용 효율성을 보장한다. 이 모든 과정은 클라우데라의 통합 거버넌스와 보안 체계 아래에서 운영된다. 이러한 신규 기능은 클라우데라의 대표 AI·데이터 업계 행사인 EVOLVE25 NYC에서 공개됐다.

기업들이 AI와 분석의 잠재력을 실현하기 위해 속도를 내는 가운데, 여전히 상당한 장벽들이 존재한다. 복잡한 데이터 아키텍처, 분절된 플랫폼, 불일치하는 거버넌스 등이 대표적이다. 분석이나 AI 학습을 위해 데이터를 시스템 간에 이동하면 비용이 증가하고, 보안 위험이 발생하며, 인사이트 도출이 지연된다. 현대 조직에는 데이터 중복이나 벤더 종속 없이, 어디서나 AI 활용이 가능하고, 멀티 엔진 분석을 지원하는 개방적이고 안전하며 상호운용 가능한 데이터 아키텍처가 반드시 필요하다.

클라우데라의 Iceberg REST Catalog - 더 낮은 총소유비용(TCO)과 더 빠른 가치 실현

클라우데라는 데이터와 AI 플랫폼 전반에 Iceberg REST Catalog를 통합한 최초이자 유일한 공급자로서, 안전한 제로 카피(Zero-Copy) 데이터 공유와 통합 거버넌스를 클라우드와 데이터센터 전반에 걸쳐 구현한다. 이번에 이루어진 신규 기능은 Iceberg REST Catalog를 플랫폼에 통합하여 이러한 문제들을 해결하게 된다. 이를 통해 서드파티 엔진이 데이터를 복사하거나 이동하지 않고도 클라우데라가 관리하는 데이터에 직접 접근할 수 있으며, 공공 클라우드, 데이터센터, 에지 환경 전반에서 일관된 정책 집행과 메타데이터 인텔리전스를 보장하고 있다. 클라우데라는 모든 클라우드와 데이터센터에서 실시간 수집, 대규모 처리부터 AI와 BI 소비에 이르기까지 데이터 전 생애주기 전반에서 통합 보안, 거버넌스, 상호운용성을 제공할 수 있는 유일한 벤더이다. REST 기반 접근 방식을 통해 Apache Iceberg의 강점을 확장한 클라우데라는 기업들이 데이터 전략을 미래지향적으로 설계할 수 있도록 지원하며, 동시에 통제력, 가시성, 규제 준수를 유지하는 게 특징이다.

이번 업데이트에 따라 Iceberg를 사용하는 모든 클라우데라 고객은 이제 생태계 전반에서 제로 카피(Zero-Copy) 상호운용성을 원활하게 누릴 수 있으며, Snowflake, Databricks, AWS Athena, AWS EMR, Salesforce와 같은 선도적인 분석 및 AI 엔진에 연결할 수 있다. 이 모든 과정은 완전한 ACID 준수와 통합 접근 정책 하에서 이루어지게 된다. 또한, 고객들은 기업급 거버넌스를 확보하게 되며, 클라우데라의 Shared Data Experience(SDX)를 통해 서드파티 도구에도 세분화된 접근 제어, 데이터 계보(lineage), 감사(auditing)를 확장하여 안전한 데이터 민주화와 대규모 규제 준수를 보장하고 있다. 아울러 고객들은 개방형 메타데이터 접근을 통해 데이터 자산을 즉시 탐색할 수 있으며, 독점 카탈로그에 종속되지 않아도 되기 때문에 일관된 단일 진실 소스를 기반으로 AI 개발과 비즈니스 인텔리전스(BI)를 가속화할 수 있다는 장점을 얻게 된다. 마지막으로, 이번 강화된 기능들은 더 낮은 총소유비용(TCO)과 더 빠른 가치 실현을 제공한다. 고객들은 데이터 스토리지 비용을 최대 79% 절감하는 동시에 사업 부문 전반에서 가시성을 개선했다고 보고했다. 예를 들어, 한 글로벌 위성 통신 고객은 AI 데이터 파이프라인을 강화하면서 동시에 이러한 절감 효과를 실현했다고 밝혔다.

Cloudera Lakehouse Optimizer - 쿼리 성능 향상 및 스토리지 비용 절감 효과

Cloudera Lakehouse Optimizer는 클라우데라의 레이크하우스 내 Apache Iceberg를 위해 자동 최적화 및 테이블 유지 관리를 제공하는 새로운 지능형 서비스이다. 단순한 테이블 관리 기능을 넘어, 매니페스트(manifest) 및 위치 삭제(position delete) 파일 재작성과 같은 고급 지능형 최적화를 제공하는 것이 특징이다. 이 서비스는 테이블을 지능적으로 최적화함으로써 수동 데이터 관리 작업과 운영 비용을 없애고, 고객이 데이터에서 인사이트를 추출하는 데 집중할 수 있도록 도와준다. 또한 모든 Iceberg 호환 엔진 및 퍼블릭 클라우드에서 적용 가능한 개방형 솔루션이며, 독자적인 사용자 인터페이스를 통해 세밀한 정책 정의 및 수정이 가능한 엔터프라이즈급 관찰성(observability)과 제어 기능을 제공한다. 정책은 특정 테이블이나 전체 카탈로그에 적용할 수 있으며, 향후 온프레미스 환경에서 제공되는 유일한 서비스가 될 예정이다. 내부 벤치마크 결과에 따르면, 이 서비스는 쿼리 성능을 최대 13배 향상시키고 스토리지 비용을 36% 절감하는 효과를 보여주었다.

클라우데라의 최고 제품 책임자(Chief Product Officer)인 Leo Brunnick은 “클라우데라는 빅데이터 산업을 개척했으며, Apache Iceberg 오픈 테이블 포맷을 엔터프라이즈 수준으로 발전시키기 위해 지속적으로 투자하는 선도적 플랫폼 제공업체로 남아 있다.”라고 강조했다. 그는 이어 “오늘 발표를 통해 우리는 고객이 가장 필요로 하는 시점과 장소에서 유연성, 확장성, 그리고 타협 없는 인사이트를 제공하겠다는 약속을 이어가고 있다. 이러한 약속이 세계 최대의 조직들이 자사의 데이터를 어디에 두고 있든 간에 AI를 적용하기 위해 클라우데라를 신뢰하는 이유인 것이다.”라고 덧붙였다.

Iceberg REST Catalog 기반의 Cloudera Data Sharing과 Cloudera Lakehouse Optimizer는 현재 이용 가능합니다. 더 자세한 내용은 웹사이트(website)를 방문해 주시기 바랍니다.

