DataStax, Cassandra를 다중 모델 데이터베이스로 전환하는 Stargate 프로젝트 공개

  • Sep 07, 2023

DataStax는 Stargate 오픈 소스 프로젝트를 통해 Cassandra가 아닌 개발자에게도 Cassandra의 도달 범위를 넓히기를 희망합니다.

스타게이트.jpg

데이터스택스 의 첫 번째 미리보기를 공개합니다. 스타게이트, 궁극적으로 전환될 수 있는 새로운 오픈 소스 API 프레임워크 아파치 카산드라 다중 모델 데이터베이스로. 이는 API 접근 방식을 취하는 Microsoft Azure 및 Google의 클라우드 데이터베이스와 유사하며, 최근에는 Oracle과 같은 가정용 브랜드의 클라우드 데이터베이스와 유사한 접근 방식입니다.

프로젝트 이름이 추억을 떠올리게 하지만 데이비드 보위, Stargate의 목표는 숙련된 기존 개발자 기반을 넘어 Cassandra를 노출시키는 것입니다. CQL(카산드라 쿼리 언어) 또는 그렘린 JSON에 능숙한 JavaScript 개발자 또는 SQL 작업에 익숙한 Java 개발자에게 적합합니다. 액세스는 전체 CRUD(생성-읽기-업데이트-삭제) 기능을 지원하는 API를 통해 이루어집니다. 우선 첫 번째(그리고 현재로서는 유일한) API가 CQL 및 REST API를 사용하여 Apache Cassandra를 지원한다는 것은 놀라운 일이 아닙니다.

Stargate는 스토리지 엔진과 별개로 온프레미스 또는 클라우드에서 실행되는 게이트웨이로 설계되었습니다. 익숙한 내용을 바탕으로 한 것입니다. 코디네이터 노드 Cassandra가 요청을 처리하는 방법을 결정하는 프록시입니다. 다중 마스터 데이터베이스로서 모든 노드는 쿼리 처리 라우팅을 위한 조정자 역할을 할 수 있으며 노드는 저장소에서 분리됩니다. CQL 요청을 처리하는 동일한 프록시를 활용함으로써 Cassandra는 다른 API를 처리하기 위해 다시 설계할 필요가 없습니다.

GitHub에서 호스팅되는 이 프로젝트는 표준 Apache 2.0 오픈 소스 라이선스를 통해 사용할 수 있습니다. 현재 DataStax는 Stargate에 대한 추가 계획을 발표하지 않았지만 커뮤니티에서는 SQL, JSON 문서(MongoDB 스타일 API가 예상됨), GraphQL 및 Gremlin을 다룰 가능성이 높습니다. 현재로서는 Cassandra API를 사용하는 Stargate가 이미 기본적으로 Apache Cassandra에 구운 것과 비교하여 어떻게 수행되는지 알 수 없습니다.

API 경로를 따라 Stargate는 다음과 유사한 경로를 그립니다. Azure 코스모스 DB는 SQL, MongoDB 유선 프로토콜, Cassandra, 테이블(키-값용), Gremlin을 포함한 5가지 API를 동일한 데이터베이스에서 제공합니다. (Cosmos DB에서는 데이터 세트에 대한 API를 선택하면 이를 사용하게 됩니다.) 동일한 스토리지 엔진을 사용하는 Google과 유사한 점도 있습니다. 클라우드 스패너, 이는 SQL API를 통해 노출됩니다. 클라우드 파이어스토어, JSON 문서 API를 준수합니다.

아마도 Stargate는 Cassandra에 대한 선호되는 액세스 모드로 진화할 수 있지만 이는 두 가지 큰 "if"에 달려 있습니다. 첫째, 성능 저하가 없어야 합니다. 기존 기본 액세스 접근 방식과 비교하여 두 번째로 프로젝트는 Apache Cassandra 커뮤니티의 승인을 받아야 하며 공식적으로 프로젝트.

다중 모델 지원은 새로운 것이 아닙니다. 데이터스택스 엔터프라이즈, DataStax의 Cassandra 상용 배포판입니다. 이전 인수를 통해 DataStax 플랫폼도 Gremlin을 지원했지만 DSE 6.8 릴리스 이전에는 그래프 엔진이 핵심 데이터베이스에 통합되지 않았기 때문에 그래프 데이터를 모델링하고 수집해야 했습니다. 갈라져. 와 함께 DSE 6.8, 그래프 보기는 동일한 데이터 수집을 통해 동일한 기본 CQL API에서 작동할 수 있습니다. 그러나 그래프 지원은 DSE 고객에게만 제공되었으며 핵심 오픈 소스 플랫폼의 일부가 아니었습니다. Stargate가 Apache Cassandra 프로젝트에 의해 승인된다면 이는 Gremlin 및 잠재적으로 모선의 다른 API 사용을 주류화하는 방법이 될 것입니다.

빅 데이터

귀하가 데이터 침해에 연루되었는지 확인하는 방법(그리고 다음에 해야 할 일)
AI의 편견과의 싸움은 데이터에서 시작됩니다
공정한 예측? 180명의 기상학자가 '충분히 좋은' 날씨 데이터를 제공하는 방법
암 치료법은 어지러울 정도로 많은 양의 데이터에 의존합니다. 클라우드에서 정렬되는 방법은 다음과 같습니다.
  • 귀하가 데이터 침해에 연루되었는지 확인하는 방법(그리고 다음에 해야 할 일)
  • AI의 편견과의 싸움은 데이터에서 시작됩니다
  • 공정한 예측? 180명의 기상학자가 '충분히 좋은' 날씨 데이터를 제공하는 방법
  • 암 치료법은 어지러울 정도로 많은 양의 데이터에 의존합니다. 클라우드에서 정렬되는 방법은 다음과 같습니다.