DataStax залучає Aurelius та його команду Titan для створення нової бази даних графів

  • Oct 19, 2023

Нагородою за придбання DataStax фірми з відкритим кодом Aurelius є не база даних Titan, а радше інженерний досвід, який буде використано для розробки нової бази даних графів.

martinvanryswykdatastax220x265.jpg

Мартін Ван Рисвік: Візьміть базу даних графів і розподіліть її між вузлами.

Зображення: DataStax

Фірма Apache Cassandra DataStax створює нову базу даних графів, використовуючи досвід команди інженерів з Aurelius, про придбання якої вона оголосила сьогодні.

Усі інженери Aurelius, компанії, що стоїть за розподіленою базою даних графів Titan із відкритим кодом, переходять до DataStax, щоб розпочати роботу над проектом DataStax Enterprise (DSE) Graph.

«Ми не будемо робити інтеграцію. Суть тут полягає в тому, що ми візьмемо все, що було зроблено на Titan, як натхнення, і, можливо, деякі з проекту Titan увійдуть до DSE Graph», — сказав віце-президент з інженерних розробок DataStax Мартін Ван Рисвік.

«Але ми справді збираємося створити щось нове, тому що зараз ми зможемо скористатися перевагами Cassandra зокрема й особливостями DSE. Це буде інженерна робота, щоб створити новий продукт. Ми не будемо підтримувати або інтегрувати Titan як продукт у наше портфоліо».

Графові бази даних використовують вузли та зв’язки між ними для опису мереж і контекстів. Минулого року Forrester Research передбачив, що до 2017 року приблизно 25 відсотків підприємств використовуватимуть бази даних із графіками для додатків наступного покоління, яким потрібні підключені набори даних.

«Графові бази даних спрощують і прискорюють доступ до даних, які є складними та містять багато зв’язків. [Вони] використовують структури графів із вузлами, ребрами та властивостями для зберігання та доступу до пов’язаної інформації та можуть проходити частини даних, не торкаючись усього графіка», – сказав Форрестер.

В Рейтинги графових баз даних DB-Engines У класифікації за популярністю Titan займає друге місце, дещо поступаючись Neo4j від Neo Technology на першому місці. в загальний рейтинг популярності, Titan знаходиться на 57 місці зі списку, що містить понад 200 баз даних.

Керуючий партнер Aurelius і провідний розробник Titan Маттіас Брохелер сказав, що основними учасниками Titan є переходить до роботи над новим комерційним проектом, який також буде доступний у формі спільноти з відкритим кодом.

Маттіас Брохелер: Подумайте про те, наскільки важливі зв’язки у ваших даних.

Зображення: DataStax

«Два з половиною роки тому, коли ми розпочинали проект Titan, люди дійсно не були впевнені, що можна реально масштабувати бази даних графіків. Зараз ми досягли того моменту, коли люди це прийняли, використовують Titan і звертаються до нас зі словами: «Ми використовуємо Titan у критично важливих програмах». Нам справді потрібна комерційна підтримка від вас», — сказав він.

«Ось чому з нашої точки зору Аврелія цей крок має великий сенс — тому що ми можемо досягти комерційних готовність набагато швидше за допомогою DataStax, у якого вже є канали дистрибуції та продажі налаштована підтримка. Ми приєднаємося до них і створимо на основі цього, а потім надамо технічній спільноті продукт, який вони зможуть використовувати, з усією підтримкою та інфраструктурою, які вони очікують».

Ван Рісвік з DataStax сказав, що багато клієнтів DataStax вже використовують Titan, який може працювати на основі Cassandra, і мали самостійно провели роботу з інтеграції, щоб забезпечити його роботу з DataStax Enterprise, комерційним пакетом інструментів Cassandra та послуги.

«Ми спілкувалися з багатьма тими самими клієнтами з однаковими варіантами використання, і щоб зробити це правильно, мало сенс взяти Titan і перетворити його на щось нове», — сказав він.

Створення DSE Graph, ціна та упаковка якого ще не визначені, є серйозною справою, але процеси проектування вже розпочато, сказав Ван Рисвік.

«Перед тим, як ми здійснили придбання, ми провели багато переговорів про те, що, на нашу думку, буде правильним способом зробити це, і досягли згоди щодо цього. Але ми ще не зробили детальних проектів або прототипів, тому поки що рано усвідомлювати, коли це буде зроблено. Але це не миттєва річ. Я не думаю, що це кілька років", - сказав він.

Дивись також

Компанія Neo Technology, що займається базою даних графів Neo4j, отримує 20 мільйонів доларів

Читайте зараз

Компанія Neo Technology, що займається базою даних графів Neo4j, отримує 20 мільйонів доларів

Серед недавніх інвестицій у базу даних Neo Technology, компанія, яка розробляє провідну графічну базу даних Neo4j, оприлюднила власний багатомільйонний внесок.

Читайте зараз
Метою DataStax є створення високомасштабованої та високодоступної розподіленої графічної бази даних.

«Ось чому цей матч такий хороший. Це дуже складна проблема, і Маттіас [Брокелер] провів значну частину свого життя, розмірковуючи над цією проблемою — взяти базу даних графів і розподілити її між вузлами», — сказав Ван Рисвік.

«Це проблема, яку вони намагаються вирішити, і це також проблема, яку ми намагаємося вирішити: зробити речі дуже ефективними, масштабованими та розподіленими. Ось чому це хороший шлюб між ними».

Маттіас Брохелер сказав, що компанії можуть вибрати базу даних із графіками для додатків, які використовують дуже взаємопов’язані дані, які потрібно аналізувати або запитувати в режимі реального часу.

«Ми допомагаємо людям, кажучи: «Погляньте на свої програми та спробуйте подумати про те, наскільки важливі зв’язки у ваших даних, і розмістіть їх у діапазоні від «зовсім» до «дуже сильно». Чим ближче ви наближаєтеся до дуже багато, тим більша ймовірність того, що ви повинні використовувати графову базу даних для своїх програм», – сказав він.

«Вони мають величезні переваги в зручності використання, оскільки модель даних дуже близька до фактичної моделі програми. По-друге, мова запитів дуже підходить для запитів на такі неоднорідні та дуже пов’язані дані».

За словами Ван Рисвіка, багато застосувань, для яких фірми використовують Cassandra, вже містять графовий компонент.

«Наприклад, двигуни рекомендацій. Це може бути для роздрібних торговців, які намагаються запропонувати вам продукт на основі всіх цих дуже пов’язаних даних, які вони зібрали про вас. Дані про ваші моделі, купівельні звички та асоціації з іншими людьми, і я використовую все це, щоб запустити алгоритм, який намагається вирішити, що вам запропонувати», — сказав він.

Інші сфери, де навантаження піддаються графічним базам даних, включають фінанси, соціальні мережі, виявлення шахрайства, ідентифікацію та доступ, а також охорону здоров’я.

Хоча Titan не буде пропонуватися DataStax, він підтримуватиме спільноту графових обчислень TinkerPop з відкритим кодом, яка включає мову запитів Gremlin. TinkerPop нещодавно став інкубатором Apache демонструвати.

Більше про DataStax і бази даних

  • MongoDB залучає WiredTiger та його команду експертів із зберігання даних
  • Чому 2015 рік буде великим для баз даних NoSQL: CEO Couchbase
  • DataStax пояснює, як Apache Cassandra отримує вигоду від збільшення фінансування на 106 мільйонів доларів
  • DataStax 4.5 Cassandra запускає аналітику в пам’яті Apache Spark
  • Технічний директор MongoDB: Як наш новий механізм зберігання WiredTiger заробить свої смуги
  • Загальний випуск бази даних SQL на Hadoop від Splice Machine
  • Apache Cassandra отримує опцію в пам’яті з DataStax Enterprise 4.0
  • Як угоди Google і Accenture щодо DataStax вказують на зростання Cassandra
  • Postgres і MySQL: EnterpriseDB відкриває новий спосіб зв’язування цих відкритих баз даних
  • MySQL: чому база даних з відкритим кодом краще під Oracle