Поглед под капака на Amazon Neptune

  • Oct 18, 2023

На Re: Invent, Amazon Web Services обяви предварителния преглед на най-новото издание на своята облачна база данни семейство: Amazon Neptune, графична база данни, която, за разлика от повечето конкуренти, ви позволява да моделирате графични данни както начини.

stratio.png

Изображение: Stratio

Преди няколко седмици моят Big on Data брато Георги Анадиотис предоставени дълбокото гмуркане защо графичните платформи могат да станат следващата база данни във вашето портфолио, независимо дали знаете какво представляват. Най-просто, графичните бази данни превъзхождат в представянето на връзките много към много, които са трудни, ако не и невъзможни, за моделиране в релационни и NoSQL бази данни.

Също: AWS Sumerian: Обзалагаме се, че корпоративните AR и VR ще бъдат базирани на браузър

Какво прави случаят с графовите бази данни толкова завладяващо е, че те моделират реалния свят по начина, по който той действително съществува. Извън транзакционните системи, хората са склонни да бъдат свързани помежду си в множество социални племена, които могат или не могат да бъдат взаимосвързани. Продуктовите каталози обикновено се състоят от семейства от SKU, които смесват и съпоставят различни пакети от функции. Кибер заплахите често възникват от множество играчи, които могат или не могат да бъдат взаимосвързани, с характеристики, които често могат да издадат произход. Можете да ги моделирате в релационна база данни, ако нямате нищо против бази данни със стотици таблици (или повече) и заявки, изискващи десетки или дори стотици съединявания.

Добре дошли в базата данни с графики, която е предназначена да представя заплетените мрежи от отношения, които често съществуват в реалния живот.

Не е изненадващо, че почти всяка известна платформа за данни е добавила поддръжка на графики към своето портфолио. Наскоро, Amazon Web Services се включи в битката от обявяване на публичния преглед на Амазонка Нептун в края на миналата година на своята конференция Re: Invent. След четири месеца след публичната си предварителна версия, AWS се стреми към общо пускане по-късно тази година. Тази седмица имахме възможност да седнем с AWS и да надникнем под завивките как работи Neptune, като същевременно получихме някои прозрения относно ранното приемане.

Отличителна черта на Neptune е, че за разлика от повечето платформи за графични данни, той поддържа и двете Рамка за описание на ресурси (RDF) графики и графики на имотите. AWS цитира различни случаи на употреба за всяка форма. Клиентите, ангажирани със стандартизиран обмен на данни, предпочитат по-категорично структурираните RDF тройки; това е особено полезно при използване на източници на данни, като например графики на знания или клинични хранилища на данни, които се поддават добре на тройния модел. Обратно, когато се борим с променливо структурирани източници на данни като социални медии, графиките на свойствата могат да бъдат по-практични.

Amazon Neptune ви позволява да направите избор, като декларирате кой модел да използвате, но в този момент, графиката на свойствата и RDF данните не са оперативно съвместими. Това означава, че не можете да формирате една заявка, която да обхваща и двата типа данни. Не бихме се изненадали, ако някаква форма на възможност за обединени заявки може да преодолее тази празнина в бъдеще.

Друга разлика за Neptune е очевидна: тя използва същата технология за съхранение в задния край като другите платформи за бази данни AWS, базирани на екземпляри. Така че, точно като платформи като Aurora и DynamoDB, Neptune автоматично репликира шест само за четене копия в три зони на достъпност (предоставяйки възможност на клиентите да репликират до 15 копия). По същия начин Neptune поддържа криптиране в покой (с помощта на ключове, управлявани от клиента) и в транзит. И осигурява подобен транзакционен модел на ACID, включващ главен запис (който осигурява незабавно съгласуваност), с транзакции, ангажирани на разпределени реплики (подчинени), след като поне четири от тях имат завършени актуализации. Вярваме, че изключение от тази практика би трябвало да бъде функцията за групово зареждане на Neptune, която ще спре гаранции на ACID, за да позволи по-високи скорости на запис.

Също: AWS обявява Secrets Manager, повече инструменти за сигурност

Въпреки че Neptune поддържа транзакционни (OLTP) и аналитични (OLAP) заявки, акцентът засега е върху случаите на използване на транзакции за интерактивни графични приложения. Не е изненадващо, че тези случаи на употреба са най-доброто място за повечето ранни осиновители в предварителния преглед. Тъй като това предложение е в предварителен преглед, Amazon не публикува показатели за ефективност в момента.

указател

Открихме 22 облачни услуги, които вашият бизнес определено трябва да опита

Когато става въпрос за облачни услуги и софтуер като услуга (SaaS), всички сме запознати с обичайните играчи. Но има огромен свят от възможности и налични ресурси извън Google, Dropbox, Salesforce, Amazon и Microsoft.

Прочетете сега

Интересното е как подходът на Amazon към графиката се различава от този на Microsoft. Когато AWS поддържа графика в специална платформа, Microsoft го поддържа като част от мултимоделен подход. SQL Server 2017 (и Azure SQL база данни в облака) добавена поддръжка на графични таблици (които са ограничени до единичен графичен модел) като разширение към SQL; тук разработчиците не трябва да учат специализирани езици като Gremlin или SPARQL. За по-сложни графични сценарии има Космос БД, където SQL, JSON, ключ/стойност и графика са направени първокласни граждани чрез API слой.

По-късно бихме искали да видим Amazon да вземе пример от Microsoft, като пусне SQL разработчици на директно пътуване до Нептун. Случаите на употреба са ясно налице. Представете си запитване за сегментиране на клиенти, отправено към Amazon Червено преместване хранилище за данни, което може да бъде обогатено с данни от социални графики, съхранявани в Neptune. Има прецедент Amazon да направи такава интеграция. Той отвори Redshift, например, с Спектър на червено отместване, предоставяйки възможност за директно запитване към данни, съхранявани в S3 облачно хранилище без да е необходимо да премествате данни. По същия начин има Amazon Athena, която предоставя безсървърна ad hoc SQL услуга за заявки, която също има директен достъп до S3. Въпреки че начинът, по който Redshift ще търси данни от графики, съхранявани в Neptune, може да се различава, идеята едва ли е изключена.