Amazon Neptune のアップデート: 機械学習、データサイエンス、グラフデータベースの将来

  • Sep 05, 2023

Amazon Neptune は、別のクエリ言語 openCypher を自社の武器庫に追加しました。 それ自体は大したことではないように聞こえるかもしれませんが、機械学習とデータ サイエンスの機能のアップデートと組み合わせることで、グラフ データベースの将来を示唆しています。

データ モデルとクエリ言語は、確かに、内部の愛好家以外の人にとってはやや無味乾燥なトピックです。 グラフ データ モデルとクエリ言語もその例外ではありませんが、私たちがその分野の発展を追跡しようと努めてきたのには、主な理由が 1 つあります。

Graph は、エンタープライズ ソフトウェアの最大のセグメントであるデータベースの中で最も急速に成長している分野です。 好例: 最近の一連の資金調達ラウンドで最高潮に達しました。 Neo4j の 3 億 2,500 万ドルのシリーズ F 資金調達ラウンド、その評価額は20億ドルを超えました。

Neo4j はグラフ データベース ベンダーの中で最も長く存在しており、現在では最も資金力のあるベンダーでもあります。 しかし、それだけが注目に値するというわけではありません。 Amazonは2018年にNeptuneとともにグラフデータベース市場に参入した、それ以来、多くの進歩を遂げています。

本日、Amazon は次のサポートを発表しました。 オープンサイファーNeo4j の Cypher をベースにしたオープンソースのクエリ言語です。 この機会を利用して、これが何を意味するのか、そしてそれがグラフの将来にどのように関係しているのかを解き明かしていきます。 データベースのほか、Neptune の機械学習サポートにおける興味深い開発を再確認します。 データサイエンス。

openCypher でブリッジを構築する

開発者は、人気のあるグラフ クエリ言語である openCypher を次のように使用できるようになりました。 アマゾン ネプチューン、グラフ アプリケーションを構築または移行するためのより多くの選択肢が提供されます。 Neptune は、Cypher、Gremlin、SPARQL という最も人気のある上位 3 つのグラフ クエリ言語をサポートするようになりました。

さらに、Neptune は、Neo4j のバイナリ プロトコルであるBolt のサポートを追加します。 これが示唆しているのは、顧客が使い慣れた既存のツール、より具体的に言うと Neo4 のツールを利用できるようにする機能です。 しかし、これが重要である理由は他にもあります。

グラフのモデル化に使用される主なデータ モデルは 2 つあります。 RDF およびラベル付きプロパティ グラフ (LPG). Neptune は両方をサポートしており、SPARQL は RDF のクエリ言語として機能し、Gremlin は LPG のクエリ言語として機能します。 グレムリンにはたくさんのことがあるほぼユビキタスなサポートがあり、グラフの走査に対する多くの制御を提供するためです。 しかし、それが問題になることもあります。

グレムリンの一部 Apache ティンカーポップ project は命令型クエリ言語です。 これは、宣言的とは対照的に、 SQL、Cypher、SPARQL などのクエリ言語, Gremlin クエリは、何を取得するかを表現するだけでなく、どのように取得するかを指定する必要があります。 その点では、Gremlin はよりプログラミング言語に似ています。

Amazon Neptune アーキテクチャ。 Neptune の機能は、openCypher のサポートによって強化され、その武器庫にさらなる柔軟性をもたらします。

AWS

すべてのユーザーがすべてのシナリオで Gremlin を快適に使用できるわけではありません。 ただし、LPG モデルを使用したい場合は、それだけで済みました。 Amazon は、Apache Tinkerpop の主要な貢献者を何人か雇用しているにもかかわらず、このことを認めているようです。 openCypher のサポートを追加すると、Neptune での LPG エンジンの操作がより容易になります。

Neptune の LPG と RDF のサポートが可能になるのは、Neptune が各データ モデルに 1 つずつ、計 2 つの異なるエンジンを内部でホストしているためです。 openCypher のサポートを追加しても、少なくともまだそれは変わりません。 しかし、RDF* は可能性があります. RDF* (RDF Star とも呼ばれます) は、LPG グラフのモデル化も可能にする RDF 標準のアップデートです。

RDF 作業グループと LPG 作業グループの両方で、この分野での作業が進行中です。 Neptune を搭載した Amazon 以外にも、他の RDF ベンダーも openCypher の実験的サポートを追加しています。 ここでの全体像は、ISO によって承認された進行中の作業です。 GQL.

GQL はグラフ クエリ言語の新しい標準であり、今日の断片化された状況を統合することを目的としています。 SQL がリレーショナル データベースに対して行っていたことを、GQL がグラフ データベースに対して行うことが期待されています。 Amazon は、RDF* と GQL の両方の取り組みに積極的に取り組んでいます。

最終的には、Neptune が現在異なる 2 つのエンジンを統合できるようになるはずです。 しかし、ここでの話はAmazonだけではありません。 約束されているのは、Amazon が内部で実行できることは、すべてのグラフ データベース ユーザーがシステム全体で実行できるようにすることです。つまり、単一のデータ モデルと単一のクエリ言語を使用することです。

データ サイエンスと機械学習の機能: ノートブックとグラフ ニューラル ネットワーク

GQL にはまだ道のりがあります。 標準化の取り組みは常に複雑です、また採用が全面的に保証されているわけでもありません。 しかし、Neptune は、データ サイエンスと機械学習機能の統合という、グラフ データベースにおける別の重要な発展も例示しています。

グラフ アプリケーションの開発とグラフ結果の操作は、次の方法によって非常に容易になります。 IDE この目的に合わせて調整された視覚的な探索ツール。 多くのグラフ データベース ベンダーが自社製品にこれらの目的のための組み込みツールを組み込んでいますが、Neptune は最近までサードパーティの統合にのみ依存していました。

Neptune のチームがこのギャップに対処するために選んだ方法は、 AWS グラフノートブック. ノートブックはデータ サイエンティストや機械学習の実践者の間で非常に人気があり、コード、データ、視覚化、ドキュメントを組み合わせて共同作業することができます。

AWS Graph Notebook は、のためのオープンソース Python パッケージです。 ジュピターノートブック グラフの視覚化をサポートします。 Gremlin と SPARQL の両方をサポートしており、最終的には openCypher もサポートする予定です。 当初はデータ サイエンスや機械学習の分野で採用されていましたが、Amazon はノートブックが開発者の間でも普及すると信じているようです。

Neptune ML は、Amazon が同社の Neptune グラフ データベースと、SageMaker および DGL のグラフ機械学習機能の間の統合に与えたコード名です。

AWS

その賭けが報われるかどうかは待たなければなりません。 ただし、確かなことは、ノートブックのサポートを提供することで、データ サイエンスと機械学習のユースケースに対する Neptune の魅力が強化されるということです。 しかし、海王星がそこで提供できるのはそれだけではありません -- Enter ネプチューンML.

Amazon は、グラフ ニューラル ネットワーク (GNN) を使用してグラフ上で簡単、高速、正確な予測を行う方法として Neptune ML を宣伝しています。 Neptune ML の動力源は次のとおりです。 Amazon SageMaker そしてオープンソース ディープグラフライブラリ (DGL)、Amazon が貢献しています。

GNN は深層学習の比較的新しい分野であり、 データをグラフとしてモデル化して深層学習をトレーニングするためにモデル化できる追加のコンテキスト情報 アルゴリズム。 GNN は機械学習の最先端技術とみなされており、従来のニューラル ネットワークと比較して予測精度が向上します。

GNN とグラフ データベースの統合 自然な一致です。 GNN はノードレベルおよびエッジレベルの予測に使用できます。つまり、グラフ内の追加のデータと接続を推論できます。 これらを使用して、不正行為の予測、広告のターゲティング、顧客 360、レコメンデーション、ID 解決、ナレッジ グラフの完成などのユースケースのプロパティを推論するモデルをトレーニングできます。

繰り返しになりますが、製品にノートブックと機械学習を組み込んでいるのは Neptune だけではありません。 これらの機能は、データ サイエンスと機械学習の群衆に対応するだけでなく、開発者とエンドユーザーのエクスペリエンスもアップグレードします。 より優れたツール、より優れたデータ、より優れた分析 - これらはすべて、より優れたエンドユーザー アプリケーションにつながります。 それがすべてのベンダーが目指していることです。

これを読む

AI について知っておくべきことすべて

機械学習や一般的な AI からニューラル ネットワークまで、人工知能に関するエグゼクティブ ガイド。

今すぐ読む