Med IBM Power8-aftale og Oracle-støtte til Cypher-projektet er grafdatabasen Neo4j 2.3 nu ude

  • Oct 19, 2023

Ud over nye funktioner i den seneste udgivelse af grafdatabasen bliver Neo4j tunet til IBM-hardware, mens Neos forespørgselssprog Cypher får sit eget open source-projekt.

Læs dette

Se på, hvad Google og Amazon laver med databaser: Det er din fremtid

Læs nu

Samt at udskille forespørgselssproget Cypher til sit eget open source-projekt og en ny aftale med IBM over Power8 hardware har Neo Technology også afsløret den seneste version af sin populære Neo4j graf database.

Ved at eliminere Java virtuel maskine-baseret objektcache er release 2.3 designet til at tilbyde højere samtidig ydeevne i skala. Der er også bedre Cypher-ydeevne gennem forbedringer af forespørgselsplanlæggeren, ifølge Neo.

"Neo4j 2.3 markerer kulminationen på næsten to års ingeniørarbejde for at flytte hele databasecachen til et andet lag, ud af JVM'en og ud heap fra JVM og til en sidecache på lavt niveau i hukommelsen, som vi har designet specielt til at håndtere grafarbejdsbelastninger," Neo Technology products VP Philip Rathle sagde.

"Java er ekstremt god og effektiv til mange ting. Hvad den ikke er så god til, er, hvis du inde i din virtuelle Java-maskine forsøger at gemme databasecachen. Så hvad der sker med meget høje arbejdsbelastninger er, at du ender med at churne data i cachen. Vi har haft kunder med gigabyte data per sekund, der kommer ind og ud af JVM."

Den resulterende affaldsindsamlingsproces forårsager forsinkelser og kan involvere brugere med kompleks Java-tuning.

"Du ønsker virkelig, at din database bare skal fungere og bare være robust og pålidelig. Så ved at flytte cachen fra JVM-bunken, ser vi inde i vores egne interne tests såvel som nogle kunder, der har været en del af betaprogrammet meget bedre skalerbarhed og kun generel adfærd, da datasættene bliver meget store," Rathle sagde.

Den tidligere 2.2-udgivelse tilbød forbedringer i samtidig skrivegennemstrømning, hvor 10 gange mere blev skubbet data ind.

"Dette gør noget lignende for læsninger. Vi har i vores test med realistiske kundearbejdsbelastninger set stigninger på op til syv gange på større maskiner med flertrådede arbejdsbelastninger," sagde han.

Se også

Microsoft leverer stille og roligt første preview af Graph Engine

Læs nu

Open-source Neo4j grafdatabasen bruges af virksomheder som eBay, Wal-Mart og UBS. Grafdatabaser bruger noder og forbindelserne mellem dem til at beskrive netværk og sammenhænge.

Sidste år forudsagde Forrester Research, at lidt over en fjerdedel af virksomhederne vil bruge sådanne databaser i 2017 til at understøtte næste generations forretningsapplikationer, der har brug for forbundne datasæt.

I Neo4j 2.3 er forespørgselsplanlæggeren, som bruger det mønster, der er beskrevet i Cypher-forespørgslen til at beregne den hurtigste og billigste måde at få den nødvendige information på, blevet forbedret.

"Selv for en simpel forespørgsel kan der bogstaveligt talt være hundredvis af millioner af måder, hvorpå databasen kunne få dataene. Den bedste vej kan variere meget, baseret på dataene og hvordan de er forbundet, og hvor meget af én type ting du har i forhold til en anden,” sagde Rathle.

"Forespørgselsplanlæggeren, som vi udgav tidligere i år, var vores første indtog i omkostningsbaseret planlægning, som tager hensyn til både forespørgslens form og formen og mængden af ​​data. Vi har gjort det meget bedre i 2.3. Det understøtter en række nye algoritmer til virkelig nogle vigtige forespørgsler, herunder nogle, der er meget almindelige i anbefalinger."

Andre forbedringer i version 2.3 er strengforbedrede grafsøgninger og database-tvungent skema for at sikre, at specificerede egenskaber altid eksisterer for givne noder og relationer. Der er også et fuldt understøttet Neo4j-dataintegrationsbibliotek til Spring Framework.

På driftssiden bringer Neo4j officiel support til Docker-containere og til PowerShell sammen med et Mac-installationsprogram og en launcher.

Under partnerskabet med IBM vil det avancerede Power8-system med stor hukommelseskapacitet blive tilbudt med Neo4j-database, især rettet svindeldetektion, storstilede anbefalinger og Internet-of-Things applikationer.

"Vores ingeniørteam arbejder sammen med IBM's hardware ingeniørteams for at optimere både Neo4j og Power8 platforme for at kunne behandle ekstremt store grafer meget hurtigere og med meget højere hastigheder end noget, der har været muligt. Vi forventer, at det vil skubbe det nyeste med formentlig 10 gange," sagde Rathle.

Målet med openCypher open source-projektet vil være oprettelsen af ​​en sprogspecifikation, en referenceimplementering, et teknologikompatibilitetssæt og referencedokumentation.

De første tilhængere af projektet inkluderer Oracle, Apache Spark-firmaet Databricks, Tableau, GraphAware, GrapheneDB, Graph Story, GraphGrid, Information Analysis Incorporated, Linkurious, Structr og Tom Sawyer Software.

"Forespørgselssproget er noget, vi har brugt år på at forfine - det er faktisk vores tredje forsøg på et forespørgselssprog. Det har virkelig skabt en stærk base for adoption, hvor de fleste mennesker, der lærer grafdatabaser i dag, lærer ved hjælp af Cypher-forespørgselssproget," sagde han.

Mere om grafdatabaser og Neo4j

  • DataStax tager Aurelius og dets Titan-team op for at bygge en ny grafdatabase
  • Microsoft og DataStax binder Cassandra på Azure-aftalen, efterhånden som den nye Titan-grafdatabase lanceres
  • Microsoft leverer stille og roligt første preview af Graph Engine
  • Neo4j grafdatabasefirmaet Neo Technology får 20 millioner dollars løft
  • Se på, hvad Google og Amazon laver med databaser: Det er din fremtid