Les Panama Papers démontrent graphiquement la puissance de la base de données graphique

  • Oct 21, 2023

La technologie du data mining est mise à l’honneur grâce à l’histoire de 11,5 millions de fichiers.

personne avec des dossiers papier

Les bases de données graphiques montrent des relations cachées dans des quantités massives de données.

Image: Shannon Fagan, XiXinXing

Les bases de données graphiques ont fait leurs preuves avec la technologie utilisée pour analyser le Papiers panaméens.

La récente fuite de données du cabinet d'avocats panaméen Mossack Fonseca a captivé l'imagination du monde entier. en particulier les journalistes du Consortium international des journalistes d'investigation (ICIJ), basé à Washington, qui comprend Le gardien et la BBC dans sa liste de membres.

Le consortium a introduit les données divulguées dans une base de données graphique, en l'occurrence Neo4j, qui a analysé les données et a ensuite révélé le structure sous-jacente de ces données – illustrant ainsi les relations entre tous les individus, entreprises et clients impliqué.

Une base de données graphique est conçue, comme toute autre base de données, pour gérer de gros volumes de données. La différence est qu’une base de données graphique est conçue pour montrer toutes les relations au sein des données.

Voir également

La société de bases de données graphiques Neo4j, Neo Technology, obtient une augmentation de 20 millions de dollars

Lisez maintenant

La société de bases de données graphiques Neo4j, Neo Technology, obtient une augmentation de 20 millions de dollars

Au milieu d'une récente vague d'investissements dans les bases de données, Neo Technology, la société à l'origine de la base de données graphique Neo4j, a dévoilé sa propre injection de plusieurs millions.

Lisez maintenant

Les bases de données graphiques sont efficaces pour gérer des données hautement connectées et des requêtes complexes. Au lieu d'utiliser des tableaux, les graphiques utilisent des nœuds, des propriétés et des arêtes pour définir et stocker les données, ce qui les rend plus efficaces. analyser les relations et les interconnexions entre les données – et permettre aux journalistes de suivre plus facilement l'argent que jamais.

Comme l'explique Rik Van Bruggen, défenseur régional chez Neo4j: « Il s'agit d'une base de données graphique, pas d'une base de données graphique. Là où une base de données classique stocke des grilles de colonnes et de lignes, une base de données graphique utilise des structures graphiques pour les requêtes sémantiques avec des nœuds, des arêtes et des propriétés pour représenter et stocker les données.

La base de données graphique est une extension naturelle de la technologie des bases de données, a-t-il déclaré à ZDNet. "La technologie des bases de données existe depuis longtemps et dans les années 70 et 80, les gens l'ont vraiment comprise. Les bases de données graphiques sont relativement nouvelles, mais les gens commencent désormais à comprendre ce qui peut être fait avec cette technologie. »

Le cerveau en est le modèle. "L'esprit humain pense en termes d'idées, de concepts et de relations. Il en va de même pour une base de données graphique qui, si vous préférez, ressemble à un réseau neuronal. »

Fondée en 2007, Neo Technology est basée à Malmö, en Suède, et, selon Van Bruggen, compte actuellement 130 clients, dont beaucoup sont de « très grandes » organisations.

Il utilise une technologie open source disponible dans une édition communautaire sous licence GPL3 selon les termes de la licence gratuite. Licence publique générale Affero. La technologie est également disponible sous conditions de licence commerciale fermée.

La publication des Panama Papers n’est pas la première fois que Neo4j fait la une des journaux. L'année dernière, l'ICIJ a attiré l'attention de la presse pour avoir utilisé cette technologie avec la publication des détails de les dossiers HSBC.

"C'est un outil de découverte révolutionnaire qui a transformé notre processus de journalisme d'investigation", a déclaré Mar Cabra, directrice de l'unité de recherche de l'ICIJ. Pourquoi? "Parce que les relations sont toutes importantes pour vous dire où se situe la criminalité, qui travaille avec qui, etc. Comprendre les relations à grande échelle est le domaine où les techniques graphiques excellent."

Comme l'a dit Cabra, l'ICIJ « avait besoin d'une technologie capable de gérer ces volumes sans précédent de données hautement connectées rapidement, facilement et efficacement ». La base de données graphique est essentielle pour y parvenir.

Van Bruggen a souligné que les bases de données graphiques présentent également un énorme potentiel en dehors du journalisme. "Les humains ne sont pas les seuls à produire des informations de cette manière", a-t-il déclaré. « Et si c'était ton frigo? Vous pouvez en intégrer toutes les caractéristiques et cela peut être d’une grande aide pour découvrir pourquoi les choses se comportent d’une certaine manière. »

En savoir plus sur les bases de données graphiques

  • Avec l'accord IBM Power8 et le soutien d'Oracle pour le projet Cypher, la base de données graphique Neo4j 2.3 est désormais disponible
  • Microsoft et DataStax concluent un accord avec Cassandra sur Azure lors du déploiement de la nouvelle base de données graphique Titan
  • La société de bases de données graphiques Neo4j, Neo Technology, obtient une augmentation de 20 millions de dollars