Panama Papers grafisch tonen de kracht van de grafiek databank

Grafiek databases tonen relaties verborgen in enorme hoeveelheden gegevens.

Grafiek databanken hun waarde door de gebruikte technologie de Panama Papers analyse bleek.

De recente gegevens lekken van de Panamese advocatenkantoor Mossack Fonseca heeft de verbeelding van de wereld veroverd, en in het bijzonder journalisten van de Washington-based, International Consortium of Investigative Journalists (ICIJ), die The Guardian en de BBC omvat in haar ledenlijst.

Het consortium gevoed de gelekte gegevens in een grafisch gegevensbestand, in casu Neo4j, die de gegevens gemalen en vervolgens bleek de onderliggende structuur van de gegevens – aldus de relatie tussen elk van de personen, bedrijven en klanten betrokken illustreren.

Een grafisch gegevensbestand is ontworpen, zoals elke andere databank, om grote hoeveelheden gegevens te verwerken. Het verschil is dat een grafisch gegevensbestand is ontworpen om alle relaties binnen de gegevens blijkt.

Te midden van een golf van recente investering databank, Neo Technology, het bedrijf achter de leidende Neo4j grafiek database heeft zijn eigen miljoenen injectie onthuld.

Grafiek databases zijn goed in het beheren van zeer verbonden data en complexe queries. In plaats van tabellen, grafieken gebruiken nodes, eigenschappen en randen te definiëren en gegevensopslag, waardoor ze beter de verwerking van alle relaties en alle verbindingen tussen data – en waarop journalisten het geld gemakkelijker dan ooit volgen.

Zoals Rik Van Bruggen, een regionaal advocaat bij Neo4j, legde uit: “Het is een grafiek database en niet een grafische database waarin een regelmatige database slaat roosters van kolommen en rijen, een grafiek-database maakt gebruik van een grafiek structuren voor semantische query’s met knooppunten, randen. en eigenschappen te vertegenwoordigen en data op te slaan. ”

De grafiek database is een natuurlijke uitbreiding van de database-technologie, zei hij tegen de website. “Database-technologie is al een lange tijd en in de jaren ’70 en ’80 mensen echt begrepen. Graph databases zijn relatief nieuw, maar nu mensen beginnen te begrijpen wat er kan worden gedaan met die technologie.”

De hersenen is het model voor het. “De menselijke geest denkt in termen van ideeën, concepten en relaties. Dat doet een grafiek databank, die, als je wilt, is als een neuraal netwerk.”

Opgericht in 2007, is Neo Technology gevestigd in Malmö, Zweden, en volgens Van Bruggen, heeft momenteel 130 klanten, waarvan vele zijn “zeer groot” organisaties.

Het maakt gebruik van open source-technologie die verkrijgbaar is in een GPLv3 licentie community editie onder de voorwaarden van de vrije Affero General Public License. De technologie is ook beschikbaar onder closed-source commerciële licentievoorwaarden.

Met IBM Power8 deal en Oracle steun voor Cypher project, grafiek databank Neo4j 2.3 is nu uit, Microsoft en DataStax vastbinden Cassandra op Azure deal als nieuwe Titan grafiek database-rolt; Neo4j grafiek databank onderneming Neo Technology krijgt $ 20m lift

De release van de Panama Papers is niet de eerste keer dat Neo4j de krantenkoppen heeft gevangen. Vorig jaar werd de ICIJ ontvangen persaandacht voor het gebruik van de technologie met de release van details van de HSBC-bestanden.

Het is een revolutionaire ontdekking tool die ons onderzoeksjournalistiek proces is veranderd, “zei onderzoekseenheid richting de ICIJ Mar Cabra. Waarom?” Omdat relaties zijn allemaal belangrijk in je te vertellen waar de criminaliteit ligt, die werkt met wie, en ga zo maar door. Inzicht in relaties op grote schaal is waar grafiek technieken excelleren.

Zoals Cabra gezegd, de ICIJ “behoefte aan een technologie die deze ongekende hoeveelheden sterk verbonden gegevens snel kon verwerken, gemakkelijk en efficiënt”. De grafische database is van vitaal belang in de verwezenlijking van dit.

Van Bruggen wees erop dat de grafiek databases hebben ook enorm potentieel buiten de journalistiek. “Het is niet alleen mensen die informatie te produceren op deze manier,” zei hij. “Wat als het jouw koelkast was? Je zou kunnen voeden in alle kenmerken van dat en het kan een enorme hulp bij het vinden waarom de dingen zich gedragen op een bepaalde manier te zijn.

Social Enterprise; LinkedIn onthult haar nieuwe blogging platform; Big Data Analytics, Is dit de leeftijd van Big OLAP;? Big Data Analytics; DataRobot gericht op low-opknoping fruit van de gegevens wetenschap te automatiseren; Big Data Analytics; MapR oprichter John Schroeder treden naar beneden, COO te vervangen

grafiek databases

LinkedIn onthult haar nieuwe blogging platform

Is dit de leeftijd van Big OLAP?

DataRobot streeft naar laaghangend fruit van data science automatiseren

MapR oprichter John Schroeder treden naar beneden, COO te vervangen