Big Data: Visualisering giver ny indsigt

Løsninger fra Skyen har åbnet adgang til enorme mængder af data fra et voksende antal kilder, men der er brug for nye værktøjer til at skabe mening og overblik.

Betegnelsen “Big Data” dækker ikke blot over store mængder af data. 

For at være “Big Data” skal der ikke alene være “Volumen”. Der skal også være data fra mange forskellige typer af kilder, eller såkaldt “Variation”. Desuden skal der være mulighed for at følge de forskellige datastrømme over tid, såkaldt “Velocity”. I nogle definitioner er der et fjerde “V”, nemlig “Veracity”, der repræsenterer kvaliteten eller troværdigheden af data.

Så Big Data er altså ikke bare en meget stor SQL-database, men er en kvalitativ anden tilgang til data, der har mindre fokus på “opslag” og langt mere fokus på analyse.

For de fleste praktiske formål hænger Big Data tæt sammen med løsninger fra Skyen, fordi det er i Skyen man finder de store datasæt fra mange forskellige kilder, hvoraf en del bliver løbende opdateret.

Det er desuden i Skyen, at man kan få adgang til de avancerede redskaber og de store mængder af computerkraft, der skal til for at arbejde med Big Data.

En af de store udfordringer ved at anvende Big Data er, at der hurtigt kan blive tale om så store datamængder og så dynamiske forløb, både i forhold til typen af data og i tempoet af opdateringen, at det bliver uoverskueligt at følge med i, hvad der sker.

En af måderne til at løse denne udfordring er at føre datastrømmene fra Big Data-maskinen ind i et visuelt univers, der giver brugerne mulighed for at følge dynamiske dataforløb i et grafisk format.

Frem for at brugerne af data skal arbejde sig igennem lange rækker af datatabeller og på den måde forsøge at skaffe sig et overblik over tendenser og sammenhænge, så kan visualisering give brugeren et helt umiddelbart overblik over et stort og kompliceret datamateriale.

Et godt eksempel på denne udvikling stammer fra Carnegie Mellon University’s Community Robotics, Education, and Technology Empowerment (CREATE) Lab hvor en gruppe forskere for nylig har offentliggjort et redskab, der kan visualisere den globale strøm af flygtninge i perioden 2000 til 2015.

Løsningen bygger på data fra FN’s flygtninge-afdeling, UNCHR, der i en lang række rapporter tilbyder en overflod af informationer om millioner af flygtninge fra hele verden. Men i praksis er informationsmængden fuldstændig uoverskuelig for langt de fleste brugere.

Med løsningen fra CREATE kan enhver på på ganske kort tid skaffe sig et kalejdoskopisk overblik over indholdet af femten års rapporter med data om, hvor flygtningene kommer fra, hvor de tager hen, hvor mange der flygter, hvilke ruter, der benyttes til flugten, udviklingen i flygtningestrømmene over tid, og meget mere.

Klik på linket under billedet og se selv, hvordan det virker.Klik her for at se visualiseringen af de globale flygtningestrømme

Visualisering bruges i stigende grad inden for markedsanalyse og strategiudvikling, hvor Big Data-løsninger anvendes til at samle og systematisere informationer fra et enormt datamateriale, og hvor visualiseringen efterfølgende kan bidrage til at gøre det hele brugbart.

Det kan være analyser af indkøbsmønsteret i julehandlen, trafikmønsteret i metroen eller den globale handel med Bitcoins, sådan som det bliver vist og forklaret i videoen nedenfor.

Videoen om Bitcoin-markedet stammer fra Imperial College London, der i samarbejde med KPMG har etableret Europas største center for data-visualisering.


Foto: Visualisation Lab – Imperial College London, 2017

Henvisninger og baggrund: 26.06.2017


Med dette indlæg runder Pejlinger et skarpt hjørne med 150 indlæg siden starten i 2014. Pejlinger holder nu sommerferie, og er tilbage igen i august med flere historier om Revolutionen fra Skyen.