Hvad er Big Data?
For virkeligt at forstå big data er det behjælpeligt at have en smule historisk baggrund. Gartners definition fra omkring 2001 beskriver det som: Big data er data, der indeholder en større mængde variation, der dukker op i større og større mængder og med større hastighed.
På engelsk giver det rimeligt belejligt tre V’er: Variation, Volume og Velocity. Med andre ord er Big Data større mere komplekse datasæt, specielt fra nyere datakilder. Disse datasæt kan være så omfattende, at traditionel dataprocesseringssoftware simpelthen ikke kan håndtere dem. Dog kan disse kæmpemæssige datamængder benyttes til at adressere reelle erhvervsmæssige problemer, som ikke kunne blive taklet før.
Big Datas tre V’er
-
Volumener mængden af data, der modtages. Med Big Data er det nødvendigt at processere store mængder af ustruktureret data med lav densitet. Dataen kan have ukendt værdi, såsom med Twitter datastrømme, clickstrømme på en hjemmeside, en mobilapp eller sensorudstyr. Visse virksomheder har at gøre med flere terabytes af data. For andre kan det være petabytes.
-
Velocityer hastigheden med hvilken data modtages og eventuelt håndteres. Normalt modtages den største hastighed af datastrømme direkte ind i hukommelsen snarere end på disken.
-
Variationreferer til de mange typer af data, der er tilgængelig. Traditionelle datatyper er struktureret og passer fint ind i en typisk database. Med Big Datas kommen, er der nu store mængder af nye ustrukturerede datatyper. Ustrukturerede og semistrukturererede datatyper som tekst, lyd og video kræver ekstra præprocessering for at udlede mening og give metadata.
Hvordan kan Big Data bruges?
Big Data kan bruges til at adressere en bred vifte af aktiviteter i erhvervslivet fra kundeservice til analyse. Her er der nogle få eksempler:
Produktudvikling
Virksomheder som Netflix kan bruge Big Data til at forudse efterspørgsel fra forbrugere. De bygger prædiktive modeller til at udvikle nye produkter og servicer. Det gøres ved at klassificere essentielle attributter ved fortidige og nuværende produkter eller servicer og modellere forholdet mellem disse attributter og kommerciel succes.
Prædiktiv vedligeholdelse
Faktorer, der forudser mekanisk fejlen, kan være dybt gemt i struktureret data som år, model eller udstyr, men kan også findes i ustruktureret data i form af millioner af logindslag, sensordata, fejlbeskeder og motortemperaturer. Ved at analysere disse indikationer før potentielle problemer opstår, kan virksomheder udføre billigere vedligeholdelse.
Kundeoplevelse
Big Data gør virksomheder i stand til at indsamle data fra sociale medier, websitebesøg og andre kilder til at forbedre interaktionsoplevelsen og maksimere den leverede værdi. Dette kan lade virksomheden personliggøre tilbud og aktivt håndtere problemer.