Skip to main content

Hvad præcis er 'store data'?

Smooth RnB Backing Track in C# Minor (April 2025)

Smooth RnB Backing Track in C# Minor (April 2025)
Anonim

'Store data' er den nye videnskab om forståelse og forudsigelse af menneskelig adfærd ved at studere store mængder ustrukturerede data. Store data kaldes også 'predictive analytics'.

Analysering af Twitter-indlæg, Facebook-feeds, eBay-søgninger, GPS trackers og ATM-maskiner er nogle store data eksempler. Studerende af sikkerhedsvideoer, trafikdata, vejrmønstre, flyopkomster, tårnbøger til mobiltelefoner og hjertefrekvenssporere er andre former. Store data er en rodet ny videnskab, der skifter hver uge, og kun få eksperter forstår det hele.

Hvad er nogle eksempler på store data i regelmæssigt liv?

Mens de fleste store dataprojekter er meget uklare, er der gode eksempler på store data, der påvirker hverdagen for enkeltpersoner, virksomheder og regeringer:

Forudsiger virusudbrud: ved at studere socio-politiske data, vejr og klima data og hospital / kliniske data, forudsiger disse forskere nu udbrud med udbrud med udbrud med 4 uger.

Homicide Watch: disse store dataprojektprofiler myrder ofre, mistænkte og kriminelle i Washington, DC. Både som en måde at ære den afdøde og som en bevidsthedsressource for mennesker er dette store dataprojekt fascinerende.

Transit Travel Planning, NYC: WNYC radioprogrammer Steve Melendez kombinerede online-undergrundsplanen med rejseplanlægningen. Hans skabelse gør det muligt for New Yorkere at klikke på deres placering på kortet, og der vises en forventning om rejsetid for tog og metro.

Xerox reducerede deres arbejdsstyrke tab: call center arbejde er følelsesmæssigt udmattende. Xerox har studeret dataoverflader ved hjælp af professionelle analytikere, og nu kan de forudsige, hvilke callcenterhyrer der sandsynligvis vil være hos selskabet den længste.

Støtte til terrorbekæmpelse: Ved at studere sociale medier, regnskaber, flyreservationer og sikkerhedsdata kan retshåndhævelse forudsige og lokalisere terroristlige mistænkte, før de gør deres onde handlinger.

Justering af brand marketing baseret på sociale medier anmeldelser: Folk deler hurtigt og hurtigt deres online tanker på en pub, restaurant eller fitness klub. Det er muligt at studere disse millioner af sociale medier indlæg og give feedback til virksomheden om, hvad folk tænker på deres tjenester.

Hvem bruger store data? Hvad gør de med det?

Mange monolitiske virksomheder bruger store data til at tilpasse deres tilbud og priser for at maksimere kundetilfredsheden.

  • Macy's stormagasin, for eksempel bruger store data til at justere deres priser på flugt for over 70 millioner produkter. De sender endda tilpassede e-mails til deres kunder baseret på, hvad Macy mener, at de er interesserede i.
  • Politiets reaktion på Boston marathon bombningen: Ved at bruge store data til at studere video- og overvågningsbilleder kunne politiet hurtigt indsnævre deres søgning efter de mistænkte.
  • Mortons Steakhouse bruger Twitter til at trække af marketing stunts, herunder den berømte New Jersey lufthavn levering af en porterhouse bøf og rejer middag.
  • Visa bruger store data til at identificere og fange svindlere.Enkelttransaktioner her og her kan nemt skjule en uærlig kreditkortbruger, men ved at overvåge millioner af transaktioner omhyggeligt, kan der opdages mønstre af bedrageri.
  • Facebook bruger store data til at skræddersy reklame. Ved at omhyggeligt studere dine FB-likes og browsing-vaner har social media-giganten en uhyggelig indsigt i din smag. De sidebarannoncer, du ser på dit Facebook-feed, vælges af meget bevidste og komplekse algoritmer, der har set dine Facebook-vaner.

Hvorfor er store data sådan en stor aftale?

4 ting gør store data signifikante:

1. Dataene er massive. Det passer ikke til en enkelt harddisk, meget mindre en USB-stick. Mængden af ​​data overstiger langt det menneskelige sind kan opfatte (tænk på en milliard milliard megabyte og multiplicere det med flere milliarder).

2. Dataene er rodet og ustruktureret. 50% til 80% af det store datafunktion er at konvertere og rense informationen, så det kan søges og sorteres. Kun få tusinde eksperter på vores planet ved fuldt ud, hvordan man gør denne dataoprydning. Disse eksperter har også brug for meget specialiserede værktøjer, som HPE og Hadoop, for at gøre deres håndværk. Måske om 10 år vil store datagrupper blive et dime et dusin, men for nu er de en meget sjælden art analytiker, og deres arbejde er stadig meget uklart og kedeligt.

3. Data er blevet en vare **, der kan sælges og købes. Data markedspladser findes, hvor virksomheder og enkeltpersoner kan købe terabyte af sociale medier og andre data. De fleste af dataene er skybaserede, da de er for store til at passe ind på en enkelt harddisk. Køb af data involverer almindeligvis et abonnementsgebyr, hvor du tilslutter dig en cloud server farm.

** Ledere af store datalogger og ideer er Amazon, Google, Facebook og Yahoo. Fordi disse virksomheder tjener så mange millioner af mennesker med deres onlinetjenester, er det fornuftigt, at de ville være samlingspunktet og de visionære bag store dataanalyser.

4. Muligheden for store data er uendelige. Måske vil læger måske en dag forudsige hjerteanfald og slagtilfælde for personer uger før de sker. Luftfartøjs- og bilulykker kan reduceres ved hjælp af prædiktive analyser af deres mekaniske data og trafik- og vejrmønstre. Online dating kan forbedres ved at have store data forudsigere af, hvem der er kompatible personligheder for dig. Musikere kan få indsigt i, hvilken musiksammensætning der er mest tilfredsstillende for målgruppens skiftende smag.Ernæringseksperter kan muligvis forudsige, hvilken kombination af købte fødevarer vil forværre eller hjælpe en persons medicinske forhold. Overfladen er kun blevet ridset, og opdagelser i store data sker hver uge.

Store data er rodet

Store data er forudsigende analyser: Konvertering af massive ustrukturerede data til noget, der kan søges og sorteres. Dette er et rodet og kaotisk rum, der kræver en særlig form for viden og tålmodighed.

Tag for eksempel den monolitiske UPS-leveringstjeneste. Programmørerne ved UPS studerer data fra deres bilers GPS og smartphones for at analysere de mest effektive måder at tilpasse sig trafikbelastning. Denne GPS og smartphone data er gigantiske, og ikke automatisk klar til analyse. Disse data indlæses fra forskellige GPS- og kortdatabaser via forskellige smartphone hardware enheder. UPS analytikere har brugt måneder at konvertere alle de data til et format, der let kan søges og sorteret. Indsatsen har dog været det værd. I dag har UPS sparet over 8 millioner gallons brændstof, da de begyndte at bruge disse store dataanalyser.

Fordi store data er rodet og kræver så meget arbejde med at oprydning og forberede sig på brug, er datavidenskabere blevet tilnavnet "datakonsulenter" for alt det kedelige arbejde, de gør.

Videnskaben om store data og prædiktiv analyse forbedres dog hver uge. Forvent at store data bliver let tilgængelige for alle inden år 2025.

Er ikke store data en påtrængende trussel mod privatlivets fred?

Ja, hvis vores love og individuelle beskyttelse af personlige oplysninger ikke forvaltes omhyggeligt, så går store data ind i privatlivets fred. Som det står, sporer Google og YouTube og Facebook allerede dine daglige onlinevaner. Din smartphone og computing liv efterlader digitale fodspor hver dag, og sofistikerede virksomheder studerer disse fodspor.

Loven omkring store data udvikler sig. Privatliv er en tilstand af at være, at du nu skal tage personligt ansvar for, da du ikke længere kan forvente det som en standardret.

Hvad du kan gøre for at beskytte dit privatliv:

Det største enkeltstrin du kan tage er at afklæde dine daglige vaner ved hjælp af en VPN-netværksforbindelse. En VPN-tjeneste vil scramble dit signal, så din identitet og placering er i det mindste delvist maskeret fra trackers. Dette vil ikke gøre dig 100% anonym, men en VPN vil væsentligt reducere, hvor meget verden kan observere dine onlinevaner.

Hvor kan jeg lære mere om store data?

Store data er en fascinerende ting for mennesker med analytiske sind og en kærlighed til tech. Hvis det er dig, så besøg venligst denne side af interessante store dataprojekter.