Data mining er analysen af store mængder data for at opdage mønstre og viden. Faktisk er data mining også kendt som data opdagelse eller viden opdagelse.
Data mining bruger statistikker, principper for maskinindlæring (ML), kunstig intelligens (AI) og enorme mængder data (ofte fra databaser eller datasæt) for at identificere mønstre på en måde, der er så automatiseret og nyttig som muligt.
Hvad Gør Data Mining?
Data mining har to primære mål: beskrivelse og forudsigelse. For det første beskriver data mining de indsigter og viden, der er opnået ved at analysere mønstre i data. For det andet bruger data mining beskrivelserne af anerkendte datamønstre til at forudsige fremtidige mønstre.
Hvis du f.eks. Har brugt tid på at surfe på et shoppingwebsted for bøger om, hvordan du identificerer forskellige typer af planter, logger de data miningstjenester, der arbejder bag kulisserne på hjemmesiden, en beskrivelse af dine søgninger i forbindelse med din profil. Når du logger ind igen to uger senere, bruger hjemmesiden dataudvindingstjenester beskrivelserne af dine tidligere søgninger til at forudsige dine aktuelle interesser og tilbyder personlige indkøbsrekommendationer, der indeholder bøger om identifikation af planter.
Hvordan Data Mining Works
Data mining virker ved hjælp af algoritmer, sæt af instruktioner, der fortæller en computer eller behandler, hvordan man gør en opgave, for at finde forskellige typer mønstre inden for data. Nogle af de forskellige mønstergenkendelsesmetoder, der anvendes til dataudvinding, omfatter klyngeanalyse, anomalitetsdetektering, associeringsindlæring, dataafhængigheder, beslutningstræer, regressionsmodeller, klassifikationer, outlierdetektion og neurale netværk.
Selvom data mining kan bruges til at beskrive og forudsige mønstre i alle forskellige typer data, er det ofte, at mange mennesker støder på, selvom de ikke er klar over det, at beskrive mønstre i dine indkøbsvalg og -adfærd for at forudsige sandsynlige fremtidige indkøb beslutninger.
Har du nogensinde spekuleret på, hvordan Facebook altid synes at vide, hvad du har kigget på online, og viser dig annoncer i din newsfeed relateret til andre websteder, du har besøgt eller dine websøgninger? Facebook data mining bruger oplysninger gemt i din browser, der sporer dine aktiviteter, såsom cookies, sammen med sin egen viden om dine mønstre baseret på din tidligere brug af Facebooks service for at opdage og forudsige produkter eller tilbud, du måtte være interesseret i.
Hvilke slags data kan udvindes?
Afhængig af service eller butik (fysiske butikker bruger data mining også), kan en overraskende mængde data om dig og dine mønstre blive udvundet. Data indsamlet om dig kan omfatte hvilken type køretøj du kører, hvor du bor, steder du har rejst, magasiner og aviser, du abonnerer på, og om du er gift eller ej. Det kan også afgøre, om du har børn, hvad dine hobbyer er, hvilket band du kan lide, dine politiske skæbne, hvad du køber online, hvad du køber i fysiske butikker (ofte via kundeloyalitetsbelønningskort) og eventuelle detaljer du deler om dit liv på sociale medier.
For eksempel bruger detailhandlere og modebaserede publikationer rettet mod teenagere indsigt fra data mining billeder på sociale medier tjenester som Instagram og Facebook for at forudsige modetrends, der vil lokke i teenagehandlere eller læsere. Indsigterne opdaget ved data mining kan være så præcise, at nogle detailhandlere endda kan forudsige, om en kvinde kan være gravid, baseret på meget specifikke ændringer i hendes købsvalg. Detailhandleren Target er rapporteret at være så præcis med at forudsige graviditet baseret på mønstre i at købe historie, at den sendte kuponer til babyprodukter til en ung dame, og gav hendes graviditet hemmelighed, før hun fortalte hendes familie.
Data minedrift er overalt, men meget af de opdagede oplysninger og analyser om vores købevaner, personlige præferencer, valgmuligheder, økonomi og onlineaktiviteter bruges af butikker og tjenester med det formål at forbedre kundeoplevelsen.