Skip to main content

Hvordan vil NLP udforme fremtiden for Tech?

Rajesh Rao: Computing a Rosetta Stone for the Indus script (Kan 2025)

Rajesh Rao: Computing a Rosetta Stone for the Indus script (Kan 2025)
Anonim

Naturlig sprogbehandling eller NLP er en gren af ​​kunstig intelligens, der har mange vigtige implikationer på måder, som computere og mennesker interagerer med. Mennesket sprog udviklet over tusinder og tusinder af år er blevet en nuanceret form for kommunikation, der bærer et væld af oplysninger, der ofte overskrider ordene alene. NLP bliver en vigtig teknologi til at overbygge kløften mellem menneskelig kommunikation og digitale data. Her er 5 måder, hvorpå naturlig sprogbehandling vil blive brugt i de kommende år.

Maskinoversættelse

Da verdens oplysninger er online, bliver det stadig vigtigere at oprette dataene. Udfordringen med at gøre verdens information tilgængelig for alle på tværs af sprogbarrierer har simpelthen vokset ud af kapaciteten til menneskelig oversættelse. Innovative virksomheder som Duolingo søger at rekruttere store mængder mennesker til at bidrage ved at sammenfatte oversættelsesindsatsen med at lære et nyt sprog. Men maskinoversættelse giver et endnu mere skalerbart alternativ til harmonisering af verdensoplysninger. Google er et firma i spidsen for maskinoversættelse, ved hjælp af en proprietær statistisk motor til sin Google-oversættelsestjeneste. Udfordringen med maskinoversættelsesteknologier er ikke i at oversætte ord, men i at bevare meningen med sætninger, et komplekst teknologisk problem, der er kernen i NLP.

Bekæmpelse af spam

Spamfiltre er blevet vigtige som den første forsvarslinje mod det stadigt stigende problem med uønsket email. Men næsten alle, der bruger email i vid udstrækning, har oplevet smerte over uønskede e-mails, der stadig er modtaget, eller vigtige e-mails, der ved et uheld er fanget i filteret. De falsk-positive og falsk-negative problemer med spamfiltre er kernen i NLP-teknologien og koger igen til udfordringen med at uddrage mening fra tekststrenger. En teknologi, der har fået meget opmærksomhed, er Bayesian spamfiltrering, en statistisk teknik, hvor forekomsten af ​​ord i en e-mail måles mod dens typiske begivenhed i et corpus af spam- og ikke-spam-e-mails.

Information Udtræk

Mange vigtige beslutninger på de finansielle markeder er i stigende grad væk fra menneskets tilsyn og kontrol. Algoritmisk handel bliver mere populær, en form for finansielle investeringer, der udelukkende styres af teknologien. Men mange af disse finansielle beslutninger påvirkes af nyheden, af journalistik, der stadig er præsenteret overvejende på engelsk. En stor opgave, da NLP er blevet at tage disse plaintext meddelelser, og udvinde den relevante info i et format, der kan inddrages i algoritmiske handelsbeslutninger. Nyheder om fusion mellem virksomheder kan for eksempel have stor indflydelse på handelsbeslutninger, og den hastighed, hvormed oplysningerne om fusionen, aktørerne, priserne, der erhverver hvem der kan indarbejdes i en handelsalgoritme, kan have gevinstimplikationer i millioner af dollars.

sammendrag

Information overbelastning er et reelt fænomen i vores digitale tidsalder, og allerede vores adgang til viden og information overstiger langt vores evne til at forstå det. Dette er en tendens, der ikke viser tegn på at bremse ned, og derfor bliver en evne til at opsummere betydningen af ​​dokumenter og informationer stadig vigtigere. Dette er vigtigt ikke kun for at give os mulighed for at genkende og absorbere de relevante oplysninger fra store mængder data. Et andet ønsket resultat er at forstå dybere følelsesmæssige betydninger, for eksempel baseret på aggregerede data fra sociale medier, kan et firma bestemme den generelle stemning for sit seneste produktudbud? Denne filial af NLP bliver mere og mere nyttig som et værdifuldt markedsføringsaktiv.

Spørgsmål svarende

Søgemaskiner sætter verdens rigdom af information lige ved hånden, men er stadig generelt ret primitive, når det gælder at besvare specifikke spørgsmål stillet af mennesker. Google har set den frustration, dette har forårsaget hos brugere, som ofte har brug for at prøve et antal forskellige søgeresultater for at finde svaret, de søger. Et stort fokus på Googles indsats i NLP har været at genkende natursprogspørgsmål, udtrække betydningen og give svaret, og udviklingen på Googles resultatside har vist dette fokus. Selvom det helt sikkert forbedrer, er dette fortsat en stor udfordring for søgemaskiner, og en af ​​de vigtigste anvendelser af natursprogsforarbejdning.