Skip to main content

Hvad er talegenkendelse?

Hvad er talegenkendelse - TIPS & TRICKS til Max Manus Talegenkendelse (April 2025)

Hvad er talegenkendelse - TIPS & TRICKS til Max Manus Talegenkendelse (April 2025)
Anonim

Talegenkendelse er en teknologi, der tillader talet input til systemer. Du taler til din computer, telefon eller enhed, og den bruger det, du sagde som input for at udløse nogle handlinger. Teknologien bruges til at erstatte andre metoder til input som at skrive, klikke eller vælge på andre måder. Det er et middel til at gøre enheder og software mere brugervenlige og for at øge produktiviteten.

Der er masser af applikationer og områder, hvor talegenkendelse bruges, herunder militæret, som hjælp til handicappede (forestil dig en person med forkrøblede eller ingen hænder eller fingre), på det medicinske område, i robotik mv. I den nærmeste fremtid, næsten alle vil blive udsat for talegenkendelse på grund af sin udbredelse blandt almindelige enheder som computere og mobiltelefoner.

Visse smartphones gør interessant brug af talegenkendelse. IPhone og Android enheder er eksempler på det. Gennem dem kan du indlede et opkald til en kontakt ved blot at få talte instruktioner som 'Call office'. Andre kommandoer kan også blive underholdt, som 'Tænd Bluetooth'.

Problemer med talegenkendelse

Talegenkendelse, i sin version kaldet tale til tekst (STT), har også længe været brugt til at oversætte talte ord til tekst. "Du snakker, det taler", som ViaVoice ville sige på sin boks. Men der er et problem med STT som vi kender det. ViaVoice er en af ​​de bedste i branchen, så forestill dig resten. Teknologien er modnet og forbedret, men tale til tekst gør stadig folk stille spørgsmål. En af dens største vanskeligheder er de enorme variationer blandt mennesker i at udtale ord.

Ikke alle sprog formodes at være i talegenkendelse, og de, der gør det, understøttes ofte ikke så godt som engelsk. Som følge heraf udfører de fleste enheder, der kører talegenkendelse software, rimeligt kun på engelsk.

Et sæt hardwarekrav gør det vanskeligt at anvende talegenkendelse i visse tilfælde. Du har brug for en mikrofon, der er intelligent nok til at filtrere fra baggrundsstøj, men samtidig kraftig nok til at fange stemme naturligt.

Når det drejer sig om baggrundsstøj, kan det medføre, at et helt system mislykkes. Som følge heraf fejler talegenkendelse i mange tilfælde på grund af lyde, der er ude af brugerens kontrol.

Talegenkendelse viser sig at være bedre som inputmetode til nye telefoner og kommunikationsteknologier som VoIP, end som et produktivitetsværktøj til masseindtastning.

Anvendelser af talegenkendelse

Teknologien er ved at blive populær på mange områder og har haft succes i følgende:

  • Enhedskontrol. Bare at sige "OK Google" til en Android-telefon affyrer et system, der er helt ører til dine talekommandoer.
  • Bil Bluetooth-systemer. Mange biler er udstyret med et system, der forbinder sin radiomekanisme til din smartphone via Bluetooth. Du kan derefter foretage og modtage opkald uden at røre din smartphone, og kan endda ringe til numre ved blot at sige dem.
  • Voice transkription. I områder, hvor folk skal skrive meget, fanger nogle intelligente software deres talte ord og transkriberer dem til tekst. Dette er aktuelt i visse tekstbehandlingssoftware. Voice transkription virker også med visuel voicemail.