Bliver talegenkendelse fremtidens login?

Brian Krogh Jensen er afdelingschef hos TDCs datterselskab NetDesign, hvor han yder strategisk rådgivning om virksomheders forretningsarkitektur. Han har været med siden de første talegenkendelses-systemer så dagens lys medio 1990-erne og giver her sit bud på, hvad teknologien fremadrettet kommer til at betyde for danskerne.
Anika Lüdeke Dueholm

Anika Dueholm

1. januar 0001

”Teknologi effektiviserer og gør hverdagen nemmere, men upersonlig teknologi kan godt skabe distance mellem mennesker. Talegenkendelse tilfører samarbejde og kommunikation et menneskeligt og personligt nærvær, der styrker relationer både mellem kolleger, kunder og andre interessenter. Derfor er talegenkendelse lige nu en af de absolut mest spændende teknologier som relationsskaber og katalysator for danske virksomheders konkurrenceevne.”

Talegenkendelse bliver i dag brugt inden for forretningsområderne opkaldsstyring, stemme-login og tale-til-tekst (digital diktering/transskribering). Digital diktering er i dag meget udbredt i sundhedssektoren, men opkaldsstyring og stemme-login er lige nu på hastig fremmarch.”
Opkaldsstyring: Talestyret viderestilling af opkald
Blot ved at stille sit spørgsmål/beskrive sit ærinde bliver kunden stillet direkte videre til rette person/funktion i stedet for at skulle trykke sig igennem en menu af lange, prædefinerede specifikationstræer. Helt almindelige sætninger som ”Jeg vil gerne tale med en om bilforsikring” eller ”Jeg har problemer med forskudsregistreringen for 2014” kan forstås af talegenkendelsen, fordi den via analyse og træning har en indbygget logik.

Brian Krogh Jensen

Biometri defineres som entydige, målbare data, der via computerprocessering kan be- eller afkræfte en persons identitet. Det kan fx være en analyse af iris, fingeraftryk, ansigt eller stemme

”Hver enkelt virksomhed udvikler sin individuelle talegenkendelse. Først analyseres de første 20 ord i 5.000 kundeopkald. Herefter bliver talegenkendelses-systemet programmeret til at fange nøgleord, produktnavne og dialekter, som er relevante for den aktuelle virksomhed. Og til sidst trænes systemet via 20 – 25.000 opkald, som giver den sidste fintuning.

Når kunderne ringer ind, sker der en automatisk analyse af stemmen, hvor nøgleord bliver trukket ud og slået op i databasen, så kaldet kan viderestilles i forhold til det aktuelle emne, funktion, produkt eller kontaktperson. Systemet kan endda lære at stille spørgsmål – fx om, hvor kunden bor, så kald kan stilles videre til et lokalt kundecenter.”

Er fremtidens opkaldsstyring noget for jeres virksomhed?
”Etablering af talegenkendelses-systemer til præcis viderestilling af opkald kræver volumen, og lige nu er det kun relevant for større kontaktcentre. Mit bud er, at de store virksomheder, der udveksler erfaring, i fremtiden vil gøre det ved at lægge systemerne i skyen, hvorfra små og mellemstore virksomheder kan abonnere på de funktioner, de har brug for. Så om få år vil alle kunne købe opkaldsstyring som en cloud-baseret tjeneste.

Fordelene er indlysende: Kunden oplever forbedret kundeservice, fordi han hurtigt og præcist bliver guidet videre til rette vedkommende. Kunden føler sig individuelt hørt, fordi han bruger sin stemme. Og summen af kundetilfredshed og effektivisering giver virksomheden en stor forretningsmæssig gevinst".

Stemme-password: Sådan virker det

Talegenkendelse fremtiden

Stemme-password: Sådan virker det

”Vores samfund har generelt et stort behov for teknologisk identifikation af personer. Både når kunder kontakter virksomheder, når borgere kontakter offentlige servicefunktioner, når medarbejdere skal logge sig ind på diverse systemer – og når folk skal logge sig på alt lige fra netbank til køb af en TV kanal, film eller boksekamp.

Den matematiske model til genkendelse af en stemme er baseret på intonation og frekvens. Første gang personen ringer for at oprette sit stemme-password, skal maskinen lære personens identitet og stemme at kende. Her skal personen typisk gentage tre forskellige sætninger, som er sammensat af den optimale kombination af temposkift plus lyse og høje toner.

 Det er helt ligegyldigt, om man taler sønderjysk, fynsk eller bornholmsk, og computeren kan også genkende stemmen, selvom man er forkølet. Når personen efterfølgende ringer op, vælger systemet den sætning, man skal gentage, og systemet vil typisk også give mulighed for personlige sætninger, så login-oplevelsen bliver endnu mere personlig.”

Er stemme-password fremtiden?
”Ja! Og det kommer til at rulle stærkt. De biometriske data, der kan indlæses via tilgængelige sensorer vinder. Mikrofoner og højttalere er jo sensorer, der er indbygget overalt. Om 1-2 år tror jeg på, man kan bruge sin stemme til at logge på netbank og alle mulige andre services, som vi har adgang til via mobil, tablet og web.”