Kontekst: At kunne tale med verden

Digitale Assistenter har åbnet et vindue til en verden, hvor vi kan tale med computere. Vinduet står indtil videre kun på klem. Når det åbner helt, vil det føre til den næste store It-revolution.

Et lille barn har en veludviklet evne for kommunikation allerede inden, det har lært at tale.

Barnet tolker og reagerer på henvendelser fra en voksen ud fra den sammenhæng, der omgiver den voksne og barnet, også kaldet konteksten.

Det er en yderst kompleks proces, som barnet praktiserer, når det fortolker en kommunikation på baggrund af den sammenhæng, som kommunikationen foregår i.

Men forståelsen af sammenhæng, eller kontekst, er afgørende for, at barnet senere kan anvende sit sprog på en forståelig måde.

Ordene i sig selv giver ikke megen mening, hvis de ikke bliver brugt i en relevant kontekst.

Går der kludder i konteksten hopper kæden af, og man taler forbi hinanden.

Den største barriere for at kunne tale med en computer er, at computeren ikke forstår kontekst.

For en computer er “talegenkendelse” forholdsvis lige ud ad landevejen.

Det er muligt at lære computeren lyden af en masse ord, ét for ét, baseret på det, som en computer er fantastisk god til, nemlig at huske.

Hvis talegenkendelse skal fungere godt, kræves der – ud over fancy software – adgang til store mængder computerkraft.

I dag er det ikke noget problem.

Fancy software er der masser af, og en almindelig smartphone har i dag betydeligt mere rå computerkraft at gøre godt med, end den samlede computerkraft, som Houston havde til rådighed til at styre mennesker frem til Månen.

Men uanset hvor meget computerkraft, der måtte være til rådighed, ville det ikke kunne få en computer til at kunne forstå kontekst.

Kontekst er en afvejning af en masse forskellige former for input – synsindtryk, hørelse, bevægelse, temperatur, og meget mere – og denne komplekse “afvejning” skal foretages i realtid på grundlag af en kulturel kode, der ikke let lader sig omsætte til computer-kode.

Tale i kontekst er i dag den hellige gral inden for computing.

De store tech-firmaer og et stort antal startups investerer milliarder i forskning og udvikling for at opnå et gennembrud inden for, hvad der med sikkerhed bliver den næste store revolution inden for It, nemlig systemer, der forstår tale i kontekst, og som kan samtale og agere på grundlag af en afvejning af kontekst i realtid.

Én af de mange startups er RobinLabs, der arbejder på at udvikle et teknologisk fundament for forståelse af tale i kontekst.

Løsningen består af en mængde standardiserede byggeklodser, der skal kunne bygges sammen til løsninger, der passer til den konkrete sammenhæng, som løsningen skal anvendes i, som for eksempel stemmestyring af en maskine eller en bil.

Det er løsninger fra Skyen i kombination med Smartphones, der har åbnet et perspektiv om at kunne bygge systemer, der kan forstå tale i kontekst på en måde, der åbner for praktisk anvendelse.

Figuren nedenfor er fra RobinLabs og viser i simpel form, hvor meget information fra en mængde forskellige kilder, der skal være til rådighed i realtid, for at et system kan begynde at forholde sig sprogligt til kontekst.

22022016-03

Muligheden for at få adgangen til alle disse forskellige former for information på en måde, der både er omgående, præcis og flertydig, er rykket nærmere med udviklingen af en treenighed, der består af mobil internetforbindelse, smartphones (og/eller armbånd, etc.) og store databaser i Skyen, hvor vi som brugere opdaterer alt mellem himmel og jord om vores gøres og laden, fra e-mail og kalendere til sociale netværk og chat, vores forbrug af YouTube-videoer, Spotify-musik, Amazon-bøger, AirBnB-overnatninger, Uber-ture, flyrejser, browser-historik, lokation, biometriske data, varekøb og betalinger, input fra e-køleskabe og vaskemaskiner og meget mere.

Når vores stadigt kraftigere håndholdte computere gradvist bliver i stand til at forholde sig systematisk til al denne information på én gang, og når de herefter kan gennemføre en afvejning af al denne information i realtid, så nærmer vi os noget, der minder om en samtale i kontekst.

Det vil give os løsninger i hånden, der vil forekomme at være ren magi.

De ”digitale assistenter” fra Apple, Microsoft, Google, Amazon samt hele underskoven af uafhængige, selvstændige projekter inden for samme kategori, har i de seneste år vist en imponerende fremdrift i udviklingen inden for dette felt.

Løsningerne har samtidig demonstreret, at der er lang vej endnu, før vi har fleksible systemer, der forstår tale i kontekst uden for velafgrænsede emneområder.

Men computere, der kan føre en samtale, er på vej, og kan være en realitet, før vi aner det.

Lad os håbe, at de vil have lyst til at tale med os.

Henvisninger og baggrund: 22.02.2016