Regeringen sætter 30 mio. kr. af til at udvikle en fælles dansk sprogressource, som både offentlige og private kan bruge frit til at udvikle gode løsninger og styrke forskning med kunstig intelligens på dansk.
En af nøglerne til at udbrede kunstig intelligens i Danmark er en stor samling af sprogdata på dansk, en såkaldt sprogressource. For skal kunstig intelligens genkende tale eller tekst, sådan som fx chatbots eller digitale assistenter gør, så kræver det, at den er blevet fodret med data på dansk af høj kvalitet.
Men fordi dansk er et lille sprogområde, har det ikke været attraktivt nok for virksomheder at investere i at få udvikle en dansk sprogressource. Det laver regeringen nu om på, så Danmark ikke sakker bagud i brugen af kunstig intelligens i forhold til andre lande.
Med Danmarks første, nationale strategi for kunstig intelligens, som regeringen præsenterer i dag, sætter regeringen knap 30 mio. kr. af over de kommende fire år til at lave en fælles dansk sprogressource, som skal være frit tilgængelig for virksomheder, offentlige myndigheder og forskere.
En åben sprogressource af høj kvalitet vil være til stor gavn for både offentlige myndigheder, private virksomheder og forskere. Både i den offentlige og private sektor er man så småt ved at tage kunstig intelligens til sig, og vi møder ofte sprogteknologi i hverdagen, fx når stoppesteder læses op i bussen, eller når vi chatter med virtuelle medarbejdere hos kommunen eller forsikringsselskabet. Men det er nødvendigt at styrke kvaliteten af de dansksprogede data, så vi i endnu højere grad kan drage fordel af teknologien i vores hverdag, siger innovationsminister Sophie Løhde og fortsætter:
Med en fælles sprogressource vil man eksempelvis i kommunerne kunne bruge teknologien til at omsætte telefonopkald til tekst for at kunne give borgere hurtigere besvarelser, og forskere vil langt hurtigere kunne få overblik over store mængder af litteratur og data, fordi kunstig intelligens bl.a. kan hjælpe med at gennemsøge og kategorisere artikler. Og det er afgørende, at vi kommer med nu. Derfor sætter vi i regeringen nu gang i at få udviklet sådan en fælles sprogsamling.
Uddannelses- og forskningsminister Tommy Ahlers siger:
Nu får vi sat skub i udviklingen af kunstig intelligens på dansk. Der er helt nødvendigt, hvis kunstig intelligens for alvor skal udvikles og bruges i Danmark. Åbne og fælles sprogdata på dansk vil give nye forskningsmuligheder, og det vil blive en stor styrke for virksomheder og forskere, når de fremover kan udvikle løsninger og systemer, der kan anvendes i en dansk sammenhæng.
Erhvervsminister Rasmus Jarlov siger:
Ved at etablere en frit tilgængelig dansk sprogressource kan virksomhederne lettere komme i gang med at bygge kunstige intelligens-systemer baseret på dansk tekst og tale. Det er positivt, fordi der er et uudnyttet potentiale i moderne sprogteknologi. Fx kan de danske virksomheder høste store besparelser ved fx bruge chatbots til kommunikation med deres kunder og forretningspartnere.
Sprogressourcen skal bygges op i samarbejde med offentlige og private aktører. Den skal bygge videre på initiativer, der allerede er i gang i dag, men den skal også være med til at udvikle mere avanceret sprogforståelse, forudsigelser og vurderinger fx i offentlig sagsbehandling.
En sprogressource er en struktureret samling af digitale datasæt – lyd, tekst og ord.
Sprogteknologi i form af talegenkendelse bruges fx til at hjælpe borgere med synshandicap eller borgere, der har svært ved at læse og skrive, med at læse tekster op eller indtale beskeder. Det kan også bruges til at frigøre tid hos fx læger og sagsbehandlere ved at overføre indtalte observationer til skrift automatisk.
På skrift bruges det ligeledes til automatisk at oversætte mellem sprog og til at kommunikere med virtuelle assistenter som voice- og chatbots. Voicebots kender vi i dag fra vores smartphones, fx Siri som personlig assistent i vores iPhone. I fremtiden vil vi se stemmestyring brugt mere og mere i vores forbrugsvarer og i kontakt med det offentlige.