Gjennom høsten har jeg lest meg opp på mye forskjellig innen NLP og språkmodeller. Christina og jeg har diskutert en god del angående hva vi tenker er beste fremgangsmåte for å trene opp en chatbot til dialog. En naturlig første tanke er å mate modellen med dialog-basert data. Janne har samlet inn mye slik type data, undertekster til film og serier. Generelt innbefatter det samtaledata, altså dialog. Dette er et godt utgangspunkt, spesielt med tanke på at datainnsamling er tidkrevende, og et stort og kvalitetsrikt datasett er en forutsetning for en god språkmodell. 

Språk er komplisert. Det består gjerne av et stort vokabular, har grammatiske regler og regler for ordstilling. Norsk f.eks. er hva man kaller et SVO-språk. Det vil si at man bygger opp en setning ut fra regelen: subjekt – verb – objekt. Andre språk har andre syntaktiske regler. I tillegg kommer ting som forkortelser og initialer, symboler og tall. Det er mildt sagt kompliserte greier.

Vi har lenge drømt om å lage en chatbot vi kan ha dialoger med på norsk. Prosjektet vennen.ai ble startet i fjor med et mål om å få til nettopp dette, og selv om de store resultatene ennå lar vente på seg, har vi oppsamlet mye kunnskap og erfaringer underveis. I og med at det allerede finnes mange chatboter der ute, som både kan snakke norsk og være til nytte, tenkte jeg å gå litt dypere inn i hva det er vi forsøker å få til med vår chatbot.

I begynnelsen av 2019 startet vi på et helt nytt prosjekt i Innovatec. Vi ønsket å utforske mulighetene rundt chatbots, og se om det var mulig for oss å dra nytte av denne teknologien i vår virksomhet. I den forbindelse investerte vi også i en robot, som forhåpentligvis kunne virke som et medium for chatboten. Vi gikk løs på utfordringen med store visjoner og godt mot, og så fram til dagen vi skulle bli møtt av en veltalende robot som ønsket oss velkommen på kontoret.

Digitalisering av offentlige tjenester har vært et viktig mål i Norge i mange år. Mens mange private bedrifter er langt fremme med digitalisering er det store forskjeller på hvor langt man er kommet med digitaliseringen i det offentlige. De siste måneders coronanedstengning har medført økt digitalisering på flere områder, ikke minst i form av en generell bevisstgjøring rundt digitaliseringens positive muligheter.

Mens ingen kan tvinge noen til å være på Facebook, er der i dag mange digitale tjenester man føler seg samfunnsmessig forpliktet til å bruke, selv om det fremdeles er frivillig å skaffe seg digital bank-id for å få betalt regningene i nettbanken og levert selvangivelsen. Men det blir oppfordret til at man skal levere selvangivelsen digitalt, og forventet at man kan navigere seg rundt i digitale systemer i kommunikasjon med det offentlige.

Tenk deg at du sitter foran pc’en og av en eller annen grunn blir stresset og oppbragt av noe du leser. Du kjenner at blodtrykk og puls øker. Plutselig dukker det opp et pushvarsel på mobilen som ber deg om å slappe av og bekymre deg mindre. Ville du forstått sammenhengen på hvordan data beveger seg på tvers av enheter og tjenester? Ville du følt deg overvåket?

De siste ukene har diskusjonen gått rundt utviklingen av en app som skal overvåke hvordan vi beveger oss, slik at man kan drive sporing av covid-19 smittede. Appen er et samarbeidsprosjekt mellom Folkehelseinstituttet og teknologibedriften Simula Research Laboratory og benytter både GPS og Bluetooth for å innhente data om lokasjon og nærhet mellom mennesker.

AI-teknologi er tatt i bruk på flere forskjellige måter for å bekjempe koronautbruddet som sprer seg verden over akkurat nå.
Supercomputeren Quartz er stilt til rådighet for å forske på covid-19 viruset og har på få dager automatisert en gigantisk researchjobb ved hjelp av algoritmer, som man manuelt ville brukt mange måneder på. Ved hjelp av ekstrem datakapasitet undersøker den hvilke proteiner som binder seg til covid-19 og begrenser dermed den reelle arbeidsmengden for forskerne som jobber med å finne en behandling og vaksine mot viruset. 1