Hvordan kan en maskin forstå hva et menneske sier til den? Og hvordan kan den svare? Dette er spørsmål vi jobber med her på Innovatec, og som vi ønsker å finne gode løsninger på.
Kategoriarkiv: Chatbots
Gjennom høsten har jeg lest meg opp på mye forskjellig innen NLP og språkmodeller. Christina og jeg har diskutert en god del angående hva vi tenker er beste fremgangsmåte for å trene opp en chatbot til dialog. En naturlig første tanke er å mate modellen med dialog-basert data. Janne har samlet inn mye slik type data, undertekster til film og serier. Generelt innbefatter det samtaledata, altså dialog. Dette er et godt utgangspunkt, spesielt med tanke på at datainnsamling er tidkrevende, og et stort og kvalitetsrikt datasett er en forutsetning for en god språkmodell.
Språk er komplisert. Det består gjerne av et stort vokabular, har grammatiske regler og regler for ordstilling. Norsk f.eks. er hva man kaller et SVO-språk. Det vil si at man bygger opp en setning ut fra regelen: subjekt – verb – objekt. Andre språk har andre syntaktiske regler. I tillegg kommer ting som forkortelser og initialer, symboler og tall. Det er mildt sagt kompliserte greier.
Det finnes etter hvert en god del chatboter på norsk. Disse er ofte rettet mot bedriftenes kundeservice-miljøer og er ofte basert på forhåndsbestemte regler og triggerord. De fleste chatboter så langt opererer innenfor bedriftens avgrensede bransjeområde, noe som forenkler chatbotens utgangspunkt.
Mens begrepet ‘fairness’ først og fremst handler om å håndtere temaer man vil unngå at chatboten skal snakke om, er der andre samtaletemaer som det ville være fint om det gikk an å snakke om, men uten at samtalen går i feil retning.
Etter at Microsoft offentliggjorde chatboten Tay, som i løpet av et døgn ble redusert til en kvinnefiendtlig rasist-bot, har bevisstheten blitt stor rundt urettferdige algoritmer og hva dette kan medføre. Ettersom chatboter i stor grad nettopp skal benyttes i en sosial sammenheng, til kundeservice og i offentlig virksomhet er det helt essensielt at den kan oppføre seg ordentlig! Kan man ikke stole på dette hos en chatbot, har den ingen fremtid, etter vår mening.
For at en chatbot skal gi gode resultater må tekstmaterialet ha de riktige kvalifikasjonene. Første del av prosessen har dreid seg om å finne norskspråklig, dialogbasert tekstmateriale med dagligdagse samtaletemaer innenfor et bredt spekter, som i liten grad inneholder eksplisitte eller upassende temaer.
Innovatec har nylig startet opp et prosjekt som ser på muligheten for å utvikle en AI-basert kognitiv chatbot. Chatboten er basert på maskinlæring og skal tilpasses og forstå norsk språk. Chatboter fungerer allerede innenfor en del næringer, særlig innenfor kundeservice, med varierende grad av suksess.