Chatbots – Din digitale dialogpartner på norsk

Det finnes etter hvert en god del chatboter på norsk. Disse er ofte rettet mot bedriftenes kundeservice-miljøer og er ofte basert på forhåndsbestemte regler og triggerord. De fleste chatboter så langt opererer innenfor bedriftens avgrensede bransjeområde, noe som forenkler chatbotens utgangspunkt.

Eksempelvis vil en chatbot som blir utviklet innenfor bank og finans kunne besvare spørsmål om økonomiske spørsmål og bankens tjenester, fordi den er forhåndsdefinert til dette og har tilgang på informasjon fra dette fagområdet, for eksempel ved at den kan søke informasjon fra bankens egne nettsider om bank og finansrelatert informasjon.

I tillegg utvikles det også chatboter basert på maskinlæring. Store teknologibedrifter som Facebook, Google, Amazon, Apple og Microsoft, har jobbet med dette i mange år og har opparbeidet seg enorme datamengder gjennom sine tjenester og har også innhold på veldig mange språk, deriblant norsk.
Facebook har kjørt maskinlæring på innholdet fra Messenger og kan tilby hundretalls forskjellige chatbots som man selv setter opp og kommuniserer med via Messenger.  Apple lanserte Siri for fem år siden, som hovedsakelig er en verbal chatbot.

Microsoft har utviklet Xiaoice for det kinesiske markedet, som både snakker med deg, skriver dikt, leser, danser og synger, samt leder tv-programmer!
Langt mindre vellykket var Microsofts engelskspråklige Tay, som ble lansert på Twitter, men svært raskt viste seg å bli både kvinnefiendtlig og rasistisk i møte med sine brukere, etter at noen brukere fant ut at de kunne påføre chatboten sine egne holdninger. Dermed ble denne raskt tatt av nettet og erstattet av Zo som var så politisk korrekt at den ikke klarte å svare ordentlig på spørsmål med en gang visse ord ble nevnt. 

Chatbots har etter hvert stor utbredelse på engelsk, mens det fremdeles er et stykke å gå for norskspråklige chatbots.
Det er språkteknologi som danner grunnlaget i utviklingen av chatbots. Her benytter man menneskelig språk for å analysere og bearbeide innholdet ved å kombinere lingvistiske metoder med maskinlæring.

En chatbot basert på maskinlæring er begrenset av datagrunnlaget den blir foret med, men vil lære av det man forteller den. For at en chatbot skal kunne få et bredt samtalegrunnlag, bør dataene den blir foret med også ha et bredt grunnlag, både hva gjelder tema og detaljer. Jo større datamengder, jo bedre er det. 

Kommunikasjon mellom mennesker er en svært dagligdags affære for de fleste av oss. Vi har daglige samtaler som i et datalingvistisk perspektiv er svært avanserte. Vi forstår intuitivt når vår samtalepartner avslutter en setning og om setningen er fortellende og beskrivende eller et spørsmål vi må svare på.
Likeledes bidrar vi også umiddelbart med en bekreftelse på det som blir sagt eller en oppfølgende supplering i form av enten et enkelt ord eller en lengre redegjørelse. Betydningen av det som blir sagt kan være enkel og åpenbar eller den kan være kompleks og/ eller dårlig formulert.

Ofte kan setninger og innhold ha dobbeltbetydninger eller betydningen avhenger av intonasjon, altså hvor trykket blir lagt i en setning. I tillegg finnes det en rekke andre forhold som gjør det svært vanskelig for en chatbot å oppfatte meningen i det som blir sagt, både når den skal analysere innholdet som ligger til grunn for maskinlæringen og hvordan den fortolker det man sier til den senere.

I tillegg har man utfordringer knyttet til hvilke skrivefeil brukerne har og hvordan de formulerer seg, enten fordi de ikke har norsk som opprinnelig språk eller fordi de ikke er gode nok til å formulere seg korrekt. Å skrive godt er en kompetanse som må læres.

I Norge opererer vi også med to skriftspråk og en variasjon av forskjellige dialekter som finner veien til skriftspråket for mange. Dette vil dermed utgjøre egne utfordringer. Det er usikkert hvordan chatboten vil takle både bokmål og nynorsk samtidig.

For å få gode resultater av maskinlæringen, må språket holde en viss kvalitet og man bør benytte seg av meningsfulle formuleringer hvor setningsoppbygningen er korrekt, samtidig som man ivaretar et naturlig språk som mennesker snakker seg imellom. Ettersom norsk er et språk som snakkes av ganske få mennesker på verdensbasis, er det også en utfordring å skaffe tilstrekkelig innhold innenfor det temaet man er ute etter med den kvaliteten som er nødvendig. Det er dermed generelt mange utfordringer med å lage chatbots, i tillegg kommer altså utfordringer knyttet spesifikt til det norske språk. Det er derfor spennende å se om det faktisk er mulig å skape en chatbot som vil fungere slik vi håper og forventer.