Maskinöversättning – för och emot

Automatisk översättning (även kallad för maskinöversättning, förkortat MT) har nu funnits i nästan sjuttio år. De första datorprogrammen för automatisk översättning översatte meningar ord för ord genom att slå upp orden från en elektronisk ordbok, utan att ta hänsyn till olikheter mellan de olika språkens syntax. Som nästa steg i utvecklingen började man mata in grammatikregler i maskinöversättningssystem. Sådana helt regelbaserade MT-motorer fungerade bäst för språken som var släkt med varandra men de gjorde ändå många fel, och eftersom reglerna måste skrivas av människor, var byggandet av sådana MT-system mycket tidskrävande. Dessutom är det mycket svårt att skapa ett regelset som ger tillräckligt bra resultat för att vara användbart.

Under de senaste 20-25 åren har motorer för automatisk översättning gått igenom en enorm utveckling, så dagens system presterar mycket bättre än de ursprungliga primitiva MT-program. Hur har vi kommit dit?

En av de viktigaste sakerna som har bidragit till förbättring av maskinöversättningens kvalitet är den växande mängd språkdata som finns tillgänglig på nätet. Ju mer parallella texter (en text och dess översättning(ar) till andra språk) finns att tillgå desto större chans har en MT-motor att ge korrekta resultat. Det är också orsaken varför man får mest tillförlitliga resultat när man använder MT för att översätta mellan ”stora” språk som till exempel engelska och franska.

Man kan undra hur moderna MT-mototer fungerar i praktiken. För att ta vara på informationen som finns i de parallella texterna tillämpas statistiska metoder. Ett antal texter används för att bygga en statistisk modell, sedan använder man nya texter (ju fler desto bättre) för att träna modellen, så MT-motorn ger mer och mer korrekta resultat. Metoden som är mest framgångsrik idag är baserad på artificiella neurala nätverk. Enkelt förklarat tilldelar ett sådant MT-system varje ord i källspråket ett nummer som motsvarar ett annat nummer, som i sin tur kan avkodas till ett ord i målspråket. De moderna system för automatisk översättning ”lär sig själva” av texter som de exponeras till, till skillnad från gammaldags system där alla språkregler skulle matas in manuellt.

Dessutom drar utvecklare av MT-system nytta av användarfeedback. När en användare ser en felaktig översättning kan han rätta till det och därmed ge värdefull feedback till systemet. Det är också vanligt att man låter professionella översättare granska systemets output genom att utvärdera översättningens kvalitet och rätta till eventuella fel.

Samtidigt som maskinöversättning har gjort stora framsteg de senaste årtionden, är MT ändå inte i närheten av att kunna ersätta en mänsklig översättare. MT kan vara kapabel att ge korrekta översättningar till enkla meningar, men den brukar ha svårt med homonymer, tvetydiga ord, ”falska vänner”, sammansatta ord, komplexa meningar och olika fackspråk. Problemet är att till skillnad från en människa kan MT inte fullständigt förstå källtextens kontext för att kunna välja rätt terminologi, grammatik och meningsbyggnad för målspråket.

Låt oss titta på några exempelmeningar som är automatiskt översatta från svenska till engelska. Ett känt problem är att MT har svårt att hantera idiomatiska uttryck:

Källtext: Har du fötterna på jorden, huvudet på skaft och ögon i nacken?
Automatisk översättning: Do you have your feet on the ground, your head on the shaft and your eyes in your neck?
Korrekt översättning: Do you have both feet firmly planted on the ground (”realistic”), your head screwed on the right way (”smart”) and are able to see and hear everything?

En människa känner igen idiomen och förstår meningens betydelse, men det gör inte MT som översätter idiomatiska uttryck ord för ord.

Nästa exempel:

Källtext: Han har nog inte alla hästar hemma.
Automatisk översättning: He probably doesn’t have all the horses at home.
Korrekt översättning: He is probably out of his mind.

Här misslyckas MT med att förstå meningens pragmatik: översättningen är tekniskt korrekt men om en människa läser den svenska meningen förstår hon direkt att man inte menar några verkliga hästar.

Ofta händer det att MT misslyckas med översättning av specifika termer och kan inte tolka förkortningar:

Källtext: Nästan alla 05:or på Stjerneskolan kallades in till mönstring.
Automatisk översättning: Almost all 05s at Stjerneskolan were called up for muster.
Korrekt översättning: Almost all students at Stjerneskolan born in 2005 were called up for conscription.

MT översätter mönstring till muster vilket är fel. MT vet inte heller vad 05:or betyder. Det är ju mycket vanligt att man på svenska refererar till personer födda samma år med två sista siffror i födelseåret medan man inte uttrycker det på samma sätt på engelska.

Ibland ändrar automatisk översättning meningens betydelse totalt (detta händer med större sannolikhet när man använder MT för att översätta från engelska till svenska). Här är några verkliga exempel som våra översättare har stött på:

Exempel 1:
Källtext: Where do you think you´re going, turkey?
Automatisk översättning: Vart tror du att du är på väg, Turkiet?
Korrekt översättning: Vart tror du att du är på väg, din dumbom?

Exempel 2:
Källtext: I actually didn’t think much of it.
Automatisk översättning: Jag tänkte faktiskt inte så mycket på det.
Korrekt översättning: Jag tyckte inte den var något vidare.

Exempel 3:
Källtext: I have no place to call home anymore.
Automatisk översättning: Jag har ingenstans att ringa hem längre.
Korrekt översättning: Jag har inte någon plats längre som jag skulle kunna kalla mitt hem.

Margret Rand