Neural maskinoversættelse – hvad kan det bruges til?

machine-translation

Neural maskinoversættelse – hvad kan det bruges til?

I efteråret sidste år meddelte Google, at de står overfor et gennembrud med hensyn til neural maskinoversættelse. Hos GlobalDenmark følger vores oversættelsesteam selvfølgelig spændt udviklingen, og vi giver dig her en kort opdatering på situationen samt et indblik i, hvordan neural maskinoversættelse kan bruges.

 Hvad er forskellen mellem maskinoversættelse og  computer-støttet oversættelse?

Lad os begynde med at slå fast, at maskinoversættelse ikke er det samme som computerstøttet oversættelse, det der på engelsk hedder ”computer-assisted translation” eller CAT.

I maskinoversættelse (MT) er det maskinen (programmet), der gør alt arbejdet. Du indsætter blot din tekst, som er skrevet på et sprog, og ud kommer den så i et andet sprog. Hvis din tekst er rimelig lige til, kan oversættelsen være god. Men hvis teksten indeholder sætninger med omvendt ordstilling, eller et ord har flere betydninger, kan man ende med et noget forvrøvlet resultat. Derfor er det ofte (altid!) en god ide at redigere den maskinoversatte tekst – hvis man altså behersker det sprog, man oversætter til. Og det gør man ofte ikke. Det er bl.a. derfor, man nogle gange ser nogle meget pudsige af oversættelser, fx menuer på kinesiske restauranter.

Når dy arbejder med CAT, vil computeren gennemsøge databaser med termer og hele sætninger, som du har oversat før. Computeren laver så et match imellem kildeteksten og målteksten – og viser dig så sit bud på et bedste match. Det kan du så vælge at bruge eller afvise, alt afhængig af hvordan det passer ind i din tekst. Nogle gange rammer computeren plet, og du sparer tid, og nogle gange rammer den helt ved siden af, og du må overtage oversættelsen selv.

Stort set alle professionelle oversættere bruger et CAT-værktøj, når de oversætter, og det har de efterhånden gjort i mange år. Vi bruger også CAT-værktøjer her hos GlobalDenmark, og vi kunne ikke forestille os at oversætte uden – vi har faktisk brugt CAT-værktøjer i over 15 år.

Findes der forskellige typer af maskinoversættelse?

Der er tre typer maskinoversættelse: regelbaseret maskinoversættelse, statistisk baseret maskinoversættelse og så hybridsystemer, der kombinerer regelbaseret og statistisk baseret maskinoversættelse.

Regelbaseret oversættelse bygger på en stor samling sproglige regler og ordbøger for både kilde- og målsproget. Det er en meget krævende affære at få samlet den nødvendige regelsamling, der skal til for at lave en brugbar regelbaseret oversættelseshukommelse, og i takt med at et sprog udvikler sig, skal reglerne løbende tilpasses det nye sprogbrug, hvilket indebærer en hel del vedligeholdelsesarbejde.

Statistisk baseret oversættelse bygger på, at computeren selv analyserer en lang række et- og to-sprogede tekster, og på baggrund af denne analyse opbygges en oversættelsesmodel. Computeren lærer så at sige fra teksten, der indsættes i hukommelsen, så jo mere tekst der puttes ind, jo bedre bliver modellen og dermed også oversættelsen. Modsat regelbaseret maskinoversættelse, kan statistisk baseret maskinoversættelse opdatere og udvikle sig selv i takt med at sproget udvikler sig.

Kvaliteten af maskinoversættelsen afhænger af kvaliteten af de tekster, som maskinoversættelsen bygger på, hvilket kan være en udfordring for især statistisk baseret maskinoversættelse. Hvis input-teksterne er meget ens – fx instruktioner og manualer, købsbetingelser osv. – kan computeren dog få opbygget en solid model.

Og til sidst er der som sagt systemer, der kombinerer både regelbaseret og statistisk maskinoversættelse.

Hvad gør Google?

Google står bag en ny og fjerde type maskinoversættelse, nemlig neural maskinoversættelse.

Kort fortalt har Google udviklet et system, der bygger på computerens neurale netværk, som efterligner de biologiske neurale netværk i den menneskelige hjerne. En af de største fordele ved neural maskinoversættelse er, at den ikke er afhængig af lige så store mængder hukommelse som statistisk baseret maskinoversættelse er.

…og hvad er så revolutionerende ved Googles nye maskinoversættelse?

I en artikel fra september 2016 påstår Google, at “i nogle tilfælde er der i gennemsnit næsten ingen forskel imellem oversættelser lavet af mennesker og oversættelser lavet af Googles neurale maskinoversættelse”, og at ”kvaliteten af den (neurale) oversættelse bliver gradvist lige så god som den menneskeskabte oversættelse”.

Denne påstand er blevet betvivlet af flere, især fordi de tekster, som blev oversat i studiet, bestod af en samling korte og simple sætninger.

Hvordan vil vi oversætte i fremtiden?

Vi bider mærke i, at Google, i sin sammenligning af maskinoversættelse med oversættelser udført at mennesker, bruger udtrykket ’i gennemsnit’. Selvfølgelig skal man være varsom med at sammenligne alle oversættelser lavet af et menneske med alle maskinoversættelser. På samme måde som at man ikke kan sige at alle oversættelsesopgaver er ens. Selvfølgelig vil ingen maskinoversættelse blive god, hvis den ikke kan trække på de relevante regler, statistiske data eller ’neuroner’ som den har brug for, ligesom oversætteren af kød og blod også skal besidde de relevante sprogfærdigheder, indsigt i fagområdet, osv. for at kunne levere en kvalificeret oversættelse.

Der er brug for både maskinoversættelse og menneskeskabt oversættelse – vi skal blot finde den rigtige måde at kombinere de to tilgange på, så de supplerer hinanden fremfor at udelukke hinanden.

Hos GlobalDenmark er vi gået ind i det nye år med et nytårsforsæt om få det bedste ud af alle fordelene ved maskinoversættelse og den menneskeskabte oversættelse, og vi ser frem til at holde jer opdateret vedrørende vores erfaringer.

 

Skrevet af Simon Palmer, Head of Translations, GlobalDenmark A/S (red. af Ann Britt Donovan)

Hvis du kunne lide dette indlæg, vil du måske også kunne lide nogle af vores andre indlæg her på bloggen. Vi håber, du vil læse med her!

 

One, two, tree…

  Kære Allan Nej, hvor bliver der grinet af dig i disse dage. Ja, i din udtale blev ”other” til ”otter” , og i danske ører er det bare SÅ morsomt! Men i alle andre ører er det bare en variation af den ’korrekte’ udtale, og det giver ikke anledning til videre morskab. Så ro […]

Continue reading →

Den professionelle oversætter gør meget mere end bare at oversætte – den gode oversætter tænker

Hånden på hjertet, har vi ikke alle sammen skrevet en tekst, som vi bare synes lyder vildt godt? Hvor ordene flyder, og vi har leget med både bogstavrim, enderim og billedsprog. Et lille mesterværk, hvis vi selv skal sige det. Men når teksten bliver splittet ad (måske af en oversætter), opdager vi pludselig, at vores […]

Continue reading →

Jagten på en procedure fortsætter…

  Som fortsættelse på bloggen om jagten på en procedure for bekræftede oversættelser, kan jeg fortælle, at tingene udvikler sig – vi er ikke helt i mål, men vi er kommet tættere på en procedure. Foreningen Kommunikation og Sprog har udsendt retningslinjer, der siger, at translatører skal gøre som de plejer, men at translatører ikke længere må bruge […]

Continue reading →

Jagten på en procedure

  Per 1. januar 2016 blev ordningen for statsautoriserede translatører afskaffet. Siden sekstenhundredehvidkål har translatører kunnet sætte deres stempel som bekræftelse på, at en oversættelse svarer til kildeteksten. Igennem historien har titlerne været “edsvoren translatør og tolk”, “kgl. aut. translatør og tolk” og “statsautoriseret translatør”. I det nye år har mange translatører måttet se den […]

Continue reading →

Er engelsk mere præcist end dansk? Gode råd til hvordan du oversætter fra dansk til engelsk 

  Vores chefoversætter, Simon Palmer, er engelsk men har boet i Danmark i snart 20 år. I kraft af sit virke som oversætter og underviser har Simon, som er fantastisk god til dansk, gennem årene ofte hørt folk sige: ”Det er så meget nemmere at være præcis på engelsk end på dansk, fordi engelsk rummer mange flere ord end dansk.” Men […]

Continue reading →