Feneyjar eða Venezia?

Feneyjar eða
Venezia?

Hjá Miðeind, og í tengslum við fimm ára máltækniáætlun stjórnvalda og Almannaróms, vinnum við að því að þróa betri vélþýðingu milli íslensku og annarra tungumála en hingað til hefur verið fáanleg. Meðal annars stefnum við að því að höndla mannanöfn og sérnöfn betur en nú þekkist, og að bjóða betri lausnir fyrir þýðingar á sérsviðum. Þá er vitaskuld markmið að bæta almenna þýðingarfærni hugbúnaðarins og þjálni textans sem út kemur.

Vélþýðing

Vélþýðing er þýðing á texta eða tali úr einu tungumáli yfir á annað, sem gerð er í tölvu. Í árdaga vélþýðingartækninnar notaðist hún við tölfræðilegar aðferðir, en á síðustu árum hafa djúp tauganet (deep neural networks) tekið yfir sem besta fáanlega tækni á þessu sviði.

Margir þekkja kerfi á borð við Google Translate og Microsoft Translator, sem styðja íslensku þokkalega. Við hjá Miðeind teljum að hægt sé að gera enn betur. Til þess þarf m.a. átak til að safna samhliða textaheildum (parallel corpora), þ.e. texta sem til er samhliða á íslensku og öðrum tungumálum, en jafnframt aðrar aðferðir til að bæta þýðingarhæfni tauganetanna. Í fimm ára máltækniáætlun stjórnvalda og Almannaróms eru skilgreindir áfangar og vörður að betri vélþýðingartækni fyrir íslensku, og Miðeind er meðal lykilþátttakenda í því verkefni.

Á vefnum Vélþýðing.is getur þú prófað frumgerð að tauganets-þýðingarvél Miðeindar. Með henni má þýða stutta texta milli íslensku og ensku. Stefnt er að því að bjóða notendum þýðingarvélarinnar að hjálpa til við að gera þýðingarnar enn betri, með aðferðum lýðvirkjunar (crowdsourcing).