Ir vārdi, kuru atveide svešvalodā atgādina kādus pazīstamus pavisam citas nozīmes vārdus valodā, no kuras tulko. To vidū anekdotisks piemērs ir salikuma “garšīgs lasis” tulkojums somu valodā.
Ir vārdi, kuru atveide svešvalodā atgādina kādus pazīstamus pavisam citas nozīmes vārdus valodā, no kuras tulko. To vidū anekdotisks piemērs ir salikuma “garšīgs lasis” tulkojums somu valodā.
Gata Šļūkas zīmējums

Lai mežā netup čikens. Ko spēj un ko (vēl) nespēj mašīntulkošanas programmas 3

“Tildes” pērn ieviestās ­neironu mašīntulkošanas sistēmas apmācībā angļu-latviešu un latviešu-angļu tulkošanas virzieniem tika izmantoti 46,1 miljons teikumu.

KO
kokteilis.lv
Kokteilis
FOTO. Politiķe Ramona Petraviča ļāvusies erotiskai fotosesijai vīriešu žurnāla lappusēs 185
1 diena
LL
Lilija Limane
Stāsti
Bigauņciemā, stiprai ziemeļvakara vētrai plosoties, jūra ar lielu paisumu izskaloja kareivju līķus 12
1 diena
LA
LA.LV
Ziņas
“Slimnīcā sanitārs saņem vairāk nekā pedagogs skolā.” Kreituse vērtē 2022. gada valsts budžetu 35
6 stundas
Lasīt citas ziņas

“LA” publikācija par Latvijas nozīmīgākajiem zinātnes sasniegumiem 2018. gadā “Eksperimentālās vakcīnas, neironu mašīntulks, neparasta DNS” (2018. 27. 12.) mudinājusi lasītāju Edgaru Vimbu dalīties pārdomās par mašīntulkošanu: “Rakstā teikts: “Latvijā izstrādāta jauna mašīntulkošanas tehnoloģija, kas balstās neironu tīklu dziļās mašīnmācīšanās metodēs un ir īpaši piemērota tulkošanai latviešu un citās mazākās valodās. AS “Tilde” un LU pētnieku radītais risinājums tiek izmantots praktiskos lietojumos, kas ir pieejami Latvijas sabiedrībai (“translate.tilde.com”), valsts pārvaldes valodas tehnoloģiju platformā “Hugo.lv” un nodrošina tulkošanu Eiropas Savienības Padomes tulkošanas risinājumā “translate2018.eu”.”

E. Vimba pamēģinājis ar “translate.tilde.com” iztulkot angļu valodas tekstu “On the tree was a nice chicken of the woods” un ieguvis teikumu “Uz eglītes bija smuks meža čikens”.

CITI ŠOBRĪD LASA

E. Vimba turpina: “Teikumu “The corncrake [grieze], corn crake or landrail is a bird in the rail family” man iztulkoja tā: “Kukurūzas krakšķis jeb zemūdene ir putns dzelzceļa saimē”. Vai kaut ko sapratāt?

Internetā daudziem rakstiem angļu valodā ir tādi “tulkojumi”, kuri speciālistiem un interesentiem ir absolūti nederīgi. Tos vienīgi varētu izmantot jokdari publikas smīdināšanai.

Vai tas rāda, ka mašīntulkošana nekur nebūtu derīga? Nebūt ne. Tas gan māca, ka mašīntulkošana pienācīgi ir jāsagatavo, ka nevar būt viena programma daiļliteratūras un zinātniskās literatūras tulkošanai. Pie tam arī zinātniskās literatūras tulkošanai nevar būt viena universāla programma, diemžēl katrai zinātnes nozarei ir nepieciešama sava programma.”

Kā šos tulkojumus komentē “translate.tilde.com” veidotāji? SIA “Tilde” pētnieks Mārcis Pinnis norāda, ka mašīntulkošanas tehnoloģiju tulkojumi šobrīd vēl nespēj pilnīgi aizvietot cilvēka tulkojumu. Tomēr tas ir būtisks palīgs, kas tulkošanas darbu padara ātrāku un lētāku. Plašas jomas mašīntulkošanas sistēmas pagaidām vēl nav pielāgotas, lai labi tulkotu šauru jomu tekstus, piemēram, publiskajā komunikācijā reti lietotus bioloģijas terminus. Šo sistēmu uzdevums ir nodrošināt pieņemamu kvalitāti dažādu jomu tekstiem vienlaicīgi.

M. Pinnis skaidro, ka ir vairāki mašīntulkošanas tehnoloģiju lietojumu veidi: “Pirmkārt, mašīntulkošanas sistēmas izmanto, lai piekļūtu informācijai, kas ir rakstīta svešvalodā, un saprastu galveno teksta domu, perfekts tulkojums tad nav nepieciešams.

Otrkārt, lai sagatavotu instrukcijas, tad kvalitātei ir jābūt perfektai. Treškārt, lai paātrinātu tulkošanas procesu, un tad kvalitātei ir jābūt tādai, lai mašīntulkošanas sistēmas izmantošana palielinātu produktivitāti, šeit kvalitāte ir pat sekundāra. Plašas jomas publiski pieejamās sistēmas (“translate.tilde.com”, “translate.google.com” u.c.) parasti pilda pirmo vai trešo lomu.”

Ar jaunajām (neironu tīklos balstītajām) mašīntulkošanas tehnoloģijām ir uzlabota kopējā tulkošanas kvalitāte piemēram, nodrošināts labāks saskaņojums starp vārdiem teikumā, pareizāk modelēta morfoloģija utt.

Tomēr atsevišķu leksikas vienību pareizākai tulkošanai šauru jomu tekstos vienmēr būšot nepieciešamas konkrētai jomai pielāgotas sistēmas. Jo, pirmkārt, valoda bieži ir neviennozīmīga, otrkārt, vispārīgāki vai plašāk izmantoti tulkojumi mēdz nomākt retākus tulkojumus. Visbeidzot, plašas jomas sistēmu apmācībā bieži vienkārši nav pieejami šauru jomu apmācības dati, kas saturētu konkrētās jomas terminoloģiju.

“Tildes” pērn ieviestās neironu mašīntulkošanas sistēmas “translate.tilde.com” apmācībā angļu-latviešu un latviešu-angļu tulkošanas virzieniem tika izmantots 46,1 miljons teikumu, kas iegūti no visdažādāko jomu publiski pieejamiem, kā arī “Tildes” tulkotāju sagatavotiem tekstiem.

“Vizualizējot tas ir aptuveni vienlīdzīgs teksta apjomam, ja saskaitītu vārdus Regīnas Ezeras 13 ­­­­788 grāmatās “Aka”, Sudraba Edžus 62 130 grāmatās “Dullais Dauka”, kā arī apjomam, ko viens ļoti produktīvs tulkotājs, kas strādā astoņas stundas dienā un 231 dienu gadā, spēj paveikt 180 281 dienā vai 780 gados,” stāsta M. Pinnis.

SAISTĪTIE RAKSTI

“Tilde” veikusi analīzi, kāpēc bioloģijas zinātņu doktora Edgara Vimbas vēstulē minētie termini “chicken of the forest”, “chicken of the woods”, “corncrake”, “corn crake”, “landrail”, “rail family” nav iztulkoti pareizi.

M. Pinnis: “Iemesls ir tāds, ka paralēlajos un vienvalodas datos, kas ir izmantoti neironu mašīntulkošanas sistēmu apmācībai, visi dotie termini vai nu nav atrodami vispār, vai arī ir atrodami nepietiekami bieži, lai tiem būtu pietiekama ietekme uz mašīntulkošanas sistēmu.”

LA.LV aicina portāla lietotājus, rakstot komentārus, ievērot pieklājību, nekurināt naidu un iztikt bez rupjībām.
KO
kokteilis.lv
Kokteilis
FOTO. Politiķe Ramona Petraviča ļāvusies erotiskai fotosesijai vīriešu žurnāla lappusēs 185
1 diena
LL
Lilija Limane
Stāsti
Bigauņciemā, stiprai ziemeļvakara vētrai plosoties, jūra ar lielu paisumu izskaloja kareivju līķus 12
1 diena
LA
LA.LV
Ziņas
“Slimnīcā sanitārs saņem vairāk nekā pedagogs skolā.” Kreituse vērtē 2022. gada valsts budžetu 35
6 stundas
LA
LA.LV
Ziņas
Sauka: Es neglaudīšu galvu nevienam nevakcinētajam. Ej un vakcinējies! 204
21 stundas
LA
LA.LV
Ziņas
Papule: savā ziņā veselības ministrs pateica pietiekami atklāti – ārstiem nav vērts vairāk maksāt, jo viņi strādā tāpat 61
16 stundas
Lasīt citas ziņas
OZ
Olafs Zvejnieks
Ziņas
Kādus soļus valdība spērusi pretī uzņēmējiem, pašnodarbinātajiem un autoratlīdzību saņēmējiem? 1
5 stundas
LA
LA.LV
Ziņas
“Slimnīcā sanitārs saņem vairāk nekā pedagogs skolā.” Kreituse vērtē 2022. gada valsts budžetu 35
6 stundas
MA
Māris Antonevičs
Ziņas
Māris Antonevičs: Politiķu mēģinājumi ietekmēt mediju saturu ir sarkanā līnija 7
5 stundas
LE
LETA
Ziņas
Valdība nosaka aizliegumu ceļojumiem uz vairākām Āfrikas dienvidu daļas valstīm 52
8 stundas
OZ
Olafs Zvejnieks
Ziņas
Kādus soļus valdība spērusi pretī uzņēmējiem, pašnodarbinātajiem un autoratlīdzību saņēmējiem? 1
22:48
MA
Māris Antonevičs
Ziņas
Māris Antonevičs: Politiķu mēģinājumi ietekmēt mediju saturu ir sarkanā līnija 7
22:17
LA
LA.LV
Kokteilis
Šodien ir kategoriski aizliegts steigties! Horoskopi 27.novembrim
21:52
VG
Visvaldis Gercāns
Ziņas
Visvaldis Gercāns: Kad Latvijā beigsies dekomunizācija? 33
8 stundas
LE
LETA
Ziņas
Rīgā ierobežos satiksmi NATO ārlietu ministru sanāksmes laikā 8
8 stundas
LA
LA.LV
Ziņas
Aldis Baumanis: Latvijā trūkst informācijas par balstvakcināciju 52
10 stundas
LA
LA.LV
Ziņas
Vai farmaceiti vakcinācijā saskata peļņas iespējas? Atbild Farmaceitu biedrības prezidente 15
11 stundas
LA
LA.LV
Ziņas
Rajevskis: “Ar valdības un ministriju preses relīzēm labākajā gadījumā varētu iekurināt krāsni…” 5
7 stundas
LE
LETA
Ziņas
FOTO. Latgalē avārijas dēļ vidē noplūdušas aptuveni 14 000 tonnas dūņu, piesārņojumam ieplūstot Līksnas upē 15
12 stundas
LA
LA.LV
Ziņas
“Politiķiem un Valsts kancelejai būtu jāpārdomā sava rīcība!” Iekšlietu darbinieku arodbiedrība sašutusi par Valsts kancelejas rīcību algu jautājumā 4
12 stundas
LA
LA.LV
Ziņas
Upaciers: Daļa valsts sektorā strādājošo pieraduši, ka viss kaut kā pats no sevis atrisināsies 42
11 stundas
OZ
Olafs Zvejnieks
Ziņas
Katram pa konfektei: par jauno valsts budžetu ir daudz jautājumu, uz kuriem nevienam nav skaidras atbildes 12
13 stundas
LA
LA.LV
Ziņas
“Šobrīd zaļais sertifikāts ir izgāzts no zinātniskā viedokļa.” Ekonomists Krusts par vakcinācijas ietekmi uz Covid-19 izplatības ierobežošanu 93
16 stundas
LA
LA.LV
Kokteilis
FOTO. Andreja Ēķa romantiskās komēdijas “TABU” kaislības jau no šodienas kinoteātros 8
10 stundas
LE
LETA
Ziņas
Sestdien pār Latviju virzīsies plaša nokrišņu zona – ilgstoši snigs un līs
13 stundas
LE
LETA
Ziņas
Talsos domes vadībai algu palielina pat par 450%, aizmirstot par darbiniekiem 43
14 stundas
LE
LETA
Ziņas
Latvijā joprojām viens no augstākajiem Covid-19 pacientu mirstības rādītājiem ES 64
14 stundas
LA
LA.LV
Ziņas
“Tam ir reālas, konkrētas sekas.” Rinkēvičš komentē NATO 4. panta iedarbināšanu 25
17 stundas
ML
Māra Libeka
Veselam
Valdība liek strādājošajiem darbiniekiem testēties, bet kā process notiks – vēl nav skaidrs 60
17 stundas
GP
Gunta Paavola
Ziņas
“Jau testējam 6G. ” Saruna ar Somijas satiksmes ministru Timo Haraku 4
14 stundas
LA
LA.LV
Ziņas
Papule: savā ziņā veselības ministrs pateica pietiekami atklāti – ārstiem nav vērts vairāk maksāt, jo viņi strādā tāpat 61
16 stundas
LA
LA.LV
Ziņas
“Esmu spiests teikt, ka …” Keris pārmet Pavļutam nevēlēšanos cīnīties par papildus finansējumu mediķu algām 21
15 stundas
LE
LETA
Ziņas
Policija izbeidz pārbaudi. Vai skolotājai no Bauskas izdevās inficēties ar Covid-19? 44
17 stundas
PR
Praktiski.lv
Praktiski
Kartupeļu plācenīši ar cieto sieru: gatavoti uz pannas 1
15 stundas
KO
kokteilis.lv
Kokteilis
FOTO. Cilvēki satraukti par 95 gadus vecās karalienes Elizabetes II veselību: kas noticis ar viņas rokām? 11
16 stundas
LA
LA.LV
Kokteilis
“Lūdzu cienīt komponista piemiņu!”: Mārtiņa Brauna ģimene lūdz neizplatīt melus par viņa nāves iemeslu 2
19 stundas
LA
LA.LV
Kokteilis
Šodien ir kategoriski aizliegts steigties! Horoskopi 27.novembrim
6 stundas