Arī robotiem jārunā latviski 0

15:26, 22. aprīlis 2018

Ziņas Latvijā

“Latviešu valoda nedrīkst kļūt par ķēķa valodu,” stingri nosaka tehnoloģiju uzņēmuma “Tilde” vadītājs Andrejs Vasiļjevs. Viņaprāt, ceļš uz stabilu latviešu valodas vietu digitālajā vidē nebūs viegls, taču to ietekmēt varam tikai mēs paši – gan sabiedrība kā kopums, gan apņēmīgi latviešu uzņēmumi. “Tildes” vadītāju “LA” izvaicāja par latviešu valodas un saziņas nākotni, kā arī mākslīgā intelekta izaicinājumiem.

Reklāma

Lasītākie

Kokteilis

Mākslīgais intelekts nosauc 5 sieviešu un 5 vīriešu vārdus, kas nes laimi to īpašniekiem 24

Putins ir izmēģinājis jaunu “superieroci”, kādu pasaule “vēl nav redzējusi” 156

Kokteilis

Magnētiskās vētras 2024. gada aprīļa beigām – visbīstamākās dienas

Lasīt citas ziņas

Vai digitalizācija apdraud latviešu valodu?

A. Vasiļjevs: Skatoties pasaules valodu kontekstā, latviešu valoda ir labā situācijā. Latviešu valodā ir krietni virs miljona runātāju. Pasaulē ir vairāk nekā 6000 valodu un lielākā daļa ir ar mazāku runātāju skaitu. Latviešu valoda ir oficiāla valsts valoda ar plašu lietojumu visās dzīves jomās, tā ir arī viena no Eiropas Savienības (ES) oficiālajām valodām – tas ir mūsu spēks. Tas dod ļoti spēcīgu pamatu. No otras puses – pašreizējā labā situācija nedrīkst iemidzināt, jo valoda nepārtraukti attīstās un valodai jāspēj turēties līdzi mūsdienu dinamiskajiem attīstības procesiem.

Valodas lietojums digitālajā vidē ir plašāks nekā jebkur citur. Ar digitālajiem saziņas līdzekļiem mēs komunicējam vairāk nekā ikdienā sarunājoties. Cilvēki daudz vairāk komunicē internetā, nekā tiekas klātienē. Daudz vairāk lasa elektroniskos līdzekļus nekā drukātos. Tā ir jauna digitālā telpa, kurā valodai jābūt stiprai.

Angļu u. c. lielajās valodās ārkārtīgi strauji attīstās tehnoloģijas – balss tehnoloģijas, virtuālie asistenti, kas saprot, ko jūs viņiem prasāt, māk piemeklēt un sniegt atbildi līdzīgi kā sarunājoties ar cilvēku. Svarīgi, lai šādas iespējas būtu arī latviešu valodai. Ja to nevarēs darīt latviešu valodā, jaunā paaudze ļoti ātri pāries uz angļu valodu. Ja nenodrošināsim šīs latviešu valodas iespējas, tad saziņā angļu valoda arvien dominēs, bet latviešu valoda kļūs par nosacītu ķēķa valodu. To pieļaut nedrīkstam.

Ko darīt, lai tas nenotiku?

Jāattīsta tehnoloģijas. Taču nevaram vienkārši sēdēt rokas klēpī salikuši un gaidīt, kad lielie uzņēmumi – “Google”, “Microsoft”, “Facebook” u. c. – nāks ar saviem brīnišķīgajiem risinājumiem. Šie uzņēmumi darbojas pēc ekonomiskajiem apsvērumiem, un tie investē milzīgus līdzekļus tur, kur ir lielo valodu tirgi.

Pasaulē ir 15 dominējošās valodas, kurās runā vairāk nekā puse planētas. Tieši šajās valodās lielie uzņēmumi attīsta savas tehnoloģijas. Tāpēc redzam, ka ne tikai latviešu valodā, bet daudzās citās valodās vai nu vispār nav iespējas darīt to pašu ko angļu valodā, vai daudz sliktākā kvalitātē. Tas ir ierobežotā tirgus dēļ. Tāpēc jāstrādā pašiem.

No otras puses, tas ir ļoti sarežģīti un dārgi. Tehnoloģijās lielajām valodām investē burtiski miljardiem dolāru. Tad jau var arī vien noelsties un teikt: “Ko tad mēs, mums jau nav līdzekļu un iespēju…” Bet Eiropa mums šīs iespējas paver. Tās nenāk pašas, taču tāpēc esam izveidojuši tīklu no līdzīgi domājošām organizācijām visā Eiropā, kuru sauc par “META-NET” un kurā iekļaujas pētniecības centri no visas Eiropas. Vienā no pētījumiem pierādījās, ka tās problēmas, par kurām runājam Latvijā, ir līdzīgas lielākajā daļā Eiropas. Izrādās, ka 21 Eiropas valoda nav pietiekami nodrošināta digitālās pasaules izaicinājumiem. Apvienojot spēkus ar citu valodu kopienām, varam panākt būtiskas izmaiņas. Piemēram, Eiropas Komisija (EK) jau iniciējusi virkni pasākumu, lai pārvarētu valodas barjeras un palīdzētu attīstīt šīs tehnoloģijas.

Reklāma

Runājam par valodas digitalizēšanu, bet kā cilvēkiem likt cienīt valodu?

Valoda ir interesanta. Man patika Māras Zālītes teiktais, salīdzinot valodu ar puķu lauku, kur puķes ir dažādas. Ja pļava par daudz aizaug ar nezālēm, tās jārauj ārā. Taču ziedu daudzveidība šo pļavu padara skaistu. Valodai ir dažādi slāņi – ir literārā valoda, sarunvaloda, nozaru valoda utt. Svarīgi, lai cilvēkiem attīstās valodas izjūta un viņi saprastu, kādā kontekstā kādu valodu lietot.

Sarunājoties ar draugiem, ir viena valoda. Bet redzam, ka tādā pašā stilā cilvēki sazinās arī lietišķajā vidē, uzņēmējdarbībā. Tādā veidā nodarām ļaunumu paši sev, jo valoda ir mūsu intelektuālās higiēnas rādītājs. Piesārņota, slikta valoda liecina par sliktu intelektuālo higiēnu. Arī es vienmēr esmu bijis piesardzīgs, ja darba pieteikumā ir kļūdas, žargonismi utt. Vai arī kāds uzņēmums prezentē piedāvājumu ar valodas kļūdām. Vai šādam uzņēmumam var uzticēties? Tas ir valodas kultūras jautājums.

Vēl atceros tos brīžus, kad atvērās dzelzs priekškars un likās, ka jāizraujas no būra un jābūt kā rietumniekiem. Kārkluvācietības efekts, kas jau vēsturiski mums piemitis, piemēram, tolaik ņemot pārcēlumus no vācu valodas, tagad līdzīgi darbojas ar angļu valodu.

Pasaulē ir ļoti daudz cilvēku, kuri zina tikai angļu valodu, un man liekas, ka viņi savā ziņā ir apdalīti, jo pasauli redz daudz šaurāk. Deminutīvu piemērs – angliski tos nevar pārtulkot. Angļu valodā arī dzimtes jēdziens nav tik izteikts. Izrādās, ka angliski saule ir vīriešu dzimtē, bet mēness sieviešu dzimtē. Tas veido citu psiholoģisko attieksmi. Mums ir “saulīte māmuliņa” no Dainām, “Mēnestiņš čigāniņš”. Mums ir pavisam cits skatījums, un tās ir nianses, kas ar valodu iekodē mūsu pasaules uztveri.

Runājot par valodu tehnoloģijām – kad divu dažādu valodu pratēji varēs bez problēmām sarunāties, nojaucot komunikācijas barjeru?

Nākotne top jau šodien. “Google” izlaidis austiņas, kurās ir iebūvēta tulkošanas iekārta. Cik labs ir šis tulkojums, to grūti teikt. Pie tā strādā vēl pāris uzņēmumu, taču atkal ir jautājums – vai šī tulkošana būs arī mums? Šobrīd balss tulkošana strādā tikai starp lielajām valodām. Bet šādas iespējas vajag arī latviešu valodā.

Lielās valstis nesaprot un neizjūt mūsu jautājumus kā lielas problēmas, ar viņu valodām viss ir kārtībā, bet, ja mūsu politiķi kopā ar citu valstu politiķiem par to runās pie viena galda, to nevarēs ignorēt. Man ir sajūta, ka mēs Eiropas politiskajai darbakārtībai vairāk esam sekotāji – izsakām viedokli par to, par ko mums paprasa, bet mūsu politiķi nav pietiekami aktīvi, paši izvirzot mums svarīgos jautājumus. Man bija iespēja runāt ar slaveno futurologu Alvinu Tofleru, kurš norādīja, ka mazās valodas lielajā konkurencē spēs izdzīvot tikai tad, ja spēs izmantot tehnoloģijas savā labā un novērsīs valodas barjeru.

Minējāt lielo valodu dominanci. Jautājums no novērotā – kāpēc “Google” tulkotājā starp angļu un krievu valodu tulkojums ir teicams, bet tulkojums starp latviešu un angļu vai krievu – tik slikts?

“Google” ir diezgan noslēgta kompānija. Kā veidota viņu sistēma, viņi neatklāj, bet, visdrīzāk, tulkojums latviešu valodā tiek veikts ar angļu valodas starpniecību. Ja oriģinālteksts ir krievu valodā, to pārtulko angliski un tālāk latviski, tad nav brīnums, ka beigās tulkojums ir jocīgs. Mūsu valoda viņiem ekonomiski nav interesanta. “Google” vadās pēc biznesa apsvērumiem, tāpēc neiegulda īpašus līdzekļus latviešu valodas attīstībā.

Tehnoloģiski viss balstās uz mašīnmācīšanos, ko mūsdienās izmanto visi inovatīvie uzņēmumi, tostarp mēs. Princips ir vienkāršs – dators iemācās tulkot no cilvēku tulkojumiem. Analizējot cilvēku tulkojumus, sistēma atrod sakarības un izveido kompleksus modeļus, kas parāda to, kā tulkot. Bet, lai tas strādātu pēc iespējas labāk, vajag milzīgi daudz tulkojumu – miljonu miljoniem –, un te mums ir problēmas. Angļu–ranču valodā dators māk tulkot lieliski, jo šajās valodās ir pārtulkots milzīgs informācijas apjoms. Kā arī šajās valodās nav tik daudz vārdformu. Nav tā morfoloģiskā bagātība, kas latviešu valodai. Tā ir vēl viena mūsu bagātība – vairāk nekā 20 miljoni vārdformu ar visiem locījumiem. Taču tehnoloģiski tas ir traucēklis, jo datoram grūtāk apgūstams…

“Google” nelielajām valodām izmanto vienu sistēmu, kurā “ieber” tekstus, mašīna tos iemācās un veido tulkojumus, turpretim mēs veidojam īpašus risinājumus tikai latviešu valodai, arī igauņu, lietuviešu, norvēģu, somu, dāņu valodai. Veidojam šo sistēmu gudrāku un to piemērojam katrai valodai.

Tā mēs nonākam pie “Tildes” neironu mašīntulka. Kas tas ir?

Neironu mašīntulkošana ir liels lēciens mašīntulkošanas tehnoloģijās. Pamatprincips ir tāds pats – dators mācās no tekstiem, bet mācīšanās spēja un gudrība ir daudz lielāka, jo izmantojam neironu tīklus, kas ir mākslīgā intelekta populārākā tehnoloģija. Ļoti jaudīga tehnoloģija, kas ļauj daudz labāk analizēt sakarības un precīzāk piemeklēt labāko tulkojumu. Kad parādījās neironu tīklu tehnoloģijas, Edinburgas universitāte bija viena no pirmajām, kas izveidoja sistēmu ar neironu tīkla priekšrocībām. Savukārt mēs bijām pirmie, kas izveidoja neironu tīkla mašīntulku mazajām valodām.

Tehnoloģija sevi labi parādīja arī Igaunijas prezidentūras laikā, kad mums uzticēja veidot īpašu risinājumu. Tagad sadarbojamies arī ar Bulgārijas prezidentūru un gatavojamies Austrijas prezidentūrai, kurā izstrādājam īpašus mašīntulkošanas risinājumus.

Kā mašīntulkošanu var izmantot uzņēmumi, lai uzlabotu savu darbību?

Tehnoloģija ļoti noder uzņēmumiem, kuri strādā dažādās valstīs un kuriem nepieciešams pārtulkot savus produktu aprakstus. Mašīntulks krietni atvieglo un efektivizē tulkošanas procesu. Tas nenodrošina uzreiz perfektu tulkojumu un neaizvieto cilvēku, bet ir ļoti labs kā palīgrīks. Tā vietā, lai tulkotu tekstu no sākuma līdz beigām, tulkotājam vien jāpārskata mašīntulkojums, jāpārbauda, vai tas ir gramatiski un saturiski pareizs. Tādā veidā var ātrāk un lētāk iztulkot informāciju. Mēs, piemēram, nodrošinām tulkojumu skandināvu valodās pazīstamajam uzņēmumam “IBM”.

Vai šī tehnoloģija var palīdzēt valstu ekonomiku izaugsmei?

Šķiet, ka ilgtermiņa ekonomisko panākumu atslēga ir fokuss uz augstu pievienoto vērtību. Jau sen neesam lētā darbaspēka valsts, mums vajag attīstīt šīs gudrās jomas, gudrās nozares un veidot gudru sabiedrību. Latvijā nebūs daudz uzņēmumu, kas veidos risinājumus kā “Tilde”, jo tas prasa ļoti specifiskas zināšanas, bet gatavus mākslīgā intelekta risinājumus, kas pieejami arī kā mākoņpakalpojumi, var dažādos lietojumos integrēt arī bez ļoti dziļām zināšanām.

Domāju, ka Latvijā jāattīsta uzņēmējdarbība, kurai ir augsta pievienotā vērtība. Ceru, ka jaunie cilvēki saskatīs iespējas Latvijā un arī tie, kas brauc mācīties ārvalstīs, gribēs atgriezties Latvijā, lai radītu inovācijas šeit. Varbūt esam pārāk paškritiski vai kompleksaini, dažreiz arī nenovīdīgi un skaudīgi, bet tā tas ir daudzām mazām nācijām. Jāapzinās, ka mēs varam būt inovāciju laboratorija, kur var ātri attīstīt jaunus risinājumus, tos pārbaudīt savās mājās un ātri ar tiem iet pasaulē.

Kas būs nākamais tehnoloģiskais izrāviens valodu ziņā?

Nākamais lielais lēciens būs virtuālie asistenti, lai cilvēkiem būtu arvien vieglāk saņemt informāciju, iegūt atbildes uz jautājumiem. “Apple” ir savs asistents “Siri”, kas strādā angļu valodā, krievu valodā, bet nestrādā latviešu valodā. Tas ir milzīgs virziens, kas attītās, lai mēs varētu sazināties ar iekārtām un lai šīs iekārtas nevis vienkārši balsi pārveidotu tekstā, bet mācētu analizēt teksta jēgu. Šī jēga un saprašana ir liels izaicinājums. Mašīntulkošanas, neironu tīklu tehnoloģijas neiedziļinās tekstu jēgā, bet analizē vārdus kā simbolu virknes, jo vēl nav atrasti modeļi, kā datoram labi apstrādāt un no teksta iegūt jēgu. Tas būs nākamā gadu desmita lielais izaicinājums.

Jūs esat viens no tiem, kas parakstīja ANO adresētu vēstuli par mākslīgā intelekta draudiem cilvēcei. Vēstulē runāts par mākslīgā intelekta ieročiem. Vai mākslīgais intelekts mūs apdraud?

Nesen aizsaulē aizgājušais Stīvens Hokings vēl novembrī brīdināja: “Mākslīgais intelekts var būt cilvēces lielākais atklājums, bet var būt arī cilvēces postošākais atklājums.” Mēs nezinām, kurš no šiem scenārijiem nostrādās. Tāpēc jābūt gataviem arī sliktākajam scenārijam un jāstrādā pie aizsargmehānismiem. Var likties, ka tā ir zinātniskā fantastika – robotu dumpis utt. Mākslīgajam intelektam nepiemīt apziņa cilvēka nozīmē, nepiemīt savs nolūks, bet kā jebkura tehnoloģija arī šīs tehnoloģijas ir nepilnīgas un var būt kļūdainas. Šīm kļūdām var būt ļoti smagas sekas. Tehnoloģijas ir tik jaudīgas un komplicētas, un mūsu spējas tās kontrolēt un paredzēt to darbību kļūst arvien ierobežotākas.

ASV bija tāda sistēma, kas cilvēka vietā izlēma, vai apsūdzēto paturēt apcietinājumā vai atlaist pret drošības naudu. To ieviesa, lai novērstu tiesnešu subjektivitāti. Taču, analizējot rezultātus, izrādījās, ka programma atražo vecos aizspriedumus, stereotipus. Sistēma daudz biežāk apcietinājumā paturēja melnādainos. Ne jau tāpēc, ka sistēmā tā bija ieprogrammēts. Tāpēc, ka sistēma bija apmācīta, izmantojot vēsturiskos datus, kad, protams, ilgus gadus melnās rases pārstāvju starpā noziedzība bija lielāka. Tāpat arī šāda sistēma daudz mazāk kredītus izsniedza sievietēm, tās joprojām uzskatot par mājsaimniecēm.

Cits piemērs – mākslīgais intelekts medicīnā. Pasaulē katru nedēļu parādās milzīgs jaunas informācijas apjoms par dažādām slimībām, ārstēšanas metodēm un klīniskiem pētījumiem. Neviens ārsts to visu nevar izlasīt un apstrādāt, bet dators var. Turklāt dators var ārstam sniegt padomus par ārstēšanas metožu lietošanu vai diagnožu noteikšanu. Taču sistēmas ir tik komplicētas un informācijas ir tik daudz, ka vairs nevar izsekot šai lēmumu pieņemšanas ķēdītei. Daudzos gadījumos sistēma var dot ļoti labu ieteikumu, bet var būt gadījumi, kad šis ieteikums ir nāvējošs. Taču ķēdīti – kad un kā sistēma kļūdījās – atrast nevar.

Arvien grūtāk saprast, kāpēc šīs sistēmas pieņem dažādus lēmumus. Jo tās kļūst jaudīgākas, jo redzam vairāk labuma un potenciālos ieguvumus. Taču jo vairāk šīm sistēmām uzticamies, jo lielāks risks ir uzķerties uz kļūdām un neveiksmīgajiem gadījumiem. Šo vēstuli ANO parakstīju, jo par šiem jautājumiem ir ļoti svarīgi runāt jau tagad. Vēstulē runājam par nāvējošiem autonomajiem ieročiem, bet riski ir arī citās jomās. No mākslīgā intelekta nevajag baidīties, bet nopietni jāpiestrādā pie drošības mehānismiem.

Gribam domāt, ka tehnoloģijas izmanto tikai labiem nolūkiem, taču tās attīsta arī režīmi, kuriem nav labākie mērķi. Mums nav tālu jāmeklē, tāpēc jāveido aizsargmehānismi, lai ar mūsu sabiedrību nevarētu manipulēt vēlēšanu u. c. procesos.

Kādā situācijā mākslīgais intelekts ir Latvijā?

Situācija kopumā ir laba. Universitātēs ir gana spēcīga pētnieciskā bāze un ir inovatīvi uzņēmumi, kas saprot, ka tieši mākslīgais intelekts var uzņēmumu padarīt konkurētspējīgu. No valsts puses skatoties, nereti konkurējam ar igauņiem, kuri ar ļoti labu mārketingu sevi nopozicionējuši kā e-lielvalsti. Arī mums ir brīnišķīgas e-lietas, un tieši mākslīgais intelekts, to ieviešot e-pārvaldes sistēmās, var padarīt valsts pārvaldi draudzīgāku, atvērtāku iedzīvotājiem.