Platforma “SELMA” spēs apstrādāt desmit miljonus satura vienību dienā – vai tas būs videosižets, preses paziņojums vai ziņas – un nepieciešamības gadījumā iztulkos.
Platforma “SELMA” spēs apstrādāt desmit miljonus satura vienību dienā – vai tas būs videosižets, preses paziņojums vai ziņas – un nepieciešamības gadījumā iztulkos.
Foto: Production Perig/SHUTTERSTOCK

Eiropā izveidota platforma, kas palīdzēs nojaukt valodu barjeru 14

Raivis Šveicars, “Latvijas Avīze”, AS “Latvijas Mediji”

ACULIECINIEKA VIDEO. Rīgas centrā pa dzelzceļu ieved desmitiem tanku un militāro tehniku. Kas īsti notiek? 79
Boriss Džonsons nosauc galveno iemeslu, kā varēja izvairīties no Krievijas iebrukuma Ukrainā 33
Simonjana pārliecināta, ka Krievijai steidzami jāiet arī vāciešus “glābt no nacistiem” 21
Lasīt citas ziņas

Eiropas Savienības finansētā projektā “SELMA” izveidotā platforma palīdzēs nojaukt valodu barjeras, “Latvijas Avīzei” apliecināja Latvijas Universitātes Mākslīgā intelekta laboratorijas vadošais pētnieks Guntis Bārzdiņš.

Latvijas Universitātes Matemātikas un informātikas institūts (LU MII) sācis līdzdalību Eiropas Savienības pētniecības un inovāciju programmas “Horizon 2020” projekta “SELMA” īstenošanā.

CITI ŠOBRĪD LASA

Projekta laikā ar dažādu valstu institūciju palīdzību tiks izveidota daudzvalodu atvērtā pirmkoda platforma, kurā, izmantojot dziļo mašīnmācīšanos, izstrādās jaunas metodes mākslīgā intelekta valodas modeļu iegūšanai.

Vienkāršoti runājot, īpašā platformā žurnālisti un mediju analītiķi varēs pētīt tekstuālo un audiovizuālo saturu.

Kā “Latvijas Avīzei” skaidroja LU MII Māk­slīgā intelekta laboratorijas vadošais pētnieks Guntis Bārzdiņš, “SELMA” projektā izveidotā platforma palīdzēs nojaukt valodu barjeras.

“Vēsturiski kvalitatīvas runas transkriptēšanas un tulkošanas tehnoloģijas bija pieejamas tikai lielajām kompānijām, taču jaunākās daudzvalodu dziļās mašīnmācīšanās metodes nepieciešamos valodas modeļus padara pieejamus ikvienam. Projekts lielākoties ir vērsts uz šo visjaunāko tehnoloģiju pielāgošanu mediju vajadzībām, lai atvieglotu to ieviešanu ikdienas darba procesos.”

Līdztekus liela apjoma ziņu tulkošanai un automātiskai grupēšanai pa tēmām, viens no interesantākajiem projekta virzieniem būs automātiska videosižetu tulkošana, kas būtībā ļaus tulkot pat veselas filmas.

Videosižeta tulkošana ietvers vairākus soļus – oriģinālo audio transkriptēšanu, teksta tulkošanu, dažādu balsu runas sintēzi no teksta. Turklāt šie soļi būs jāveic sinhroni, lai tulkotā runa sakristu ar runātāja lūpu kustībām.

Izklausās kā kaut kas līdzīgs jau valodu tehnoloģiju uzņēmuma “Tilde” veidotajām sistēmām, tostarp iespējai ierunātu audiofailu transkriptēt žurnālista vietā.

Diemžēl žurnālistiem sistēma vēl nav īsti izmantojama. Bārzdiņš skaidro, ka runas transkriptēšanas sistēmu kļūdām ir divi avoti – neskaidri izrunāts teksts un jauni, sistēmai nezināmi vārdi – pārsvarā personu uzvārdi un reti lietoti termini.

“Atšķirībā no “Tildes” “SELMA” tehnoloģijas pamatā ir iespēja lietotājam interaktīvi izlabot sistēmas pieļautās kļūdas, un šie labojumi automātiski papildinās “SELMA” vārdu krājumu ar jaunu terminu un uzvārdu pareizrakstību, tādējādi uzlabojot gan tālāko transkripciju, gan tulkošanu, gan runas sintēzi.”

Platforma spēs apstrādāt desmit miljonus satura vienību dienā. Satura vienība varēs būt gan videosižets, gan preses paziņojums dažādos kanālos, gan citas ziņas. Izstrādātāji skaidro, ka platformas mākslīgā intelekta komponenti tiks regulāri pilnveidoti un sistēma spēs pašmācīties.

Svarīgi, ka platforma vispirms apkopos un analizēs saturu oriģinālvalodā, nevis izmantos angļu valodu kā starpniekvalodu. Savukārt tulkošana un runas sintēze citās valodās tiks veikta pēc pieprasījuma.

Projektu gandrīz 3,5 miljonu apmērā pilnībā finansē Eiropas Savienība, taču ikviens no partneriem, tostarp LU, jau iepriekš daudzus gadus strādājuši šīs jomas attīstīšanai.

Bārzdiņš pārliecināts, ka visu “SELMA” partneru kopējās investīcijas šīs jomas attīstīšanai ir mērāmas desmitos miljonu eiro.

“SELMA” projekta konsorciju koordinē starptautiskās raidorganizācijas “Deutsche Welle” inovāciju nodaļa.

Citi partneri ir Aviņonas universitātes Datorzinātņu laboratorija LIA Francijā, valodu tehnoloģiju uzņēmums “Priberam” Portugālē, Fraunhofera Intelektuālās analīzes un informācijas sistēmu institūts Vācijā.

LA.LV aicina portāla lietotājus, rakstot komentārus, ievērot pieklājību, nekurināt naidu un iztikt bez rupjībām.
ACULIECINIEKA VIDEO. Rīgas centrā pa dzelzceļu ieved desmitiem tanku un militāro tehniku. Kas īsti notiek? 79
Boriss Džonsons nosauc galveno iemeslu, kā varēja izvairīties no Krievijas iebrukuma Ukrainā 33
Simonjana pārliecināta, ka Krievijai steidzami jāiet arī vāciešus “glābt no nacistiem” 21
Ar malku vairs kurināt nedrīkstēs? Ministre skaidro, vai Eiropa plāno ierobežot malkas un šķeldas izmantošanu siltumapgādē 104
VIDEO. “Tiešraide” no meža Smiltenes novadā – lūsis sagrauž kamerai vadus, pie reizes nofilmē arī pats sevi
Lasīt citas ziņas
Psihiatra atbrīvojumu no valsts valodas prasmes pārbaudes saņēmuši 22 cilvēki. Dažiem ticis arī atteikums 22
ACULIECINIEKA VIDEO. Rīgas centrā pa dzelzceļu ieved desmitiem tanku un militāro tehniku. Kas īsti notiek? 79
Boriss Džonsons nosauc galveno iemeslu, kā varēja izvairīties no Krievijas iebrukuma Ukrainā 33
“Tēt, lūdzu, elpo!” Šos vārdus ārkārtas tālruņa 113 dispečere sarunas laikā dzirdēja vairākkārt 5
Avīzes pirms 100 gadiem, 1923. gada 1. februāris. Krogā pamatīgi apzagts kāds apskurbis zemnieks
23:09
Ik diena kā laimes spēle. Ukraiņu sporta fotogrāfs Kubanovs: “Mēs negājām uz patvertnēm, ievērojām “divu sienu noteikumu””
22:12
“Tēt, lūdzu, elpo!” Šos vārdus ārkārtas tālruņa 113 dispečere sarunas laikā dzirdēja vairākkārt 5
22:11
FOTO. Filmas veidotāji un citi sabiedrībā pazīstami cilvēki pulcējas “Mātes piens” pirmizrādē
Simonjana pārliecināta, ka Krievijai steidzami jāiet arī vāciešus “glābt no nacistiem” 21
VIDEO. Kadirovs sabēdājies. Pārmet Rietumiem, ka tie glābj neeksistējošu valsti Ukrainu, bet Čečeniju no krieviem nepaglāba 6
Live TEKSTA TIEŠRAIDE. Krievijai neveiksmīgs mēģinājums izlauzties cauri ukraiņu pozīcijām Bahmutā
Vai Saeimas deputātiem vajadzīga augstākā izglītība? Tam pagaidām nav parlamentāriešu atbalsta 3
VID: Pilnībā ir atjaunota EDS darbība. Vai par nokavētiem termiņiem piemēros sodu? 3
Tiek solīts, ka antibiotiku krīze drīz beigsies. Beigsies arī ziemas slimību sezona
Kijivas izmisīgā cīņa par lidmašīnām. ASV un Vācija šoreiz pasaka strupu “Nē!”
Navaļnijs pārvietots uz vieninieka kameru. Cik ilgu laiku viņam tiks liegts satikt cilvēkus? 23
Ukrainā skolās poļu valodu varētu mācīt kā vienu no svešvalodām
Plāno izmaksāt prāvas kompensācijas tiem, kuriem pēc Covid-19 vakcinācijas pasliktinājusies veselība 55
Ar malku vairs kurināt nedrīkstēs? Ministre skaidro, vai Eiropa plāno ierobežot malkas un šķeldas izmantošanu siltumapgādē 104
Drošības dienesta kriminālprocesā vērtēs arī Grevcovas izteikumus par “pilsoņu karu Ukrainā”
Erdogans: Ir nopietns iemesls, kāpēc Zviedrija nevarēs pievienoties NATO. Ar Somiju esot mazāk problēmu 8
VIDEO. Dziedātājas Elīnas Gluzunovas ģimenē smags pārbaudījums – dēliņu piemeklējušas nopietnas veselības problēmas
VIDEO. “Neko neesmu dzēris!” Par interneta “hītu” kļūst video, kurā Bens Aflekss ballītē taisnojas sievai 1
FOTO. “Kāds dekoltē!” Keita Midltone apmeklē pasākumu sev neierastā stilā – spilgts, drosmīgs, seksuāls 10
“Ryanair” ievērojami samazinās galamērķu un reisu skaitu no Tallinas un Vilņas lidostas
FOTO. Cinisms, meli, krāpšana – šķebinoša patiesība nāk klajā par kādu Latvijas dzīvnieku glābšanas biedrību 5
Kādas “semočkas” kaisītas pasaules sporta galvenā vadītāja priekšā? Līcīša feļetons par agresorvalstīm atkal lielajā sportā
Ik diena kā laimes spēle. Ukraiņu sporta fotogrāfs Kubanovs: “Mēs negājām uz patvertnēm, ievērojām “divu sienu noteikumu””
Pirmais solis elektrības izmaksu samazināšanā. Valdība sāk ar normatīvo aktu sakārtošanu – ko tas mainīs?
VIDEO. Pārim par dejošanu uz ielas piespriests 10 gadu cietumsods 3
VIDEO. Jēkabpilī tiek veikts ārkārtas dambja remonts, gatavojoties iespējamajiem pavasara plūdiem