Latvijā apmācīts mākslīgā intelekta risinājums, kas automātiski transkribē runu
Tet ir pabeidzis darbus pie mākslīgā intelekta latviešu valodas projekta “teksts uz balsi”, kas nozīmē automātisko audio tekstu transkribēšanu rakstiskajā formātā. Risinājums palīdzēs automatizēt klientu apkalpošanas procesus, uzlabojot to kvalitāti, kā arī ļaujot paātrināt ienākošo pieprasījumu klasifikāciju un apstrādi. Ar tehnoloģijas palīdzību ir iespējams izveidot virtuālo asistentu, kas ir spējīgs ne tikai nolasīt tekstu, kā tas tiek darīts robotzvanos, bet arī “saprast”, ko saka klients, un pilnvērtīgi atbildēt uz jautājumiem. Izveidotais risinājums ir unikāls ar to, ka ir izdevies sasniegt latviešu valodas transkribēšanas precizitāti 95% apmērā, kas nozīmē, ka teksts tiek transkribēts gandrīz pilnībā pareizi.
“Lai izveidotu “teksts uz balsi” risinājumu, vispirms ekspertiem bija jāsagatavo kvalitatīvi audio materiālu atšifrējumi. Klausoties audio failus, darbiniekiem bija jāpiefiksē arī mazie vārdiņi – “jā”, “vai”, “tad”, “bet” utt., kas nozīmē, ka dažus ierakstus nācās noklausīties vismaz 30 reizes. Tehnoloģija balstās mašīnmācīšanās risinājumā, un lai sāktu mašīnas apmācību, bija nepieciešamas 100 stundas ar kvalitatīvajiem audio failiem. Sagatavošanas darbos mēs pavadījām vairāk nekā 3 000 stundas. Sasniegtais rezultāts priecē – šobrīd algoritms precīzi atpazīst latviešu valodas vārdus, un kļūdu skaits(WER – worderrorrate) ir vien 5%. Salīdzinājumam – Microsoft un Google angļu valodas risinājumiem šis rādītājs arī ir 5%, un viņu gadījumā šāds rādītājs tika sasniegts, atšifrējot augstas kvalitātes audio failus bez fona trokšņiem un ar pareizo angļu valodas izrunu. Tet risinājums parāda šādu sniegumu no reālām klientu sarunām – ar fonu trokšņiem, kā arī dikcijas un izrunas īpatnībām. Cilvēka WER ir aptuveni 4%,” stāsta Tet mākslīgā intelekta pakalpojumu vadītāja Inese Zariņa.
Tehnoloģijas pielietošanas lauks ir ļoti plašs – ar to palīdzību var transkribēt jebkurus audio failus ar runu latviešu valodā – sanāksmes, zvanus, filmas, automātiski veidot titrus, veikt anketēšanas. Kā arī, apvienojot “balss uz tekstu” un “teksts uz balsi” tehnoloģijas, tiek veidoti arī “visgudrākie” virtuālie asistenti, piemēram, Siri un Alexa. “Klientu apkalpošanas jomā šis risinājums paver jaunas iespējas gan datu analīzei, gan arī darbinieku atslogošanai no manuālajiem darbiem, kas prasa daudz laika. Piemēram, darbiniekam ir nepieciešams atlasīt konkrētu klientu pieprasījumu vai pakalpojumu. Tā kā sarunas jau ir automātiski atšifrētas, to var izdarīt ar vienu klikšķi, ievadot atbilstošus atslēgas vārdus –līdzīgi kā Google meklētājā,” skaidro I. Zariņa.
Tehnoloģijai ir liels potenciāls klientu servisa digitalizācijā un uzlabošanā, kas ir aktuāls jautājums visā pasaulē, un tā būs pieejama arī citiem uzņēmumiem un iestādēm.“Momentāni analizējot pieprasījumus un pieteiktos problēmjautājumus, ikviens uzņēmums varēs identificēt kritiskās prioritātes un paātrināt uzlabojumus klientu servisā,” piebilst Tet pārstāve.
2020. gadā Tet realizēja vērienīgo "teksts uz balsi" projektu, kura rezultātā čatbots Anete ieguva balsi. Tuvākajā laikā, pieslēdzot “balss uz tekstu” tehnoloģiju, arī Anete varēs atbildēt uz personificētajiem klientu jautājumiem.
Kas ir “teksts uz balsi”