Alqoritm danışanın orijinal səsini yadda saxlayır.
“Google”, yeni Translatotron şifahi sinxron tərcümə texnologiyasını təqdim edib. Bu barədə şirkət öz bloqunda məlumat verib.
Adətən bir dildən digərinə şifahi tərcümə zamanı sistemlər kaskad modelindən istifadə edirlər. Əvvəlcə sistem avtomatik olaraq, nitqi transkripsiyası üçün tanıyır, sonra alınan mətnin maşın tərcüməsini həyata keçirir, daha sonra isə mətni səsə çevirir. Belə sistem eyni zamanda “Google Translate”-də də istifadə edilir.
Yeni eksperimental alqoritm “Google” nitqin mətn şifrələnməsi mərhələsinə başlayır. Neyroşəbəkə səsli audioyazının spektroqrammasını qəbul edir və onu digər dildəki nitqlə sintezləşdirir. Sonra alqoritm audiofaylı sintezləşdirir.
Bundan başqa, Translatotron nitqdəki intonasiyanı və fasilələri, həmçinin tərcümə vaxtı danışanın səsini də yadda saxlaya bilir. Lakin səsin yadda saxlanması zamanı tərcümə bir qədər dəyişir, çünki, bu neyroşəbəkə versiyası daha az məlumat tapşırığına malikdir.
“Google” mütəxəssisləri alqoritmin işini BLEU-metodun köməyi ilə yoxlayıblar, bu zaman maşın tərcüməsi şəxs tərəfindən edilən tərcümə ilə müqayisə edilir. Onlar şifahi nitqi ispan dilindən ingilis dilinə tərcümə ediblər. Testin yekununa görə, mütəxəssislər etiraf ediblər ki, Translatotron hələ ki, kaskad modelindən aşağıda gəlir. Lakin, Translatotron nitqi birbaşa bir dildən digərinə tərcümə edə bilən ilk texnologiyadır, “Google”-da bildirirlər.
Alqoritmin iş nümunəsinə “Google”-un “Github”-dakı səhifəsində baxmaq olar.