istraživanje

Google je stvorio bazu podataka s tisućama sintetiziranih govornih zapisa.

Čini se da u bliskoj budućnosti ljudska komunikacijabiti će sveden na minimum. Barem sve ide na ovo: ovdje je, primjerice, Google uspio prikupiti bazu podataka iz tisuća zapisa sintetiziranog engleskog govora, navodi se u blogu tvrtke. Stoga su stručnjaci još jedan korak bliže osiguravanju da sustav može reproducirati usmeni govor, koji se neće razlikovati od čovjeka.

Sinteza govora potrebna je za formiranje govorasignal iz tiskanog teksta i uopće nije nužno da osoba koja snima svoj glas za sustav u potpunosti izgovori sve fraze. Za konačni model dovoljan je reprezentativni uzorak podataka - i tada sam sustav određuje koliko fonema treba za daljnju sintezu.

Zašto se snimanje govora prikuplja u jednom velikom mjeriluprijenos podataka? Činjenica je da, ako se pokaže da je visokokvalitetna sinteza u rukama uljeza, oni mogu koristiti tuđi glas za vlastite sebične svrhe. Kako bi to spriječili, Googleovi stručnjaci objavili su bazu podataka s nekoliko tisuća izvoda iz novina. Za čitanje je korišteno 68 različitih sintetiziranih glasova. Međutim, dok je podatkovni niz dostupan samo sudionicima natjecanja automatske provjere zvučnika. Oni stvaraju sustave koji automatski razlikuju sintetizirani govor od stvarnog govora.

Prije dvije godine tvrtka Lyrebird iz Montrealastvorio sintetizator govora na bazi umjetne inteligencije koji je sposoban reproducirati bilo koji glas. Za praćenje sustava potrebno je samo nekoliko sekundi da se čuje glas tražene osobe, na temelju kojeg će se stvoriti zvučni fragment. Točna imitacija glasa moguća je upotrebom neuronskih mreža koje se temelje na umjetnoj inteligenciji, radeći na istim načelima kao i neuronske mreže ljudskog mozga. AI uči prepoznati karakteristike ljudskog govora, a zatim se ti podaci već koriste za sintetiziranje umjetnog glasa.

Istina, postoje neke nedostatke: postoje problemi s razumljivošću govornog govora, postoje "artefakti glasa" i neki drugi znakovi koji ukazuju na to da riječi izgovara stroj.

Ne zaboravite se pretplatiti na naš news feed.