Egy gép beszél a megnémult rádióriporter helyett

Mesterséges intelligencia segítségével kapta vissza a hangját egy amerikai rádióriporter, aki egy ritka idegrendszeri betegség miatt két éve nem tud beszélni – írta a BBC hírportálja.

Az 54 éves Jamie Dupree, a Cox Media riportere „új hangját” a skót CereProc technológiai cég készítette.

Korábbi hangfelvételei alapján „megtanították” egy ideghálózatnak – ami a gépi tanulás működésének alapja -, megjósolni, hogy fog Dupree elmondani egy szöveget.

„Ez megmentette az állásomat és a családomat az anyagi csődtől. Nincs túl sok lehetőség az olyan rádióriporter számára, aki nem tud beszélni”

mondta a BBC-nek a rádiós.

Ahhoz, hogy egy ember beszédhangját a gép reprodukálja, általában harmincórás felolvasásra van szükség, ez alatt tud a mesterséges intelligencia elég adatot gyűjteni

A mesterséges intelligenciáknak eddig egy hónap kellett ahhoz, hogy egy ember hangját reprodukálják, a módszer nagyon drága is volt.

A CereProc 2006-ban kezdte kidolgozni saját ideghálózatát, hogy a folyamatot felgyorsítsa és olcsóbbá tegye. Ma ez néhány nap alatt, mindössze 500 fontért (185 ezer forint) elkészíti egy ember hangját, ha a felhasználó a cég portálján felveszi a saját hangját, amint egy szöveget felolvas.

A mesterséges intelligencia minden felolvasott szót száz apró részletre bont. Sok gyakran használt szó felbontása után végül megtanulja a felolvasó ember hangképzésének működését és minden egyes szóhoz hozzárendeli a benne lévő fonetikai elemek sorrendjét.

Az ideghálózat saját hangokat is képes előállítani és meg tudja jósolni, hogyan hangzana, ha egy adott ember egy beszélgetésben elmondana egy sor szót.

Dupree 35 éven át politikai tudósításokat készített az Egyesült Államok Kongresszusából. 2016-ban kezdte elveszíteni a hangját, bár hangszálai, torka és gégéje rendben voltak. Hosszas vizsgálatok után megállapították, hogy ritka idegrendszeri zavar miatt a nyelve előreesik a szájüregbe és a torka megfeszül, valahányszor meg akar szólalni, így képtelen egyszerre két-három szónál többet kimondani.

A riporter mégsem hagyta abba a munkát, interjúkat írt, de az éterből lényegében eltűnt a hangja. Munkaadója a CereProchoz fordult, melynek segítségével Dupree június 25-től újra „megszólalhat”: megírja a szövegét, amit egy program beszéddé alakít és az ő hangján hangzik el a rádióban.

„Kétségtelen, hogy én szólalok meg, ugyan kicsit robotszerűen, de senki sem ígérte, hogy tökéletes lesz” – mondta Dupree.

Megosztás: