avatar
2012. november 25. /

A Microsoft megalkotta a „Bábel-halat”

babel fish translator

A Galaxis-útikalauz stoposoknak című Douglas Adams-regény kitalált élőlénye, amelyet bárki a fülébe dugva azonnal megért minden nyelvet, már nem a jövő zenéje.

Rick Rashid, a Microsoft szoftveróriás kutatási igazgatójának blogbejegyzéséből kiderül, hogy a program jelenlegi állapotában ugyan még számos hibát ejt, mégis sokkal jobb, mint bármely korábbi hasonló próbálkozás.

Saját hangunkon beszélhetünk folyékonyan kínaiul, franciául vagy bármely más, számunkra idegen nyelven a Microsoft új fejlesztésének segítségével, amely a hangzó beszédet alakítja át „gépi szinkrontolmácsként” a választott nyelvre.

Rashid az októberi, Tiencsinben tartott bemutatón néhány mondatát mandarin nyelven mondta el a program segítségével.

A fejlesztők számára a legnagyobb kihívást a beszélő megértése jelenti – idézi az igazgatót a TechNewsDaily.com című online magazin. Ezen a problémán már azóta dolgoznak, mióta a számítógép létezik. A több generációnyi fejlesztés mai eredménye például az Egyesült Államok bizonyos bankjaiban működő telebankrendszer, amelyben a komputer ismeri fel a hívó által bemondott bankszámlaszámot. Az ilyen rendszerekben a beszédfelismerés azonban csak a számnevekre és esetenként néhány menüpontra – például „átutalás”, „nyitva tartás” – korlátozódik.

Sokkal nehezebb azonban a kötetlen beszéd digitális „megértése”. Egészen mostanáig az efféle programok a beszédnek legfeljebb 75-80 százalékát voltak képesek értelmezni – mondta Rashid. A Microsoft ezt az arányt igyekezett javítani a Deep Neural Networks rendszerének segítségével, amelyben a processzorok úgy kapcsolódnak egymáshoz, mint az emberi és állati agysejtek. A Google ugyanezt a technikát használta a nyáron egy olyan számítógép megépítéséhez, amely meg tudja tanulni a macskákról készült képek felismerését.

Rashid szerint az új fejlesztés mára a szabad beszélt nyelv 86-88 százalékát felismeri. „Még mindig távol van a tökéletestől, mégis ez a legdrámaibb fejlődés az 1979 óta”.

Miután a rendszer felismeri, hogy mit mond angolul a felhasználó, a Microsoft fordítóprogramja átalakítja azt kínai szavakká, majd a szórendet a nyelvtani szabályok szerint megváltoztatja. A megfelelő hangszín eléréséhez Rashidnak egy órányi beszédére volt szükség, valamint fel kellett vennie egy mandarin anyanyelvű személy néhány órás beszédét is.

„Még sok munka vár ránk, de a technológia nagyon ígéretes. Reméljük, hogy néhány éven belül olyan rendszerek állnak majd rendelkezésünkre, amelyeket teljességgel lebontják az emberek között nyelvi akadályokat” – mondta az igazgató.

Forrás: MTI

{jcomments on}

Megosztás: