Társalgási interfészek Kínából

2016. március 04. 09:00

A Baidu hang- és beszédtechnológiái begyorsíthatják az ember-számítógép interakció fejlődését. Programok előbb-utóbb az embernél pontosabban írnak át mandarinul elhangzó szövegeket.

2016. március 04. 09:00

A Baidu világviszonylatban is az egyik legfontosabb szereplője a Kínában egyre gyorsabban terjedő társalgási interfészek fejlesztésének. Ezek az interfészek teszik hatékonyabbá az ember-gép interakciót.

A gépi tanulás fejlődésével praktikusabbak lettek a hangalapú alkalmazások, például a hangvezérlés, és az interfészek akár zajos környezetben is működnek.

„A beszédtechnológia közelít egy ponthoz, ahol annyira megbízható lesz, hogy utána már csak használni fogjuk, és nem is gondolunk rá. A legjobb technológia gyakran láthatatlan, és remélem, a beszédfelismerés is így fog eltűnni a háttérben” – jelentette ki Andrew Ng, stanfordi docens és a Baidu vezető kutatója.

Szerinte a hang hamarosan többeszközös interakcióra is alkalmas lesz. Olyan eszközökre is gondol, mint például a robotok és a háztartási berendezések.

A Baidu pekingi és szilícium-völgyi csapata a pontosabb beszédfelismerésen és azon dolgozik, hogy a számítógépek hatékonyabban elemezzenek mondatokat. 2015 novemberében a cég szilícium-völgyi részlege bejelentett egy a hangokat szavakkal és mondatokkal összetársító mély ideghálóból álló beszédfelismerő motort. Az ideghálóba többmillió átírt beszédpéldát tápláltak, azokon gyakorol. A kutatók szerint a háló pontosan tud azonosítani elhangzott szavakat, és idővel az embernél is pontosabban fog átírni mandarin szövegrészeket.
 

Összesen 0 komment

A kommentek nem szerkesztett tartalmak, tartalmuk a szerzőjük álláspontját tükrözi. Mielőtt hozzászólna, kérjük, olvassa el a kommentszabályzatot.
Sorrend:
Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!