Technická revue (do roku 2015) 3/2012

Zpět

Síla hlasu

Nastane někdy doba, kdy s přístroji budeme moci komunikovat podobně, jako bychom se bavili s druhou osobou, a kdy budou moci zrakově postižení běžně naplno využívat moderní dotykové „chytré“ telefony?

Systémy pro rozpoznávání lidské řeči jsou na vysoké úrovni již řadu let, počítače lze tedy například snadno ovládat pomocí hlasových příkazů jak v angličtině, tak s určitým omezením i česky. Hlasové ovládání již mnoha lidem v počítačové branži pomáhá - například mediálním agenturám při přepisech zpravodajství nebo soudním zapisovatelům. Pomáhá také mnoha handicapovaným, jejichž hybnost je omezena a pro něž hlasové ovládání jak počítače, tak třeba na počítač napojených prvků domácnosti znamená velkou pomoc. Doba, kdy si budeme moci s mobilním telefonem nebo jakoukoliv jinou běžně využívanou elektronikou povídat na úrovni inteligentního dialogu, je ještě přece jen vzdálená. Někteří výrobci se ji ale velmi snaží přiblížit.

Apple se snaží

Mezi výrobce počítačové techniky a mobilních telefonů, kteří běžně intenzivně myslí na handicapované uživatele, patří bezesporu společnost Apple. Její počítače šlo hlasem ovládat již před mnoha lety (i když třeba jen anglicky) a společnost dělá také hodně pro to, aby mohli lidé s různým handicapem využívat i její chytrý telefon. Mezi poslední pokusy je možné zařadit i uvedení inteligentní hlasové asistentky s názvem Siri, kterou společnost představila jako základní součást poslední generace chytrého telefonu iPhone s označením 4S. Nejde o exkluzivní krok směrem k handicapovaným, využití pro ně je ale obrovské.
Siri je program, který se snaží napodobit funkci asistentky a sekretářky v jednom.
Po jejím zapnutí se například stačí zeptat, jaké bude o víkendu v Praze počasí, kolik je 128 krát 1315 nebo kde je nejbližší čínská restaurace, a mobil během doslova jedné vteřiny vrací odpověď, kterou uživateli samozřejmě sdělí příjemným hlasem. Umí také spolupracovat s programy v telefonu, a tak dokáže na hlasový příkaz zapsat poznámku či událost do kalendáře nebo vám připomenout schůzku. To ale není vše. Je možné jí nadiktovat text SMS zprávy nebo rovnou celého e-mailu a vzápětí ho poslat. V zásadě je její využití omezeno pouze vaší fantazií, pro zrakově postižené pak představuje neúnavného asistenta, díky němuž je možné dokonale využít všechny funkce, které moderní chytrý telefon nabízí k usnadnění každodenního pracovního či osobního života.
Siri je obrovský krok vpřed od prvních pokusů o hlasové ovládání mobilních telefonů. Ty zpravidla fungovaly tak, že bylo nutné vyslovit předem nastavenou frázi, a telefon - pokud vám vůbec rozuměl a nežádal vás o zopakování či rovnou nezačal volat někam úplně jinam, než jste chtěli - provedl, o co jste ho požádali. Většina pokusů s těmito systémy končila u prvního nadšeného testu, kdy většina uživatelů zjistila, že akci „volej Karla“ je opravdu rychlejší provést ručně. Časy se mění a s příchodem chytrých telefonů s rychlejšími procesory a především s přístupem k internetu lze využít plný potenciál programů pro rozpoznávání řeči a pro následné rychlé a přirozené reakce.
Pokusů se objevilo hodně, Siri však zatím, soudě podle hodnocení, stojí na pomyslném vrcholku. Za fascinujícími funkcemi se skrývají složité algoritmy rozpoznávání nejen mluveného slova, ale i kontextu.
Siri analyzuje získanou slovní žádost, dokáže z ní rozpoznat klíčové příkazy jako „udělej“, „zapiš“, „připomeň“ nebo „najdi“ a stovky dalších a zároveň také čas nebo místo. Spolupracuje navíc se všemi běžnými funkcemi telefonu, jako jsou kalendář, mapy, budík, připomínky, e-mailový klient nebo SMS zprávy. Při vyhledávání informací využívá také internetové připojení, můžete jí tedy pokládat i faktické otázky, na které vám odpovědi hravě najde ve světové síti. Ve spojení s handsfree systémem není nutné se vlastně telefonu ani dotknout, a přitom využít naplno vše, co nabízí. Spolupracovat se Siri mohou navíc další aplikace, které si člověk do telefonu stáhne; možnosti jsou tak opravdu široké. Pro lepší představu o tom, jak takový vyspělý hlasový asistent funguje, je možné zhlédnout prezentační video na stránkách společnosti Apple: http://www.apple.com/ iphone/features/siri.html.

Zatím bez češtiny

Hlavní překážku pro českého uživatele tvoří zatím absence českého jazyka. Siri plynule hovoří a rozumí anglicky, francouzsky a německy. Česky zatím neumí a ostatní programy na tom nejsou o nic lépe. Není to proto, že by systémy pro rozpoznávání mluveného slova nerozuměly češtině stejně dobře a kvalitně jako jednodušší angličtině. Velký problém je především slovník výrazů, které tyto programy využívají, a jeho „fyzická“ digitální velikost. Program musí totiž nejen rozeznávat jednotlivá slova, ale i jejich tvary při skloňování. Zatímco v angličtině si slovníky obvykle vystačí s třemi tvary jednoho slova, v českém jazyce musí rozpoznat nejméně desítku tvarů stejného výrazu, navíc i s kontextem, ve kterém je výraz užit. To se neblaze podepisuje na velikosti slovníku a následně i na nutných požadavcích na výkon mobilního telefonu. Část nutné práce dnes obstará telefon pomocí mobilního internetového připojení na externích serverech (a deleguje tak na ně část požadavků na výkon), o rychlosti mobilního připojení v ČR by se ale dalo mnohdy polemizovat.
Jak bylo již řečeno, Siri zdaleka není první vlaštovka ve svém vzdušném prostoru, existují i další, podobně funkční programy. Její hlavní devízou spíše je, že si programu původně vyvíjenému jinou společností všiml velký a bohatý hráč formátu společnosti Apple a neváhal do něj investovat bezmála 200 milionů dolarů. Pro rozvoj podobných aplikací to znamená obrovský impulz, a tak nezbývá než doufat, že za pár let bude mít svou bezchybně fungující asistentku v mobilním telefonu každý člověk, který by ji díky svému handicapu alespoň trochu využil. Už teď zřejmě Siri čeká souboj s nově nastupující konkurentkou s názvem EVI, jejíž funkce jsou podobné a která je k dispozici nejen pro starší verze telefonů iPhone, ale i pro přístroje s operačním systémem Android. Zbývá tedy jen čekat, zda obě dámy někdo naučí mluvit česky.
Doba, kdy si budeme moci s mobilním telefonem povídat na úrovni inteligentního dialogu, je ještě přece jen vzdálená. Někteří výrobci se ji ale velmi snaží přiblížit.

6.4.2012 Můžeš
Štěpán Beneš

Zpět