Technická revue (do roku 2015) 3/2012
Učíme mluvit i stroje
Vezmeš si mě?“ „Omlouvám se, ale moje licence mi to nedovoluje.“ „Kdo je tvůj táta?“ – „Steve Jobs.“ I tak se může bavit člověk s počítačem. Konkrétně takto odpovídá program Siri, který s velkou pompou představila společnost Apple. Je součástí jejího posledního chytrého telefonu. Na programu, který dokáže porozumět lidskému hlasu, ale stejně tak i mluvit, zanechali své otisky i čeští odborníci. Máme totiž špičkové experty, kteří učí počítače mluvit a rozumět. V Česku jsou jednak desítky firem, které tyto složité programy vyvíjejí, a zároveň je zde několik vědeckých institucí, které se zabývají hlasovou analýzou. Čech učil počítače mluvit Mezi světově významné vědce, kteří se počítačovým hlasem zabývali, patřil i Čechoameričan Frederick Jelinek. Tento kladenský rodák odešel před druhou světovou válkou do Spojených států, kde pracoval nejdříve v IBM na přístroji, který by dokázal porozumět lidské řeči a překládat ji. Následně 17 let vedl centrum pro jazykové a řečové procesy na Univerzitě Johna Hopkinse. Jelinek během svého působení v IBM kolem sebe shromáždil tolik Čechů, že tato slavná americká společnost nakonec přestěhovala veškeré aktivity spojené s hlasem do České republiky. Momentálně se zde vyvíjí systém, díky kterému budou moci řidiči dávat hlasové povely automobilu a ten jim bude odpovídat. Stejný tým také dříve pomáhal při vývoji programu Siri.Vedle toho v roce 1969 v Česku při Akademii věd vznikl kurz programování pro nevidomé. Jeho účastníci dnes stojí za vývojem mnoha hlasových počítačových programů, které se prosadily po celém světě. „Například španělská společnost CodeFactory používá námi vyvinutý program, který hovoří litevsky. Nebo německá společnost Baum má náš syntetický chorvatský hlas zabudovaný v zápisníku pro nevidomé,“ říká Rostislav Sáček ze společnosti Rosasoft, která „učí mluvit“ i mobilní operační systém Android.
5000 vět Naučit počítače komunikovat hlasem není vůbec jednoduché. Programy stále nedokáží člověka plně nahradit. Těžká volba je už výběr dabéra, od kterého si počítač vezme barvu hlasu, dikci, melodii a další atributy. Jen pro představu – dabér za tímto účelem musí namluvit zhruba 5000 vět. Ty se pak rozsekají na nejmenší zvukové částečky lidské řeči, kterým se říká fonémy. Počítač musí umět všechny fonémy, aby následně byl schopen jim rozumět a případně je opět vyvolat, aby mohl odpovědět. Metody jsou ale různé. „Abychom co nejlépe simulovali přirozený zvuk každého jazyka, mluvčí musí namluvit sérii textů, například poezii, politické zprávy, sportovní výsledky... Jen tak získáme všechny možné zvuky,“ řekla LN Caroline Houel, manažerka společnosti Acapela Group, která uvedla na trh hlas Eliška, známý zejména z navigací.
Konec slavné dabingové školy
Český hlas proslavila ještě jedna věc – filmový dabing. Například hlas Františka Filipovského dokázal přivést filmy Luise de Funese k dokonalosti. Ovšem, jak potvrzují lidé z oboru, český dabing se od té doby výrazně změnil. „Kvalita televizního dabingu šla prudce dolů,“ říká Martin Jílek, zvukař společnosti Soundsquare, která se starala o zvuk takových filmů jako Lidice či Ženy v pokušení. Změnou si ale prošly i filmy určené do kin. Původně se do češtiny namlouvaly všechny cizojazyčné filmy, ale v 90. letech přišel zlom. Začaly se dabovat jen dětské a rodinné filmy. Ostatní snímky se musely spokojit s titulky. „Bylo to z finančních důvodů. U filmu určeného do kin se může cena dabingu včetně honorářů vyšplhat až na jeden milion korun. U filmu s titulky jsou tyto náklady řádově nižší,“ vysvětluje Martin Jílek. Jak je možné, že v Maďarsku, Itálii, Španělsku či Německu je nedabovaný film spíše výjimkou? „Je těžké říci, čím to je. Patříme k otevřenějším národům, a tak nám nenadabovaný film asi méně vadí,“ odhaduje Martin Jílek. Jak vysoké jsou honoráře za dabing? U nejslavnějších herců to mohou být desítky tisíc za namluvení filmu, což může zabrat i několik dní. O něco výhodněji vycházejí reklamy, tam se půlhodinová práce na tříminutovém spotu pohybuje v řádu tisíců u méně známých hlasů až po desetitisíce u nejžádanějších hereckých osobností.
Hanka
Programy s fonémy rozlišují vztahy mezi jednotlivými hláskami. Díky tomu jméno Hanka nehláskují, ale skutečně čtou.
Jak se naučily počítače mluvit Jak počítač poslouchá: Dabér musí namlouvat určené fráze do mikrofonu. Počítač převede řeč do digitální podoby, tedy do jedniček a nul. Počítačový program na základě akustického modelu rozčlení slova na nejmenší zvukové díly, takzvané fonémy, které jsou ovšem pro každý jazyk jiný. Tyto nejmenší díly si uloží do paměti. Další program porovná získané fonémy se slovy, která v daném jazyce zná, a sestaví z nich slova v textové podobě.
Jak počítač mluví: Získané informace převede do textové podoby. Jednotlivá slova program porovná s fonémy a následně je na ně rozloží. Další program vyvolá k jednotlivým fonémům nahrané zvuky, které následně přehraje, tak aby to bylo co nejblíže lidské řeči.
Lidové noviny, PETR ŠVIHEL