Na Technické univerzitě v Liberci
(TUL) pracují na vývoji programu,
který by v budoucnu mohl pomoci
zefektivnit práci přetížených soudů
i policie. Tým profesora Jana Nouzy
z Ústavu informačních technologií
a elektroniky Fakulty mechatroniky
a mezioborových inženýrských
studií TUL, vytvořil v Laboratoři
počítačového zpracování řeči program,
který je schopný přepisovat
zvukový záznam ze soudních jednání
(včetně rozsudků) do písemné
podoby. Navíc bude schopný rozpoznat
hlas řečníka a usnadnit tak
jeho identifikaci. „Podobný program
zatím v Evropě neexistuje,
pracuje se na něm ale ve Spojených
státech,“ řekl Jan Nouza.
Na tvorbě softwaru, který bude
schopný hned na místě přepisovat
zvukový záznam ze soudních jednání
do písemné podoby, spolupracovala
univerzita s Okresním soudem
v Liberci. Dokonalost soudního
přepisu se zatím pohybuje kolem 75
až 80 % a je značně závislá na tom,
jak jasně diktující soudce vyslovuje.
Podle Nouzy by v budoucnu
mohla technika nahradit drahé
zapisovatelky, které by přepsaný
text pouze zkontrolovaly a případně
opravily. Ruční přepis hodinového
záznamu dnes trvá zhruba 6 až 12 h,
podle náročnosti textu. „Pro soudnictví
by to znamenalo významnou
úsporu času i nákladů,“ potvrdila
ředitelka správy Okresního soudu
v Liberci Kamila Břachová.
Nový software zaujal i libereckého
hejtmana Petra Skokana. „Určitě
by nám zjednodušilo život, kdyby
zápisy z jednání zastupitelstva,
rady, ale i běžná jednání přepisoval
počítač,“ řekl hejtman, který chce
univerzitě navrhnout spolupráci.
Laboratoř počítačového zpracování
řeči pracuje na liberecké univerzitě
od roku 1993. Dnes má 12 pracovníků,
kteří se zabývají využitím
hlasových technologií v praxi. Před
dvěma lety laboratoř představila
program MyVoice, který třeba lidem
s tělesným handicapem umožňuje
hlasem ovládat počítač, aniž by
potřebovali klávesnici či myš. Program
laboratoř stále zdokonaluje,
aby jej mohlo využívat stále více
postižených. V současné době, podle
Jana Nouzy, využívá program
MyVoice v ČR zhruba 50 handicapovaných
lidí, kteří si díky němu
mohou např. samostatatně zapnout
a vypnout rádio či televizi, pracovat
s internetem či komunikovat
se světem za pomoci e-mailu atd.
MyVoice pomáhá i ochrnuté dívce
z Hradecka, která může díky němu
studovat střední školu. Software
využívá i student právnické fakulty
Jiří Zeman z Brna, který jen těžce
ovládá ruce a liberečtí vědci kvůli
němu rozšířili slovník softwaru
o právnické výrazy
Tým laboratoře vyvinul také program
MyDictate, který umožňuje
zápis mluveného slova. „Program
rozpozná 500 000 slov, přičemž slova,
která počítač nezná, lze hláskovat
a následně je do slovníku zařadit,“
vysvětlil Nouza. Nový program podle
něj vznikl na základě požadavku
postižených, kteří chtěli mluvené
texty diktovat ještě rychleji, než se
systémem MyVoice.
Postiženým lidem se díky oběma
novým programům otvírá možnost
využívat veškerý software nainstalovaný
v PC, včetně komunikace po
internetu a hraní her. V budoucnu by
pak mělo být možné ovládat hlasem
nejen samotný počítač, ale i další
elektrospotřebiče. Rýsuje se také
možnost ovládání robotů a dokonce
i využití softwaru v navigačních systémech
automobilů.
Dalším ambiciózním projektem
liberecké Laboratoře počítačového
zpracování řeči, který je však ještě
v začátcích, je automatické rozpoznávání
řeči. Možnost identifikace
osoby, která právě hovoří, bude podstatná
především pro policii. „Software
by například usnadnil odhalování
lidí, kteří se baví telefonickým
šířením poplašných zpráv,“ připustil
náměstek libereckého primátora pro
bezpečnost Milan Šír. Cílem výzkumného
týmu je další rozvoj informační
společnosti ve smyslu odhalování
zločinců. Proto tým plánuje rozšíření
spolupráce s ministerstvy spravedlnosti
a vnitra. „Program lze použít
i pro konverzi hlasu. Dokážeme
změnit hlas k nepoznání, to mělo
významně napomoci například při
ochraně svědků,“ uvedl Nouza
Peníze na výzkum získává Laboratoř
počítačového zpracování řeči
v národních i evropských soutěžích.
Na rozvoji programů na rozpoznávání
řeči spolupracuje s univerzitami
a výzkumnými ústavy z celé Evropy.
Pracuje s hlasovými technologiemi
v několika oblastech. Jde o počítačové
syntézy, například při reprodukci
zpráv. Významných výsledků
dosáhla i při rozpoznávání u345 řeči, kdy
počítač interpretuje a zapisuje, co
člověk řekl. Technická univerzita se
zatím soustřeďuje hlavně na češtinu,
úspěšně ale také postupuje práce ve
španělštině. Pracuje se také na zpracování
řeči po poškození, kdy je
potřeba zpracovat signály, které jsou
neznámou směsí původních signálů
a je potřeba odstranit nežádoucí
zvuky a bezpečně rozlišit jednotlivé
projevy. V Liberci se také pracuje na
audiovizuálním zpracování a přepisování
řeči, kdy je možné díky speciálnímu
softwaru rozpoznat mluvčího
a na základě algoritmů identifikovat
člověka z databáze.
„Hlasové technologie již dávno
nejsou výmyslem autorů sci-fi, ale
tvoří reálný nástroj s velkým potenciálem.
Časem se budou používat např.
i pro zlepšení kvality života seniorů.
Dokážu si představit, že budou třeba
existovat hlasem ovládané spotřebiče
v domácnosti. Software bude možné
aplikovat při vyhledávání v archívech
i při odhalování zločinců. Vidím
zde velký prostor a motivaci pro další
vědeckou práci,“ řekl Nouza. Dodal,
že TUL plánuje rozšíření spolupráce
nejen s ministerstvem vnitra a ministerstvem
spravedlnosti, ale také
s firmami zabývajícími se analýzou
médií. JAROSLAVA KOČÁRKOVÁ