Poslepu.cz na novém URL

Od ledna 2014 najdete blog na adrese poslepu.cz.

úterý 20. prosince 2011

Praktické postřehy o přístupnosti Ice Cream Sandwich

Google v Androidu 4.0 přináší plnohodnotnou podporou dotykových zařízení, která jsou v současnosti aktuální trendem v oblasti mobilních telefonů. Matěj Plch prakticky vyzkoušel přístupnost telefonu Galaxy Nexus s Androidem 4.0 a na svůj blog sepsal své první praktické postřehy z ovládání tohoto mobilního telefonu. Ten nevidomým uživatelům nabízí rychlou hlasovou odezvu díky nadupanému hardware a screenreader TalkBack v kombinaci s hlasem Iveta na něm funguje bez zbytečných zadrhávání. Velkých změn doznala položka Usnadnění, obsahující například položku "Explore by touch", umožňující nevidomým uživatelům práci s dotykovým displejem ve speciálním módu, či položku Velký text, dovolující využívat zvětšené písmo v celém systému.

Velkých změn doznala pracovní plocha. U spodní hrany displeje se nachází virtuální tlačítka a nad nimi pět základních ikon, jejichž obsah se kontextově mění podle toho, v jaké části systému se zrovna uživatel nachází, či s jakou aplikací pracuje.

Ovládání dotykového displeje poslepu vyžaduje cvik, prostorovou představivost a dobrou paměť, protože je třeba si pamatovat, kde se který prvek nachází. Což je rozdíl oproti konkurenci v podobě Applu, která má dotykové ovládání koncipováno jinak a nabízí způsob ovládání, který po uživateli nevyžaduje pamatovat si pozici každého prvku.

Matěj se ale i přes počáteční obtíže s novým ovládáním na novinky rychle zvykl a většinu přepracovaných funkcí ocenil.

Podrobnější informace se můžete dočíst v Matějových článcích Android 4.0: Nejpodstatnější změny a první dojmy a Ice Cream Sandwich: Přístupnost pod drobnohledem.

pondělí 12. prosince 2011

Proč k nám umělými hlasy promlouvají převážně ženy?

Proč jsou hlasy v hlasových syntezátorech spíš ženské, než mužské? Zajímavá otázka, které mě - přiznávám - za celou dobu mé praxe zatím nenapadla. Možná proto, že Česká republika se tomuto trendu dlouhé roky vymykala a kraloval zde Jakub z WinTalker Voice a Mojža z HLASu. Teprve s příchodem Zuzany a Elišky začala být situace na trhu genderově vyvážená a dokonce bych řekl, že ženské hlasy začínají mít nadvládu, protože prakticky ke všem speciálním programům pro zrakově postižené na českém trhu je dnes standardně nabízena buď Zuzana, nebo Eliška.

Tento příspěvek je výtahem toho nejzajímavějšího z článku Why computer voices are mostly female od Brandona Griggse, který v něm uvádí několik důvodů, proč k nám z počítačů a jiných zařízení promlouvají právě ženy.

Jedním z důvodů může být biologie - lidé obvykle ženské hlasy považují za příjemnější, než mužské.

Pro další důvod pak musíme do historie. Použití ženských hlasů v navigačních zařízeních sahá až do období druhé světové války, kdy ženské hlasy byly používány v kokpitech letadel, protože byly snadno odlišitelné od hlasů pilotů - mužů. Také telefonní operátorky navykly uživatele na to, že jim asistuje odosobněný ženský hlas.

Když výrobci automobilů začali v autech používat hlasová upozornění (například na pootevřené dveře), jejich průzkumy mezi zákazníky ukázaly, že zákazníci výrazně preferují ženské hlasy oproti mužským. Toto zjištění také vysvětluje, proč je v navigacích nstaven jako výchozí hlas ženský. Jedinou výjimkou bylo Německo, kde BMW při uvedení páté série svých vozů bylo mužskými zákazníky přinuceno ke změně, protože muži se při řízení odmítli řídit pokyny, které jim říkala žena.

Zajímavá je také historie Siri - osobní asistentky (či osobního asistenta) v iPhone 4S. Proč to odlišení? V USA a dalších čtyřech zemích totiž mluví Siri ženským hlasem, ve Velké Británii a ve Francii mužským hlasem. Siri je výsledkem pětiletého výzkumného projektu, který vedl výzkumný ústav SRI International a financovala vojenská organizace DARPA. "Dítětem" projektu byla společnost, pojmenovaná také Siri, která v únoru 2010 uvolnila aplikaci pro iPhone a o dva měsíce později ji koupila společnost Apple.

Siri aplikace zpočátku fungovala tak, že poslouchala příkazy uživatelů, ale neodpovídala jim. Původní myšlenka při přidání "umělé inteligence" pak dokonce byla taková, aby Siri mluvila "bezpohlavním" hlasem.

Mnoho GPS zařízení a TTS programů dnes nabízí výběr z několika hlasů. Je proto dost pravděpodobné, že i u Siri si bude možné v budoucnu vybrat, jakým hlasem bude mluvit.

Je Siri projevem sexismu? To je poslední téma, kterému se Brandonův článek věnuje. Rebeca Zorrah z Univerzity v Chicagu na dotaz CNN odpověděla takto:

Jako hlasy, které mají vyjádřit autoritu, jsou často používány hlasy mužské (například vypravěči příběhů ve filmech). Takže ano, umělé ženské hlasy mohou posilovat genderové stereotypy - ale ne ve významu, že ženy "asistentky" slouží uživatelům, ale proto, že tato technologie se týká komunikace a vztahů a v této oblasti jsou ženy obecně považovány za schopnější, než muži. U soukromých společností bych určitě automaticky nepředpokládála, že jejich rozhodnutí jsou sexistická či se jedná o individuální rozhodnutí někoho ze společnosti. Většina těchto rozhodnutí je založena na průzkumech trhu, které ale samozřejmě mohou odrážet genderové stereotypy, zakořeněné ve společnosti už z dřívějška.

čtvrtek 8. prosince 2011

Text to mp3 - knihy netřeba číst jen pomocí počítače

Před nedávnem jsem vytvořil novou verzi programu Text to MP3 pro SAPI 5. Jedná se o jednoduché rozhraní, určené k převodu textových souborů do formátu komprimovaného zvuku MP3. V praxi to znamená, že textové soubory se vám "načtou" přímo do MP3 souborů v systému nastaveným hlasovým syntetizérem.

Podporovány jsou syntetizéry, které fungují pod rozhraním MS SAPI 5, takže např Eliška od Acapelly, Zuzana od Real Speaku či WinTalker Voice od RosaSOFT. Z volně dostupných syntetizérů lze použít např open-source syntetizér Espeak.

K převodu do MP3 slouží osvědčený LAME encoder. Jeho parametry jsou nastaveny napevno tak, aby při nejmenší možné velikosti výsledného souboru došlo k co nejmenšímu zkreslení syntetického hlasu

program je schopen převádět i formáty doc, docx, rtf, htm a html, ale uživatel musí mít nainstalován Microsoft Word 2000 a vyšší a příslušný doplněk v případě docx souborů.

V praxi program funguje tak, že po nainstalování programu stačí v kterémkoliv správci souborů označit jeden či více souborů podporovaných formátů a v menu odeslat vybrat program Text to MP3.

Kromě převodu 1:1, tzn. že k textovému souboru je vytvořen MP3 soubor stejného názvu, program umožňuje výsledné soubory dělit na uživatelem definované časové úseky, což se hodí hlavně při čtení knih pomocí MP3 přehrávače. V takovém případě je vytvořen adresář se stejným názvem jako zdrojový soubor a v něm jsou umístěny očíslované úseky patřičné délky a soubor s playlistem. To kvůli přehrávačům, které primárně nepřehrávají soubory dle adresářové struktury a playlist by mohly použít pro přehrání souborů ve správném pořadí.

V průběhu převodu lze program podobně jako např WinRAR dát na pozadí, tedy informace o probíhajícím převodu bude vidět pouze na systémové liště.

Po dokončení převodu je vypsána souhrnná informace s údaji o převedených souborech.

V případě dotazů k programu, návrhů na vylepšení či informací o chybách mě neváhejte kontaktovat na e-mailové adrese jiri.fenz@tiscali.cz. Mnoho úspěšně převedených souborů přeje Jiří Fenz.

Související odkazy

úterý 6. prosince 2011

Ještě jednou o napravování chyb na stránkách asistivními technologiemi

Mají přístupové prostředky na straně uživatele (prohlížeče, asistivní technologie) napravovat chyby autorů webových stránek a doplňovat vazby mezi prvky a vůbec sémantiku tam, kde chybí, je nejednoznačná či nesprávná?

Článek na toto téma jsem napsal před pár dny pro Zdroják a jak jsem zjistil, je toto téma živé i v zahraničí. Jared Smith z WebAIM se v článku Semantic Automation věnuje stejnému tématu a mě v něm zaujaly dvě věci, které považuji za vhodné zdůraznít.

  • Výčet některých požadavků z WCAG 2.0, které umí screenreadery díky autodetekci "pořešit". Pokud je testování přístupnosti provedeno jen pomocí screenreaderu, který autodetekcí řeší některé chyby na stránkách, je dobré tuto skutečnost vzít v potaz a přesvědčit se, jestli například popisek formulářového pole byl přiřazen autodetekcí screenreaderu, nebo díky korektně vyznačené vazbě v kódu.
  • Nápad z komentářů, aby screenreader na popisek doplněný autodetekcí uživatele upozornil a ten tak věděl, že tato informace je "bez záruky".

V pohledu na věc se shodujeme (odpověď, zda je autodetekce užitečná, či nikoliv, je "jak kdy"). Základem je dělat věci pořádně. A kvůli uživatelům, kterým je v zásadě jedno, kde se u formulářového prvku ten popisek vzal, je dobré vylepšovat jak rozpoznávací schopnosti asistivních technologií (aby mohly pomoci, když bude třeba), tak znalosti autorů webových stránek, aby je vytvářeli s maximálním ohledem na přístupnost.

Související odkazy