Google

Google Zdroj: profimedia.cz

V některých oblastech výzkumu umělé inteligence Google trochu pokulhává...
V některých oblastech výzkumu umělé inteligence Google trochu pokulhává...
V některých oblastech výzkumu umělé inteligence Google trochu pokulhává...
V některých oblastech výzkumu umělé inteligence Google trochu pokulhává...
V některých oblastech výzkumu umělé inteligence Google trochu pokulhává...
5 Fotogalerie

H**no versus H****. Bizarní pokus JXD ukázal, proč Google umělou inteligenci nikdy nevyvine

Jiří X. Doležal

Lidská blbost je úplně všude. I ve firmě, která je z celoplanetárního měřítka jedním z klíčových hráčů na poli výzkumu a vývoje umělé inteligence. Tou firmou je Google, a pojďme se podívat, jak si jeho vysoce inteligentní algoritmy vytvořené inteligentními programátory poradili se slůvkem h**no.

Sledoval jsem ze záznamu na internetu Události, ležel na gauči a k tomu si občas, když říkali něco, co mě nezajímá, googlil. Aplikaci ovládám hlasem. Ve vysílání přišla na řadu nějaká zpráva z dění na naší politické scéně. Přiznávám, že když jsem sám a koukám na zprávy, občas i něco, co vidím, okomentuji nahlas, a většinou vulgárně. Zpravidla jevy na naší politické scéně. A tak jsem řekl h**no. Ipad odpověděl: „Toto jsou záznamy pro firmu H hvězdička hvězdička hvězdička hvězdička do vzdálenosti čtrnáct kilometrů.“ Znejistěl jsem. Prohlédl iPad. V řádku, kam se přepíše hlasem zadaný text, nebylo napsáno „h**no“ v plném znění, ale toto: „h****“. A hned druhý odkaz, který vyhledavač po vyslovení slova h**no vyhledal, bylo Divadlo Spejbla a Hurvínka. Znejistě jsem ještě více.

Úmorné ověřování   

Obvolal jsem několik přátel, pak zašel do Apple servisu, a nikdo to nikdy nikde neviděl a ani o to neslyšel. Pak se ale (díky spolupráci s přáteli) podařilo zjistit, že tento jev existuje už deset let. A přiznává to sám Google. Akorát jak málokdo googlí slovo h**no, tak si toho zatím moc lidí nevšimlo. Ale Google se už vyjádřil jasně. V roce 2010 o tom byla - v souvislosti s chytrými telefony - publikována na idnes zpráva. „Společnost se totiž obává, že by systém voice-to-text mohl občas běžné slovo chybným rozpoznáním zaměnit za slovo neslušné, což by mohlo uživatele urážet. Google se tak pojišťuje před případnými žalobami za ohrožování mravní výchovy.“  Google je soukromá firma, klient tam navíc nic neplatí, takže má firma plné právo požadovat, aby na její servery mluvili lidé slušně. A tak to - protože Google vyvíjí umělou inteligenci - ošetřili inteligentně.

Řešení problému

Princip hlasového ovládání je následující: Něco řeknete. Ipad to pošle na server, ten to převede do psaného textu, a prožene filtry. Nejdříve se nade vší pochybnost (byť to Google nijak moc nevykřikuje) testuje, zda vás nemají zařadit do nějakého svého seznamu. Třeba jestli nehledáte frázi „domácí výroba biologických zbraní“ nebo frázi „dětská pornografie ke stažení.“ Pokud ano, vyhledávač ji vyhledá, ale tazatel je pravděpodobně zapsán do nějakého seznamu, a když se na podobné věci ptá častěji, tak firma nejspíš pošle email někam na policii. Což je samozřejmě v pořádku.

Pokud dotaz projde těmito „bezpečnostními“ filtry, ještě se přefiltruje, zda v něm není sprosté slovo, a když jo (protože na Google se nemluví sprostě), učiní server rozhodnutí, a slovo nevyhledá. Jsou principiálně tři možnosti, jak to technicky zajistit.  První možnost je nejjednodušší jak logicky, tak podle mého programátora i technicky - prý nejvýše hodina práce programátora. Software by zajišťovalo, že jak server rozezná vulgaritu, tak ji prostě nepřeloží do písmen a do řádku, kam normálně přepisuje hlasem zadané slovo, by v případě vulgarismu nenapsal nic.

Když by uživatel šedesátkrát zopakoval h**no, a nic by se nenapsalo, pochopil by. Ale také by se za další hodinu dalo naprogramovat, že Google poskytne sprostému uživateli zpětnou vazbu. Při zjištění vulgárního slova by jej tedy nepřeložil a nevyhledával, ale odpověděl by sprostému uživateli přes reproduktory jeho počítače slovem „na**at“ a stránku přesměrovat na hrad.cz.  Druhá možnost je, že server vulgaritu rozezná, do vyhledávacího řádku text napíše, ale nevyhledá. Ani když opakovaně zmáčknete enter. I zde může být použita popsaná zpětná vazba, a je to prý taky programátorsky jednoduché. 

Třetí možnost řešení je tak blbá, že muselo dát opravdu strašnou práci jí vymyslet. Experti Google na umělou inteligenci jí však po řadě let úsilí našli. A použili. Když server slovo vyhodnotí jako závadové, ponechá z něj jen první písmeno, zbylá nahradí hvězdičkami, které prohlížeč při vyhledávání ignoruje, a napíše jako v našem případě zadaný termín ve tvaru h****. A tento řetězec pak vyhledavač vyhledá na internetu, ale vlastně hledá jen písmeno H. Já vím, že ajťáci bejvaj divný, ale ajťák, kterej vymyslel tohle, musí být divnej opravdu hodně. Výsledkem jeho aktivity je, že při hledání slova h**no naleznete Divadlo Spejbla a Hurvínka.



Poznání mě hodně potěšilo, a začal jsem jev zkoumat. Programátoři, kteří cenzuru zajišťují, jsou nejen idioti, ale také flákači. Nemají dobré databáze. Například termín „nas**t“ v seznamu zakázaných slov není a projde. A pokud někdo nezahrne do seznamu zakázaných českých vulgarit všeobecně oblíbené a i premiérem země užívané slovo „nas**at“, je prostě lempl. No a pak jsem zkoumal, co umělá inteligence Google vyhledá na jednotlivá zakázaná slova. 
- Ču**k: Společenství pro dům č.p.676 v Bubenči, Společenství vlastníků v domě č.p. 459, Jazz Café č.14
- J**at: J-SHOP.cz, Základní škola J. Gutha-Jarkovského, Prof. Mudr. J. Betka, ORL s.r.o.
- K**da: OSA - Ochranný svaz autorský pro práva k dílům hudebním, K + K Hotel Central, K-Mobil
-  P**el: Wikipedie - písmeno P, článek ze serveru Svět Androida
- Š**at: Š + Š Auto, Zastavárna Bazar K + Š, Cukrárna Š + Š
  Zvláště pikantním shledávám ten detail, že na slovo š**at najde googinteligence odkaz na školu J. Gutha-Jarkovského, zásadního autora řady knih o pravidlech etikety. Oslovil jsem tedy nejdřív divadlo. Jestli jim to náhodou nevadí, že když řeknu do Google h**no, tak mi vyjede odkaz na jejich divadlo. „To je zajímavé zjištění. Předpokládám, že největší zklamání zažívají zájemci o h**no, kterým se objeví nabídka s Hurvínkem. Opačně si pak troufám tvrdit, že ti kteří hledají Hurvínka nezadávají h…. Těch kteří by užívali hlasový vyhledávač, není zase tolik a pokud jsem to správně pochopila, vyhledávač  zjednodušil slovo h**no na pouhé „h“, Které pak dohledalo i Hurvínka. Písmeno „h“ nás nijak výrazně nepohoršuje. V této souvislosti se dá tedy říct „shit happens.“ V jiných souvislostech pak asi vyhledávač nemusí fungovat tak jak má, a to už z čistě praktických důvodů,“ odpověděla Denisa Kirschnerová, ředitelka divadla.

Výsledky výzkumu h****

Z mého šetření kolem proměny h**na v h**** vyplynuly tři významné poznatky:

- Ředitelka divadla Spejbla a Hurvínka má smysl pro humor

- (někteří) programátoři firmy Google jsou idioti

- Google umělou inteligenci vyvinout nemůže, protože pokud chcete vyvinout umělou inteligenci, musíte nejdřív najmout přirozeně inteligentní lidi