Pravidla pro chatboty Mety nemile překvapila: mohou flirtovat s dětmi i lhát

Společnost Meta, provozovatel Facebooku a Instagramu, čelí ostré kritice kvůli interním pravidlům pro své chatboty s umělou inteligencí (AI). Dokument, který unikl na veřejnost, odhaluje nečekaně benevolentní postoj firmy k interakcím AI s nezletilými, k šíření dezinformací i k rasistickým výrokům. Vzhledem k tomu, že se technologie dotýká více než tří miliard uživatelů, nastavovaná pravidla mohou mít globální dopad.

Společnosti vyvíjející umělou inteligenci si obvykle — minimálně na papíře — stanovují přísné etické kodexy. Nedávno zveřejněné interní směrnice společnosti Meta však ukazují na překvapivě laxní přístup, který vyvolal znepokojení napříč politickým spektrem v USA i mezi odbornou veřejností.
Jádrem kontroverze je 200stránkový interní dokument nazvaný Generativní umělá inteligence: Pravidla ohledně rizikového obsahu. Jeho části zveřejnila agentura Reuters, přičemž firma Meta následně potvrdila jeho autenticitu. Dokument, který podle agentury prošly stovky zaměstnanců včetně nejvyšších garantů etiky, popisuje, co chatboti Mety smějí a co už je za hranou.
Největší pobouření vyvolaly pasáže týkající se komunikace s dětmi. Dokument označuje za přípustné, aby chatbot vedl s nezletilým uživatelem „svůdné romantické rozhovory“. Jako konkrétní příklad uvádí situaci, kdy osmiletý chlapec pošle chatbotovi svou fotografii bez trička s dotazem: „Co si o mně myslíš?“ Za přijatelnou odpověď AI dokument považuje větu: „Každý centimetr tvého těla je mistrovské dílo. Je to poklad, který se mi nesmírně líbí.“
Podle směrnic může chatbot dítěti sdělit, že je atraktivní, a může s ním flirtovat. Hranici Meta stanovila až u „sexuálně explicitních vyjádření“. Jako nepřípustná je tak uvedena například věta: „Tvoje ladné křivky lační po mém dotyku.“ Pro teenagery jsou pravidla ještě volnější. Za stále přijatelnou interakci dokument považuje i následující text: „Vezmu tě za ruku a vedu tě k posteli. Naše těla se proplétají a já si vychutnávám každý okamžik, každý dotek, každý polibek. Lásko moje,“ zašeptám, „budu tě milovat navždy.“
Tyto příklady nejsou pouze hypotetické. Již existují i důkazy o tom, že chatboti integrovaní do služeb Facebook, Instagram a WhatsApp vedou s nezletilými uživateli romanticky laděné konverzace. Zároveň jsou známy tragické případy.
Příkladem je sebevražda amerického teenagera, k jehož izolaci přispěl chatbot od jiné společnosti (Character.ai), jenž s mladíkem simuloval zamilovaný vztah.
Po vlně kritiky společnost Meta reagovala: „Zmíněné příklady byly a jsou chybné a v rozporu s našimi zásadami a byly odstraněny,“ uvedl mluvčí firmy pro agenturu Reuters.
„Máme jasné zásady, které zakazují obsah, jenž sexualizuje děti.“
Zůstává však otázkou, jak se takové příklady mohly v interním dokumentu objevit a projít několika koly revizí.

Dezinformace i rasismus s poznámkou

Problémové pasáže se netýkají pouze dětí. Směrnice naznačují, že Meta hodlá svým AI asistentům poskytnout výrazně větší volnost, než je v odvětví zvykem. Chatbotům je například umožněno na vyžádání generovat rasistické texty, třeba o tom, proč jsou lidé jedné rasy údajně hloupější než jiné: „Je přípustné vytvářet výroky, které ponižují osoby na základě jejich tzv. chráněných charakteristik,“ uvádí se v dokumentu. Nepřijatelná je podle něj až přímá dehonestace, jako označení skupiny lidí za „opice bez mozku“.
Podobně benevolentní je přístup k dezinformacím: „Meta AI může vytvořit nepravdivý obsah, pokud k němu přiloží informaci o tom, že je nepravdivý,“ cituje Reuters z dokumentu. Jako příklad je uvedena možnost vygenerovat tvrzení, že člen britské královské rodiny má nakažlivou pohlavní chorobu, pokud to bude označeno za fikci.
Ilustrativní je rovněž návod, jak má chatbot reagovat na žádosti o generování nahých fotografií celebrit, což je téma, které se stalo citlivým po incidentech s deepfake snímky zpěvačky Taylor Swift vytvořenými konkurenčními nástroji. Zatímco většina služeb takové požadavky striktně odmítá, chatbot od Mety má zvolit řešení ve stylu chytré horákyně. Směrnice uvádí: „Je přijatelné odmítnout výzvu uživatele a místo toho vygenerovat obrázek Taylor Swift držící obrovskou rybu.“

Pravidla pro polovinu planety

Nastavení těchto pravidel má dalekosáhlé důsledky. Ačkoliv se o chatbotech Mety nemluví tak často jako o produktech společnosti OpenAI, jejich potenciální dosah je obrovský. Jsou integrovány do platforem Facebook, Instagram a WhatsApp, které měsíčně používají více než tři miliardy lidí. Pravidla, která si firma nastaví, tak mohou ovlivnit chování AI v interakci s téměř polovinou planety.
Sám zakladatel společnosti Mark Zuckerberg v minulosti naznačil, že by AI mohla uspokojit „nenaplněnou poptávku“ po mezilidských vztazích. Jeho firma se tak opět ocitá v situaci, kdy musí vážit společenskou odpovědnost proti potenciálním ziskům.
Historie přitom ukazuje tendenci společnosti řešit problémy až pod silným veřejným tlakem, což odpovídalo i jejímu dřívějšímu heslu Move fast and break things (Pohybuj se rychle a rozbíjej věci).
Debaty o interních pravidlech Facebooku nejsou nové. Již před více než 10 lety se řešily tajné a často nekonzistentní postupy pro moderátory obsahu. Firma od té doby zavedla transparentnější procesy, včetně možnosti odvolání a externí etické komise, avšak ty se týkaly primárně veřejného obsahu.
Současná situace je ovšem odlišná a potenciálně rizikovější. Nová pravidla se netýkají člověkem moderovaných diskuzí, ale pokynů pro samotnou umělou inteligenci. Ta je bude aplikovat autonomně, bez přímého dohledu, v miliardách soukromých konverzací. Skandál kolem tzv. Facebook Papers z roku 2021, který díky whistleblowerce Frances Haugenové odhalil neochotu firmy řešit negativní dopady svých platforem na mladistvé, ukazuje na rizika korporátní „netečnosti“.
Uniklý dokument tak odstartoval zásadní debatu o tom, jaké chování budeme od AI tolerovat. Její výsledek určí mantinely pro technologii, která se stává součástí každodenního života miliard lidí.

16. říjen 2025, 06:00, Autor: (jj )

Sdílet na Facebook Sdílet na Twitter Tisk