Když člověk dříve potřeboval najít nějakou informaci, šel do knihovny, otevřel encyklopedii, našel rejstřík a pak procházel odkazy na dané téma. Většinou to zabralo spoustu času, ale oproti vyhledávání informací na internetu to mělo jednu velkou výhodu – mohl si být jistý, že nalezené informace jsou přesné a pravdivé.





Na Wikipedii, která je sedmou nejnavštěvovanější stránkou na internetu, tato možnost není. Součástí webu je dokonce upozornění, že „online encyklopedie se nepovažuje za důvěryhodný zdroj a odrazuje čtenáře od používání v akademickém nebo výzkumném prostředí“. I přesto však anglickojazyčná Wikipedie zaznamená asi 255 milionů zobrazení stránek denně a většinu jejích čtenářů nalezené informace zpochybňovat ani nenapadne.

Pravdou každopádně je, že na úpravách webu se podílejí desítky tisíc lidí a jimi přidávaná fakta nemusejí být nutně správná – třebaže články povětšinou obsahují citace. A právě to chce společnost Meta (dříve Facebook) nyní změnit. V nedávno zveřejněném blogovém příspěvku zaměstnanci firmy popisují, jak by mohli Wikipedii zpřesnit s využitím umělé inteligence (AI).

Text rozdělený na pasáže umělá inteligence ,pochopí‘

Meta vyvíjí model strojového učení, který skenuje citace v článcích a porovnává jejich obsah s články na Wikipedii. Cílem je ověřit, že nejen témata, nýbrž i konkrétní citované údaje jsou přesné. Nejde ale jen o to vybrat údaje a ujistit se, že se shodují, umělá inteligence bude muset ,rozumět‘ též obsahu citovaných zdrojů. Toho zatím systém schopen není – neumí textu porozumět v lidském slova smyslu, jedná se spíše jen o vysoce sofistikované rozpoznávání vzorů.





Jinými slovy, AI obsah ,nepochopí‘ tak, že porovná texty a ujistí se, že obsahují stejná slova. Její činnost spočívá v porovnání matematických reprezentací jednotlivých bloků textu, k nimž dospěje pomocí technik porozumění přirozenému jazyku (NLU). „Snažíme se vytvořit rejstřík všech webových stránek tak, že je rozdělíme na pasáže a pro každou pasáž poskytneme přesnou významovou reprezentaci,“ řekl pro server Digital Trends Fabio Petroni, vedoucí manažer výzkumu umělé inteligence ve společnosti Meta.

AI se zatím trénuje na souboru čtyř milionů citací z Wikipedie. Kromě nalezení těch chybných by ale její tvůrci chtěli, aby byl model v budoucnu schopen navrhnout i přesné zdroje, které by problematické citace nahradily. Umělá inteligence má čerpat z masivního indexu dat, jež bude sama průběžně aktualizovat.

Meta s Wikimedii nijak nespolupracuje

Ještě před samotným spuštěním softwaru musejí vývojáři vyřešit jeden poměrně velký problém, a sice jak nastavit systém hodnocení spolehlivosti zdrojů. Například článek z vědeckého časopisu by měl dostal vyšší hodnocení než příspěvek na blogu. Množství online obsahu je totiž tak obrovské a rozmanité, že v něm člověk může najít ,zdroje‘ na podporu téměř jakéhokoli tvrzení. Odlišení zavádějících tvrzení a dezinformací od ověřených faktů je každopádně velmi složité.

Pro zvýšení důvěry se vývojáři odhodlali zpřístupnit zdrojový kód modelu a zájemci už také mohou vyzkoušet demoverzi ověřovacího nástroje. Menší nedůvěru některých lidí naopak vzbuzuje skutečnost, že Meta na svém projektu nijak nespolupracuje se společností Wikimedia, která Wikipedii provozuje.

Firma vlastnící kromě Facebooku i Instagram a WhatsApp uklidňuje kritiky tím, že je model stále ve fázi vývoje a v současné době není k aktualizaci obsahu na Wikipedii nijak používán. To se však do budoucna změní, neboť odhodlání Mety zmíněný nástroj vytvořit je dle Petroniho veliké: „Myslím, že nás pohání hlavně zvědavost. Ze začátku jsme si nebyli jistí, jestli něco takového umělá inteligence vůbec dokáže. Chtěli jsme prostě zjistit, jaké jsou limity této technologie, nikdo před námi se totiž o nic podobného ještě nepokusil.“