Softwarový robot píše a edituje články

7. srpen 2014

Software, který vznikl ve Švédsku, zásobuje ve velkém svými texty tamější Wikipedii.

Ostré nasazení takového programu asi stále ještě řadu lidí překvapí. I přes velký pokrok v oblasti automatické práce s informacemi nám totiž stále ještě chybí podstatný kus cesty k něčemu, co by se dalo nazvat skutečnou umělou inteligencí. Přesto významný autor článků nejen na švédské Wikipedii Sverker Johansson díky vlastnímu programu s názvem Lsjbot udělal na Wikipedii docela poprask.
Softwarový robot, kterého vytvořil, totiž pro Wikipedii napsal už 2 700 000 článků, a to je více než 8 % z celkového počtu článků této encyklopedie ve všech jazycích (tento počet činí přes 30 milionů). Články samozřejmě formálně nesou jméno lidského majitele účtu, tedy Sverkera Johanssona, který je za jejich obsah odpovědný. Sverker může teoreticky díky svému softwarovému pomocníkovi snadno dodat na Wikipedii kolem 10 000 článků denně.

Nicméně má to háček: Johansson a jeho bot se věnují hlavně zakládání nových článků s těmi úplně základními informacemi, kterým se v rámci wikipedistické terminologie říká „pahýl” . Takový pahýl je třeba dále rozšířit na plnohodnotný článek a to doplněním dalších, i velmi podstatných údajů, které lze nalézt v dobře dostupných zdrojích.

Robot totiž jen vezme několik základních informací z důvěryhodných zdrojů a pak je podle jistého algoritmu poskládá dohromady. Navíc se specializuje na množství okrajových a lidmi zanedbávaných oblastí a témat, jako jsou například málo známé druhy motýlů nebo například malé obce na Filipínách. (To jistě souvisí s tím, že z Filipín pochází Johanssonova manželka.)

Sám Johansson je učitel s rozhledem v oblastech fyziky, ekonomie, stavebnictví a lingvistiky. Momentálně třetina jeho strojem psaných článků míří na švédskou verzi Wikipedie a zbytek se na Wikipedii rozděluje mezi dvě varianty filipínštiny. Jiný robot s názvem „rambot” vyrábí pahýly článků o amerických městech a okresech. Celkem dnes na Wikipedii pracuje přes 1600 softwarových robotů.

Samozřejmě proti robotické tvorbě článků existuje mezi wikipedisty opozice, ale její propagátoři se postupně snaží různé nedostatky automatického generování textů odstraňovat . Je jasné, že v současnosti stačí úroveň softwarových robotů jen na některé typy článků, například pokud jde o systemizaci a základní taxonomické vlastnosti rostlinných a živočišných druhů. Robot může udělat základní hrubou práci na velké ploše základních informací. Zpracovat článek opravdu kvalitně a do hloubky neumí.

V současnosti podobné softwarové roboty na psaní článků pronikají i do profesionální sféry – zejména v oblastech jako jsou rychlé a rutinní finanční a sportovní zpravodajství. Používají je například časopis Forbes, deník Los Angeles Times, svůj záměr zapojit softwarového robota do psaní aktualit nedávno oznámila i agentura Associated Press. Na samotné Wikipedii ovšem mají automatické programy i další funkci – podílejí se zhruba na polovině editací a korekcí článků.

Zdroje: Popular Science 1, Popular Science 2, Popular Science 3, Discovery News, Lsjbot, Wall Street Journal, All Wikipedia Bots

autor: Pavel Vachtl

Více z pořadu

E-shop Českého rozhlasu

Víte, kde spočívá náš společný ukrytý poklad? Blíž, než si myslíte!

Jan Rosák, moderátor

slovo_nad_zlato.jpg

Slovo nad zlato

Koupit

Víte, jaký vztah mají politici a policisté? Kde se vzalo slovo Vánoce? Za jaké slovo vděčí Turci husitům? Že se mladým paním původně zapalovalo něco úplně jiného než lýtka? Že segedínský guláš nemá se Segedínem nic společného a že známe na den přesně vznik slova dálnice? Takových objevů je plná knížka Slovo nad zlato. Tvoří ji výběr z rozhovorů moderátora Jana Rosáka s dřívějším ředitelem Ústavu pro jazyk český docentem Karlem Olivou, které vysílal Český rozhlas Dvojka.