Jak souvisí AI s problémy novinářů a se soukromými noetickými krizemi

Je to delší, ale na konci pochopíte, proč ironicky píšu, že k detekci textů napsaných AI bychom mohli použít pravidlo „zdá se, že bylo použito příliš mnoho kombinačních funkcí a výsledný text je příliš nesourodý a působí natolik invenčně a originálně, že nebude dílem jednoho člověka ani jednoho autorského kolektivu“. 🙂
===========================================
Berte následující text jako vtípek, protože by tento ranní text potřeboval podložit dalšími tvrdými daty a příklady. Ale víte, proč (nejen) novináři na podvědomé úrovni tuší, jak funguje AI, a proč jim může sebrat práci?
Už jsem tu jednou v jiné souvislosti psal, jak je skvělé, že se novináři na sociálních sítích projevují jako lidé se všemi lidskými chybami a nedostatky.
Když jste pozorní, máte zájem o jazyk a vaše paměť není jako cedník, kterým věty na sociálních sítích protečou a zmizí v nenávratnu, všimnete si u mnoha novinářů ještě jednoho úkazu.
Jak (vědomě, nevědomě?) recyklují další texty včetně diskuzí pod svými posty na sociálních sítích. Další den nebo další týden se v jejich článku objeví obraty, které jste četli v diskuzi pod jejich články. A obraty převzaté z diskuze nejsou obraty, které sám novinář v diskuzi použil – takovou souvislost mezi texty bychom mohli zahrnout pod ten mýtický „autorský styl“ – ale jde o obraty, které použili další komentátoři. A zábavné je, že původní status na FB, komentáře pod ním a článek v novinách mohou být na úplně odlišné téma, ale příbuzné rysy všechny tři heterogenní útvary nezapřou.
Článek není prostý plagiát, nebo naivní kompilát cizích komentářů – alespoň u těch chytřejších novinářů ne. Jde o asociování textů, za kterými prosvítá, jak jsou (opět nejen) novináři propracované průtokové ohřívače a transformátory cizích myšlenek. 🙂

Formálně jsou ty vztahy mezi texty poměrně komplikované.

Představme si, že v diskuzi pod článkem je použita množina vět.
(V1, V2, V3, V4, …. Vn). A berme i pořadí vět jako významotvorné (prostá syntaktická změna pořadí vět změní sémantiku textu). Intuitivně – když přehodíme věty v odstavci, změní se typicky i smysl textu.

(V1, V2, V3, V4, …. Vn).

Máme tedy množinu vět, kterou mysl (nejen novináře, nezapomeňme) absorbovala a postupně z tohoto rezervoáru vět začne čerpat ppři psaní dalších textů. Čím jsou věty čerstvější, tím pravděpodobnější je, že se objeví v novinářově článku.
V článku projdou věty různými transformacemi.
Označme transformaci věty jako funkci F. Funkce F vezme původní větu a na výstupu poskytne jinou větu (množinu vět).

(F(V1), F(V2), F(V3), F(V4), …. F(V(n))).

Některé transformace jsou primitivní. Nebo ani věty transformací neprojdou.
Je li I identitní funkce, která vrátí původní větu.
(I(V1), I(V2), I(V3), I(V4), …. I(FVn))).

Dostaneme opět.
(V1, V2, V3, V4, …. Vn).

I takové texty existují. Např. některé weby zkopírovaly 1:1 zážitky z cestovatelských webů.

Další jednoduchá funkce S1 – jediné, co udělá je, že substituuje za některá slova ve větě jiná slova.
(S1(V1), S1(V2), S1(V3), S1(V4), …. S1(Vn)).

Příklady:
a) Některé (i renomované weby) např. vykradly příběhy žen z emimina (ano, člověk bohužel přečte ledacos a ještě si to zapamatuje). Funkce S1 nahradila jména v textu.
b) Věty jsou upraveny i tak, že jsou nahrazena nejen vlastní jména, ale některá obecná slova jsou nahrazena synonymy.

Další funkce E složí k expanzi původního sdělení.
Po aplikací E na V1 dostaneme (V1, V11, V111….)
(E(V1), E(V2), E(V3), E(V4), …. E(Vn)).

Obsah textu nám tedy nakyne, ale jako čtenáři dokážeme poznat, že jde o řídké těsto, které asi vzniklo kvůli zadání „text musí mít minimálně 5 000 znaků“.

Další funkce K slouží ke zkrácení textu. Popisovat ji dále asi nemusím – novinář dostal za úkol napsat jen fejeton, který má mít maximálně 1 000 znaků.

„Insert“ funkce do textu doplní věty ze starší vrstvy paměti, které si novinář osvojil ve škole, slyšel je v TV, v rádiu nebo je kdysi přečetl.

„Repeat“ funkce na začátku každého odstavce zopakuje větu V1, aby se čtenář neztratil, nebo aby čtenáře indoktrinoval. 🙂

Některé funkce jsou složitější.
Funkce A je aktualizační funkce.

(A(V1), F(V2), F(V3), F(V4), …. F(Vn)).

Jestliže věta V1 zní stejně jako věta v úvodu „novináři nic lidského není cizí“, novinář ji aktualizuje a posune význam třeba na „jsme novináři, a proto je nám dle čtenářů vše lidské cizí“ a sémanticky tak rozvlní a posune i další věty v textu .
Funkce nemusí být aplikovány jen na úrovni věty.

Řekněme, že funkce RND_C je aplikována na původní soubor vět a zpřehází pořadí vět, ale ne náhodně – tak, aby věty pořád nesly nějaký vyznam (RND_C – je tedy „controlled random“ transformace).

RND_C((V1, V2, V3, V4, …. Vn)).
Kdy dostaneme množinu.
V2, V1, V3, V4, …. V(n).

Těch funkcí je mnohem víc, mohou být mnohem složitější a po jejich chytré aplikaci nový text už ten původně inspirovaný text nemusí ani připomínat. Ale (nejen) novináři bývají lenoši.
Dá se také snadno dokázat, že poměrně složité transformace textu se dá dosáhnout prostým skládáním i toho malého vzorků funkcí výše.

RND((E(S(S(V1), SA(V2), E(V3), E(RND_C(V4)), …. Vn)).

Třeba úvodníky v jednom renomovaném týdeníku připomínají pečlivou selekci, rehash, expanzi a normalizaci banálních myšlenek, které se v předchozím týdnu objevily na síti, do předpřipraveného ideologického schématu. 🙂

Svým způsobem jde u většiny textů o prosté asociování a rekombinaci textů, ne? Proto nás LLM modely podle mě tak fascinují, i když jejich vzorce jsou mnohonásobně složitější. Tušíme, že i my jsme zásobníkem přečtených a naposlouchaných vět, které rekombinujeme. Ti chytřejší nejedou na „autopilota“, ale snaží se transformovat nejen věty, ale i myšlenky, a když zjistí, že ty lucidní myšlenky bez vyjádření v temné houštině jazyka jsou ničím, pak alespoň usilují o rekonfigurovaci vět tak, aby zněly jejich originálním hlasem. Stejně si nikdy nemůžeme být jisti, že nejsme jen zkreslené echo vět, které jsme recipovali jinde.

Teď mě napadlo, že k detekci textů napsaných AI bychom mohli použít pravidlo „zdá se, že bylo použito příliš mnoho kombinačních funkcí a výsledný text je příliš nesourodý a působí natolik invenčně a originálně, že nebude dílem jednoho člověka ani jednoho autorského kolektivu“.

Je to svým způsobem smutné. Ve mně podobné myšlenky vzbuzovaly deprese mnohem dříve, když se termín AI objevoval jen ve sci-fi knihách, a prošel jsem si něčím, co soukromě a z legrace nazývám první a druhou noetickou krizí – i když moc legrační to nebylo a přišlo mi, že se mé myšlení rozpadá na atomy, ze kterých stejně žádná kloudná myšlenková hmota nevznikne a že jsem jen dočasným nahodilým shlukem cizorodých idejí. Ale život některé trýznivé myšlenky otupí a ty se vrací třeba jen tehdy, když máte mít za chvíli dovolenou a vypadnete na chvíli z rekombinačního kola života ven.

Kdo ví, kde jsem sebral věty pro tento příspěvek a jestli mi i po všech těch transformacích alespoň jedna z nich patří.:)

Příspěvek byl publikován v rubrice Uncategorized. Můžete si uložit jeho odkaz mezi své oblíbené záložky.

Napsat komentář