Popełniaj błędy by potwierdzić, że jesteś człowiekiem

Trafiłem dziś w sieci Linkedin na wpis, którego autorka rozwodziła się nad konstrukcjami językowymi typowymi dla modeli językowych. Wskazywała wzorce, po których zazwyczaj da się rozpoznać, że tekst stworzony był przez generatywną sztuczną inteligencję. Piętnowała również fakt, że większość treści, z którymi obecnie spotyka się w swojej sieci, nacechowana jest tymi właśnie charakterystycznymi strukturami składniowymi i retorycznymi.

Natychmiast przypomniała mi się podobna tyrada sprzed paru miesięcy, której autor dowodził, że teksty wytworzone przez modele językowe łatwo poznać choćby po stosowaniu półpauz i pauz, potocznie nazywanych „długimi myślnikami”. Taki myślnik miałby jakoby być papierkiem lakmusowym, wskazującym, czy twórca wypowiedzi był człowiekiem z krwi i kości, czy generatywną sztuczną inteligencją.

Długimi myślnikami posługuję się od wielu lat. Ot, skrzywienie zawodowe sprawiło, że krótkie myślniki, służące wedle typograficznych prawideł łączeniu bądź dzieleniu wyrazów (tzw. dywizy), raziły mnie bardzo, gdy stosowane były w roli swych dłuższych krewniaków. Przyczyna, dla której ludzie z reguły używali właśnie tych krótkich kreseczek, jest bardzo prosta i prozaiczna: znak ten znajduje się na klawiaturze komputera. Aby natomiast uzyskać dłuższy myślnik (tzw. półpauzę) należy wcisnąć kombinację klawiszy ALT + 0150. Nie zmienia to jednak w żaden sposób faktu, że poprawną formą zapisu np. wtrąceń jest właśnie półpauza, nie dywiz.

Jednak we wspomnianym kontekście to właśnie błędny zapis zyskał dodatnie zabarwienie aksjologiczne. Błąd świadczył o prawdzie i autentyczności. Poprawność i wierność regułom stanowiła o sztucznym pochodzeniu tekstu.

We wpisie autorki, o którym mowa na początku, argumentacja była inna. Wskazano kilka struktur językowych, jak np. kontrast z negacją (To nie X, to Y), jako charakterystycznych dla LLM-ów. Co ciekawe, żadna z tych struktur nie była błędna. Wszystkie były jak najbardziej poprawne i sam posługiwałem się nimi od lat.

Nic dziwnego. To wręcz wynika z definicyjnej cechy modeli językowych, które oparte są o statystyczne prawdopodobieństwo wystąpienia danego słowa po innym słowie. Fakt, że LLM-y często stosują dane wzorce wypowiedzi wynika z tego, że są one po prostu statystycznie prawdopodobne, a to z kolei oznacza, że ludzie prawdopodobnie tak właśnie się wypowiadają.

To stawia natomiast w bardzo ciekawym kontekście tezę, że stosowanie danego typu wzorców miałoby świadczyć o ich syntetycznym pochodzeniu. Bezbłędne stosowanie retoryki, którą zazwyczaj posługują się ludzie, staje się podejrzane. By udowodnić swoje człowieczeństwo, należy wypowiadać się pokracznie i popełniać błędy. Poprawność staje się podejrzana.

Technologia, którą wytwarzamy, zwrotnie przetwarza również nas. Tu – zmusza nas do redefinicji poprzez błąd, poszukiwania tożsamości w niedoskonałości, której próbowaliśmy się wyzbyć.