A Hold.hu egyik szerzője publikált valamit mesterséges intelligencia témakörben és ezt szeretném ezúttal kommentálni. Cikk1, Cikk2.
A szerző úgy gondolja, hogy a Google nagyon-nagyon polkorrekt és ez meglátszik a termékeiken is. Annak ellenére, hogy a Google volt alkalmazottai pont arra panaszkodnak, hogy a Google-t igazából a profiton kívül más nem nagyon érdekli.
Én úgy gondolom, hogy a szerző alapvetően félreért bizonyos jelenségeket, amiket lát.
Az első megfigyelése az volt, hogy az OpenAI képrajzoló mesterséges intelligenciája nagyon elfogult és nagyon sajátosan elfogult. Amikor egy meetingről készült képet kért a DALL-E-től, akkor az készített egy képet, amin mindenféle bőrszínű ember volt látható. Amikor arra kérte, hogy csak fehérek legyenek rajta, akkor ezt a DALL-E megtagadta mondván, hogy neki promotálnia kell a diverzitást. Viszont amikor arra kérte, hogy csak feketék legyenek, akkor ezzel semmi gondja nem volt. Ezt a szerző úgy értelmezte, hogy a vállalati kultúra által túlzásba vitt "diversity and inclusion", de állítom, hogy félreérti.
Ott kezdeném, hogy a DALL-E bemenete egy Nagy Nyelvi Modell (LLM). Az LLM-ről fontos tudni, hogy bár nagyon szépen tud beszélni, valójában a kutyád is többet ért abból, amit mondasz neki, mint ő. Az LLM mögött semmiféle világmodell nem található. Az ő tudása ott kezdődik és ér véget, hogy fel tud ismerni mintázatokat mondatokban és tudja asszociálni objektumokkal, anélkül, hogy bármit is tudna az adott objektumról, illetve nagyon szépen tud mondatokat alkotni (mások által alkotott mondatok alapján).
Biztos találkozott már az olvasó olyan emberrel, aki rengeteget beszél. Külön-külön minden mondata értelmes, de amikor később visszagondolsz arra, hogy a negyedóra alatt mi is hangzott el, akkor semmit nem tudsz visszaidézni belőle. Egyszerűen az egésznek nem volt se füle, se farka. Az illető folyékonyan bullshitelt. Az LLM ilyen. Nyikita Szergejevics Hruscsov a Szovjetunió Kommunista Pártjának első titkára volt 1953 és 64 között. Viszont a ChatGPT magabiztosan állította, hogy mindemellett 1951-ben meghalt. Ez azért történhetett meg, hogy a ChatGPT, mint LLM igazából nem tudja, hogy mit jelent az ember és mit az, hogy meghal, illetve milyen összefüggés van a kettő között. Humán olvasó számára nyilvánvaló, hogy az 1951-es halála inkompatibilis a későbbi politikai szerepével.
Ez fajta "nyelvi autizmus" vezet el a következő problémához. Korábban felfigyeltek arra, hogy az MI-k kizárólag fehér embereket ismernek fel, és égette már meg magát a Google azzal, hogy a képfelismerője a feketéket néha összekeverte a gorillákkal, vagy csimpánzokkal. Ennek az oka az volt, hogy az MI betanításánál használt képek többnyire fehér embereket tartalmaztak. Ezt megpróbálták korrigálni, de ennek is lett egy kínos mellékhatása. Ha arra kérted a képgenerátort, hogy rajzoljon neked egy fehér párt, akkor akkor rajzolt egy vegyes párt. Erre az amerikai jobbos szcéna le is csapott, de igazából mellé rúgott. E mögött se politikai agenda volt. A jelenség oka az volt, hogy a betanító adatbázisban a fekete/ázsiai arcok mellé oda volt írva, hogy fekete/ázsiai. A fehérek mellé viszont nem volt odaírva, hogy fehér. Ez a jelző kizárólag akkor került elő, amikor vegyes rasszú emberek voltak láthatóak a képen, ezért az MI csak ezekkel a képekkel tudta asszociálni a fehérséget. Az ilyen jellegű anomáliákat próbálják megkerülni azzal, hogy eldugják az MI butaságát a diverzitás jelszava mögé. Kevésbé feltűnő, hogy nem tudja megugrani a lécet, ha már a feladatot se hajlandó elfogadni. Az már kérdés, hogy kilóg a lóláb, azzal, hogy csak feketékből álló képet hajlandó rajzolni. És itt utalnék vissza, hogy az LLM igazából nem érti a diverzitás szó jelentését.
A következő találata az volt, hogy próbált (nem ő, hanem a forrása) rajzoltatni egy pápát, egy vikinget és egy 1943-as német katonát. Erre kapott egy női pápát, egy fekete pápát, zord külsejű, de határozottan nem viking harcosokat, illetve német katonára csak fikciós filmeken emlékeztető alakokat. Ezeken a stahlhelm még nagyjából rendben van, de semmi más. Szerinte azért, mert átmegy egy LLM-n, ami polkorrekt irányba korrigálja. Az a rossz hírem, hogy a valóság ennél borzasztóbb. LLM-n valóban átmegy, de inkább arról van szó, hogy az MI tényleg ennyire hülye. A MI valószínűleg nem volt tréningezve arra, hogy felismerje, hogy a pápák férfiak. Fekete pápa egyelőre még nem volt, de annak elvi akadálya nincs. A vikingeknél se rágta senki a szájába, hogy a vikingek északi germán férfiak. Bár találtak néhány női sírt is, de keveset. Ezért mindenféle etnikumú és nemű harcost rajzolt, vélhetően fantasy forrásokat is felhasználva.
Jól láthatóan a német katonáknál is csak az egyenruha színére, a sisak formájára figyelt fel. Valamennyit megsejtett a vaskeresztből is és a Reichadlerből, de jól láthatóan nem sikerült elegendő mintát megfigyelnie ezeket rekonstruálni tudja. A többi részletet odahallucinálta. A hallucináció amúgy is egy alapvető sajátossága az MI-nek. Amikor hiányzik számára információ, akkor kitalációkkal tölti ki a helyet. Ilyenek azok a rangjelzésnek szánt izék, vagy a sisakon látható kriksz-krakszok. Ilyet rajzolna egy gyerek, aki látott egy háborús filmet, de nem figyelte meg alaposan és próbálja a homályos emlékeiből rekonstruálni. (Egyébként történelmi érdekesség, hogy a Wehrmachtban harcoltak indiaiak, arabok, sőt feketék, illetve léteztek női segédcsapatok)
Ehhez nem szükséges belenyúlni a promptba, bőven elég egy a feladatra felkészületlen MI.
Szóval, itt javasolnám alkalmazni Hanlon-borotváját, miszerint ne keress rosszindulatot ott, ahol minden magyarázható hülyeséggel.