Spyrja tjattið?

„Ég spurði gervigreindina …“ og „Ertu búin(n) að spyrja tjattið?“ eru frasar sem heyrast æ oftar. Það er ekki svo langt síðan fólk lærði að leita að svörum við spurningum sínum í leitarvélum, og þá sérstaklega Google, en nú er það orðið flestum tamt, enda bæði fljótlegt og þægilegt.

Undanfarin misseri hefur það þó gerst að leitarvél Google hefur hrakað áþreifanlega, að miklu leyti vegna ógrynnis af lélegum síðum með gervigreindar- og auglýsingaefni. Á sama tíma veita gervigreindarþjónustur eins og ChatGPT, Claude og Gemini svör af miklu öryggi um hvað sem spurt er um. Hægt er að spyrja þær nákvæmra spurninga um hluti sem eru svo sérsniðnir að Google upp á sitt besta hefði rekið í strand. Það að vera með aðstoðarmann í vasanum sem getur leiðbeint á öllum sviðum lífsins hljómar eins og draumur eða vísindaskáldsaga, og því ekki skrýtið að margt fólk sé farið að nota gervigreind daglega, í vinnu, skóla og einkalífi.

Gervigreindin veit ekki hvað hún veit ekki

Við meiri notkun kemur þó í ljós að þótt svörin séu sett fram af miklu öryggi reynast þau ekki alltaf standast skoðun. Líkönin (það sem fólk kallar í daglegu tali „gervigreindin“) hafa verið mötuð á svo miklum upplýsingum að okkur finnst stundum eins og þau viti allt. Vandamálið er að þegar þekkingunni sleppir gerist ekki það sem við eigum að venjast hjá mannfólki, því líkönin segja sjaldnast „ég veit það ekki“.

Gervigreindarlíkön eru nefnilega ekki sannleiksvélar sem fletta upp staðreyndum sem við spyrjum um áður en þau svara. Þetta hljómar kannski þversagnakennt þegar við höfum reynslu af því að nota þau nákvæmlega þannig og höfum jafnvel ítrekað fengið góðar niðurstöður.

Þetta snýst allt um grundvallarforsenduna: að líkönin eru líkindavélar, gríðarlega öflugar, sem eru þjálfaðar í að taka við texta og ljúka við hann með sem líklegustum hætti. Oft, jafnvel oftast, þýðir það að upplýsingarnar sem koma fram eru réttar, sérstaklega þegar viðfangsefnið er eitthvað sem kemur margsinnis fyrir í textunum sem er þjálfað á. Þá er heimsmynd líkansins um það tiltekna efni ítarleg og svörin oft mjög nákvæm, góð og gagnleg, og flókin viðfangsefni sett upp og útskýrð á skýran og læsilegan hátt.

En hvað ef lítið eða ekkert er í þjálfunartextunum um efnið sem þú ert að spyrja um? Okkur þætti eðlilegt að þá myndi líkanið ekki svara, eða láta vita að það hafi ekki þekkingu á efninu. Það er hins vegar ekki það sem gerist. Gervigreindin svarar, af sömu fullvissunni, hvort sem svarið er rétt eða rangt. Hún hefur séð ótal dæmi um mannleg samskipti í þjálfunargögnunum og veit hvernig góð svör eiga að líta út og hefur lært að vera eins gagnleg og auðið er í samskiptum við fólk.

Það er auðvelt að ímynda sér að gervigreindin sé að ljúga þegar hún fer með fleipur. En þar stendur hnífurinn í kúnni, því gervigreindin veit ekki hvenær hún veit ekki eitthvað. Hún er spálíkan, og þau vinna ekki með sannleika heldur líkindi.

Líkindin snúast því ekki um hversu líklegt er að eitthvað sé satt, heldur hversu líklegt er að það sé eðlilegt framhald á því sem á undan kemur, byggt á öllu sem líkanið veit um heiminn. Þetta tvennt fer mjög oft saman en ekki alltaf, og þá er engin viðvörun. En af hverju er henni þá ekki bara kennt að játa vanþekkingu sína? Stutta svarið er að það er í raun mjög tæknilega flókið og að miklu leyti óleyst vandamál eins og núverandi tækni er hönnuð.

(Hér hefur verið talað um líkönin sem líkindavélar en það er nokkur einföldun. Þau eru svo stór að sú lýsing dugar ekki til, og það má hugsa sér að í þeim verði til eitthvað sem minnir á rökhugsun; líkanið lærir strúktúr heimsins í gegnum texta, að því leyti sem það er hægt. Þetta er þó stöðugt bitbein sérfræðinga, sem deila um hvort hér er á ferðinni raunverulegur „skilningur“ eða mjög fullkomið eftirhermuferli.)

Ekki uppfletting í gagnabanka

Fyrir notendur gervigreindar er kannski mikilvægast af öllu að átta sig á því að gervigreindarlíkönin eru ekki að fletta upp í gagnabanka og finna texta eða heimildir sem þær vinna svo úr og birta.

Textarnir sem líkönin eru þjálfuð á eru hvergi inni í líkaninu sjálfu á upprunalegu formi, heldur hefur þeim verið skipt upp í smærri einingar (orðhluta) fyrir þjálfun. Síðan lærir líkanið mynstur sem koma fyrir í textunum, á löngum tíma og með miklu reikniafli, og lærir að raða orðhlutum saman til þess að fá út líklegan texta.

Þannig að ef við biðjum stórt mállíkan um að þylja orðrétt upp Mannréttindayfirlýsingu Sameinuðu þjóðanna á ensku getur það gert það, því hún kemur að öllum líkindum svo oft fyrir í gögnunum að líkanið hefur „lært hana utanbókar“. Yfirlýsingin er samt ekki sótt orðrétt á einhvern stað í líkaninu, heldur mynduð frá grunni hvert sinn.

Ef ég bið sama líkan hins vegar um opinberu íslensku þýðinguna á yfirlýsingunni eru fyrstu greinarnar réttar en svo fer líkanið fljótt út af sporinu og breytir þýðingunni eða býr til nýjan texta. Það má líka gefa sér að íslenska þýðingin komi ekki jafnoft fyrir í þjálfunargögnunum og enski textinn.

En svo ef ég bið um textann að vel þekktu íslensku kvæði eins og Á Sprengisandi eru fyrstu tvær ljóðlínurnar réttar en svo rekur líkanið í vörðurnar:

Ríðum, ríðum, rekum yfir sandinn,

rennur sól á bak við Arnarfell.

Hér á bak við hverja þúfu í landinn

kynjamyndir kveðja búa í fell.

Sá ég þar vofur, sá ég þar vofur,

sá ég þar vofur á sveimi.

Hvergi lætur gervigreindin vita að hún kunni ekki textann upp á hár, enda veit hún það ekki.

Þegar við notum gervigreind verðum við því alltaf að hafa það á bak við eyrað að það er ekkert sem gefur til kynna hvenær hún er byrjuð að fara með fleipur. Við getum þó notað hyggjuvitið til þess að meta hvenær líklegt er að hún sé með mikið af upplýsingum á bak við sig og hvenær lítið. Til dæmis er hægt að biðja hana um að útskýra efni Mannréttindayfirlýsingarinnar í nákvæmu máli og eflaust væru niðurstöðurnar góðar og gegnar, enda hefur gríðarmikið verið skrifað um hana á netinu. Aftur á móti getum við gefið okkur að ekki sé vænlegt að biðja um bókmenntalega greiningu á Á Sprengisandi, enda hlutfallslega lítið verið skrifað um það kvæði í stóra samhenginu. Þumalputtaregla er raunar að fara afar varlega í að treysta upplýsingum frá núverandi gervigreindarlíkönum um séríslensk málefni – og þá komum við einmitt að næsta mikilvæga punkti:

Gervigreindin veit allt (nema það sem ég veit)!

Sumar gervigreindarþjónustur hafa aðgang að internetinu eða ýmsum tólum og geta flett upp efni fyrirspurnarinnar og smíðað svörin út frá niðurstöðunum. Þetta eykur gegnsæið, því þá getur notandinn séð hvaðan upplýsingarnar koma og metið réttmæti þeirra. Þetta hindrar þó líkanið ekki í því að fylla í eyðurnar til að búa til sem heildstæðast svar, og þá er mjög erfitt að sjá hvar sannleikanum sleppir.

Til að átta sig á takmörkunum gervigreindarinnar er gott að prófa að spyrja hana um efni sem maður þekkir í þaula. Ég prófaði til dæmis að spyrja gervigreindarlíkan um húsið mitt, gamalt timburhús í Þingholtunum. Gervigreindin notaði innbyggð tól til að fletta upp gamalli fasteignaauglýsingu og gat þulið upp margs konar fróðleik um húsið sem ég vissi að var réttur. En þegar ég bað hana um að segja mér meira skáldaði hún nafn á smið hússins og hélt því ranglega fram að þar hefði myndlistarmaðurinn Muggur búið ásamt fjölskyldu sinni og unnið þar bókina Dimmalimm.

Hér er röngum staðreyndum blandað saman við réttar svo úr verður trúverðug (líkleg) frásögn. Mikilvægt er að muna að þetta á alltaf við. Það er nefnilega ekki þannig að gervigreindin flaski bara á okkar sérsviði, við sjáum bara miklu betur í gegnum rangfærslurnar þegar við þekkjum efnið vel.

Þú ert hluti af svarinu

Gervigreindin er afar næm fyrir orðalaginu frá notandanum. Þetta er jákvætt að því leyti að hægt er að lýsa verkefninu sem á að leysa nákvæmlega til að beina líkaninu í ákveðna átt og fá út sérsniðna lausn á nánast hvaða tungumáli sem er. Þetta þýðir hins vegar líka að gervigreindin lagar sig að notandanum og vilja hans, jafnvel um of.

Þetta er af því að fyrirmælin eru í raun bara fyrsti hlutinn af svarinu. Í grunninn eru líkönin þjálfuð í eyðufyllingu; þau fá texta sem þau eiga að ljúka við á sem eðlilegastan hátt. Það má líkja þessu við það að við gefum þeim fyrripart sem þau eiga að botna. Botninn þarf þá að fylgja vissum reglum og „ríma“ við fyrripartinn svo útkoman verði ásættanleg.

Á seinna stigi er líkönunum svo kennt að nota þessa eyðufyllingargetu til þess að svara spurningum, og þau eru svo verðlaunuð fyrir að svara vel og refsað fyrir að svara illa. Þar læra þau að skjalla notandann og gleðja hann, til þess að fá frekar jákvæða svörun.

Þegar við notum gervigreindarlíkön í endanlegri útgáfu er búið að setja verkefnið upp sem spurningu og svar, en í raun er spurningin ekki aðskilin frá svarinu, heldur upphafspunktur eða fyrripartur sem líkanið þarf að botna. Þess vegna skiptir svo miklu máli hvernig við orðum spurningarnar okkar. Það er auðvelt að falla í þá gryfju að spyrja leiðandi spurninga þegar við viljum fá svör í takt við eigin sannfæringu. Flestum gervigreindarnotendum finnst þeir eflaust orða spurningar sínar á hlutlausan og ótvíræðan hátt, en það er margt sem spilar inn í. Bara það á hvaða tungumáli við spyrjum hefur áhrif á svarið. Nákvæmt orðaval okkar og málfar skiptir sömuleiðis máli, og hvað þá það sem lesa má milli línanna eða við látum óvart uppi um vilja okkar. Sífellt er verið að vinna að því að gera líkönin þolnari fyrir mismunandi orðalagi fyrirmælanna, en það þarf ekki að leita langt til að finna dæmi þar sem þau sýna þessa hegðun.

Við getum líka gert ýmislegt til að stuðla að nákvæmari svörum, eins og að gefa nákvæmar forsendur, segja til um á hvaða sniði við viljum fá svarið, segja hvað við viljum ekki að gervigreindin geri, og biðja um heimildir fyrir öllum staðreyndum (þar sem slík tól eru í boði, annars býr gervigreindin bara til heimildir!). Ekkert af þessu gulltryggir okkur þó gegn rangfærslum, og það er á okkar ábyrgð að treysta aldrei í blindni.

Er þá alveg óábyrgt að nota þessa tækni?

Eins og sjá má er grundvallarmunur á því að spyrja Google og spyrja gervigreind, því í leitarvél getum við valið á hvaða vef við lendum og svo notað hyggjuvitið til að meta áreiðanleika hans í að veita réttar upplýsingar. Hjá gervigreindinni fáum við alltaf svör, en þurfum að taka þeim með fyrirvara.

En þýðir þetta að það sé ekki réttlætanlegt að nota gervigreind til að svara spurningum? Það er ekki svo einfalt, og er undir hverju og einu okkar að ákveða hvernig og hvort við notum þessa tækni. Í raun ætti alltaf að sýna heilbrigða tortryggni við notkun gervigreindar, rétt eins og við aðra upplýsingaöflun, og sannreyna upplýsingar með öðrum leiðum. Við þurfum líka alltaf að hafa í huga að gervigreindin reynir í sífellu að þóknast okkur í svörum sínum, og við kunnum að láta blekkjast af vel fram settum svörum á góðu máli. Það er mannleg hegðun að treysta texta sem fyrir okkur er lagður, sérstaklega þegar hann er eins hjálplega og vinalega orðaður og hjá gervigreindinni.

Þetta þýðir þó alls ekki að það þurfi að veigra sér við að nota gervigreind á öllum sviðum. Hún getur verið stórkostlegt hjálpartæki, sérstaklega við að vinna úr miklu magni upplýsinga, leysa tímafrek verkefni sem okkur mannfólki finnast leiðinleg, vinna með og umbreyta texta og kóða og ótalmargt annað. Þetta er efni í næsta pistil, þar sem við skoðum gagnlegar (og ógagnlegar) leiðir til að nota gervigreind.

Þegar allt kemur til alls er það hins vegar notandinn sem þarf að beita gagnrýninni hugsun. Notandinn ber alltaf ábyrgð á þeim texta eða upplýsingum sem hann lætur frá sér, ekki gervigreindin. Með því að átta sig á takmörkunum tækninnar má skilja betur hvernig hægt er að hagnýta hana þar sem það á við.

Skráðu þig á póstlistann okkar!

Ef þú vilt fylgjast með frekari verkefnum hjá Miðeind getum við látið þig vita þegar eitthvað nýtt er að frétta.

Efnisorð:

Greinar Gervigreind