Nýtt! Prófaðu Málstað, vettvang fyrir allar helstu vörur Miðeindar.

Miðeind í samstarfi við OpenAI um GPT-4

14.3.2023

Bandaríska fyrirtækið OpenAI hefur verið ofarlega á baugi upp á síðkastið sem útgefandi nýstárlegra gervigreindarlausna á borð við DALL·E og ChatGPT sem slegið hafa í gegn hjá milljónum notenda um allan heim. Glöggir notendur á Íslandi hafa tekið eftir því að spjallmennið ChatGPT kann ýmislegt fyrir sér í íslensku þrátt fyrir að hafa aðeins verið markvisst þjálfað í ensku. Við þróun nýjustu afurðar sinnar, GPT-4, sem kynnt er í dag, hefur OpenAI hins vegar í fyrsta skipti gert tilraunir með sérstaka þjálfun risamállíkans síns á öðru tungumáli en ensku, og þar varð íslenska fyrir valinu.

Hér hefur íslenska máltæknifyrirtækið Miðeind gegnt lykilhlutverki en samstarf Miðeindar og OpenAI hófst í kjölfar heimsóknar forseta Íslands og sendinefndar til höfuðstöðva OpenAI í San Francisco í maí síðastliðnum. Fyrsti áfangi samstarfsverkefnisins sneri að því að kenna fyrri kynslóð GPT mállíkansins íslensku (svokölluð „fínþjálfun“) og að meta hversu mikið af textagögnum þyrfti til að ná því markmiði.

Þegar undirbúningur næstu kynslóðar GPT líkansins, þ.e. GPT-4, fór á skrið sl. haust leitaði OpenAI til Miðeindar um að taka þátt í þjálfun þessa nýjasta líkans sem er mun stærra og öflugra en fyrirrennarinn. Þar var um að ræða svokallaða styrktarþjálfun með mannlegri endurgjöf (e. Reinforcement Learning - Human Feedback) en þessi tegund þjálfunar er nauðsynleg til að kenna mállíkani að skilja spurningar og verkefni og svara þeim rétt og vel.

Miðeind safnaði saman hópi næstum 40 sjálfboðaliða hérlendis sem fengu það verkefni að útbúa spurningar og verkefni á íslensku fyrir GPT-4, og síðan að meta svör líkansins, gefa þeim einkunnir og kenna því hvernig það gæti svarað enn betur. Þessi gögn voru að því loknu notuð í þjálfun GPT-4 og urðu til þess að líkanið tók mælanlegum framförum í íslensku.

Verkefninu er þó hvergi nærri lokið því ljóst er að töluvert meiri þjálfun þarf til að gera líkanið fullfært í tungumáli okkar eyjarskeggja. Líkanið skilur vel spurningar og verkefni og stendur sig nú þegar mjög vel í mörgu, svo sem samantekt texta, viðhorfsgreiningu og þýðingu yfir á önnur tungumál, en gerir enn málfræði- og orðalagsvillur þegar það er beðið að skrifa lengri samfelldan texta á íslensku.

Miðeind hefur frá árinu 2015 unnið að þróun hugbúnaðar á sviði máltækni og gervigreindar fyrir íslensku. Miðeind hefur kynnt til sögu nokkrar vörur á sviði máltækni, svo sem snjall-aðstoðar-appið Emblu, málrýnina Yfirlestur.is og þýðingarvélina Vélþýðingu.is, ásamt því að taka þátt í máltækniáætlun stjórnvalda og vinna að ýmsum verkefnum með íslenskum fyrirtækjum. Miðeind er umhugað um að máltæknibúnaður sé almennt opinn og aðgengilegur sem flestum og var stofnuð fyrst og fremst til þess að vinna að bættum hag íslenskunnar í stafrænum heimi. Hjá fyrirtækinu starfa 12 sérfræðingar með fjölbreyttan bakgrunn.

Fyrirtækin tvö, Miðeind og OpenAI, eiga það sameiginlegt að hafa lagt mikla áherslu á að þróa gervigreind með ábyrgum hætti og þannig að sem flest njóti ávinnings af henni. Vonir standa til að áframhaldandi samstarf fyrirtækjanna tveggja muni leiða til þess að íslenska tungumálið standi jafnfætis stærri tungumálum í gervigreindarlíkönum á borð við GPT-4. Þá er hugmyndin að þetta tilraunaverkefni verði nýtt sem sniðmát fyrir önnur smærri tungumál svo þau fái notið sömu tækifæra.

Gervigreind mun líklega verða einn helsti drifkraftur framleiðniaukningar og nýsköpunar á næstu árum og áratugum. Ein helsta áskorun gervigreindarbyltingarinnar er að tryggja að tæknin sé aðgengileg fyrir alla og að ekki skapist gjá á milli þeirra sem hafa aðgang að henni og þeirra sem hafa hann ekki (e. AI Divide). Þar skiptir stuðningur við tungumál heims lykilmáli. Þá þarf að þróa tæknina þannig að hún sé örugg, þjóni hagsmunum mannkyns og festi ekki bjaga, mismunun eða ójöfnuð í sessi.

Miðeind hlakkar til að halda áfram nánu og góðu samstarfi við OpenAI og að vinna að því að styrkja stöðu íslenskunnar á öld gervigreindar.

Deildu þessari frétt: