Betri og ódýrari talgreining í Hreimi

Það er skammt stórra högga á milli en stutt er síðan við gáfum Málstað alveg nýtt útlit. Nú höfum við beint sérstakri athygli að Hreimi ásamt því að gefa öllum verkfærum Málstaðar ný teikn. Þá höfum við lækkað verð á talgreiningu umtalsvert.

Talgreiningarsaga

Nú er hægt að nálgast eldri talgreiningarniðurstöður og upptökur í Hreimi, ásamt því að setja fleira en eitt talgreiningarverkefni í gang í einu. Því þurfa notendur ekki lengur að hafa áhyggjur af því að úttakið tapist en hægt er að viðhalda allt að 10 verkefnum í einu.

Þá er einnig hægt að fá samantekt og fundargerðir útfrá talgreiningarniðurstöðum í hliðarstikunni til hægri, sem er svo hægt að afrita, færa í Málfríðar ritilinn eða hlaða niður.

Fyrir þau sem ekki vilja viðhalda neinum upplýsingum um fyrri talgreiningarverkefni er hægt að slökkva á þessari virkni í notendastillingum sem hægt er að nálgast með að smella á notandanafn neðst í hliðarstiku vinstra megin.

Upptaka í ritli

Okkur er mjög umhugað um aðgengi að öllum okkar lausnum og nú er hægt að nálgast talgreiningarvirkni Hreims á mjög einfaldan og aðgengilegan máta í ritli Málfríðar og Erlends. Í stað þess að hlaða upp mynd- eða hljóðupptöku í viðmót Hreims eiga notendur nú kost á að tala beint inn í ritil með þartilgerðum hnappi og nálgast úttakið á sama stað. Þetta hentar sérstaklega vel þeim sem nota Hreim fyrst og fremst til þess að diktera tölvupósta eða önnur skilaboð, eða til þess að gera uppkast að ritgerðum.

Upptaka hefst um leið og smellt er á hljóðnemann í valmynd fyrir neðan ritil og eftir að búið er að samþykkja aðgang að hljóðnema.

Þegar upptöku og talgreiningu hefur verið lokið er niðurstaða birt sem getur svo verið færð inn í ritil.

Mælendaskráning

Hreimur hefur frá síðustu stóru uppfærslu boðið upp á valkvæða mælendagreiningu, þ.e.a.s. virkni sem skiptir úttaki talgreiningar upp eftir því hver mælir hverju sinni. Mismunandi mælendur hafa verið merktir sem „Mælandi 1“, „Mælandi 2“ o.s.frv. en þessum nöfnum er hægt að breyta í viðmótinu, „Mælandi 1“ getur orðið „Jón Jónsson“ og þar fram eftir götunum.

Ný kynnum við til sögunnar nýja og bætta virkni, mælendaskráningu, þar sem líkanið ákvarðar sjálft nöfn mælenda út frá upplýsingum sem finnast í talinu, svo sem þegar einn mælandi ávarpar eða vísar til annars með nafni, eða mælendur kynna sig sjálfir með nafni. Hér að neðan má sjá dæmi um mælendaskráningu útfrá upptöku af þingfundi Alþingis.

Bætt talgreiningarlíkan

Við erum stöðugt að ítra og bæta líkanið sem knýr talgreiningu Hreims og metum þetta líkan á fjölbreyttum mæliprófum. Þessi mælipróf eru krefjandi og innihalda erfið hljóðskilyrði, fjölbreyttan hóp ræðumanna og mismunandi upptökugæði. Við fylgjumst með þremur lykilmælikvörðum:

  • Villuhlutfall orða (WER): Hlutfall orða sem líkanið talgreinir rangt (lægra er betra).

  • Villuhlutfall stafa (CER): Hlutfall stafa sem líkanið talgreinir rangt, þ.e. nær yfir fínlegri villur (lægra er betra).

  • chrF++: Skali frá 0–100 sem mælir hversu náið úttakið samsvarar mannlegri tilvísun (hærra er betra).

Frá grunngildi okkar í ágúst 2025 hefur hrátt úttak líkansins (þ.e.a.s. án nokkurrar sjálfvirkrar eftirvinnslu) sýnt 26% hlutfallslega fækkun á orðavillum og 30% hlutfallslega fækkun á stafavillum, ásamt því að chrF++ hefur hækkað úr 88,9 í 90,9. Þessar framfarir halda sér einnig eftir þá eftirvinnslu sem er gerð á úttaki Hreims áður en það birtist notendum: orðavillum hefur fækkað um 22% og stafavillum um 29% miðað við sama grunngildi.

Hér er athyglisvert að stór hluti þeirrar aukningar sem við sjáum í nákvæmni úttaksins kemur frá líkaninu sjálfu frekar en frá eftirvinnslu. Bilið milli hráa og eftirunna úttaksins hefur minnkað með hverri ítrun á þjálfun. Þetta bendir til þess að líkanið sé að læra að framleiða hreinni umritanir beint úr kassanum – sem dregur úr þörf okkar fyrir leiðréttingar í síðari skrefum.

Nýtt teikn

Augljósasta breytingin á Hreimi er kannski nýja teiknið sem auðkennir hann í viðmóti Málstaðar. Öll verkfærin á Málstað hafa nú fengið ný teikn sem aðgreina þau betur hvort frá öðru og eru meira lýsandi fyrir þá virkni sem hvert verkfæri býður upp á. Nýja Hreimsteiknið er innblásið af hljóðbylgjum eins og þær birtast okkur gjarnan í ýmsum upptöku- og hljóðvinnslutækjum.

Aukin fríðindi

Rúsínan í pylsuendanum er að við höfum nú uppfært verðskrá og áskriftarfríðindi á talgreiningu til að gera hana aðgengilegri og ódýrari frá og með aprílmánuði:

  • Föst áskrift felur í sér tvöfalt meiri talgreiningu á mánuði eða 10 klst. í staðinn fyrir 5 klst.

  • Frjáls áskrift býður upp á eina fría klst. fyrir 1000 kr. inneign sem fylgir hverjum notanda, og notkun umfram inneign kostar helmingi minna eða 1000 kr./klst. í stað 2000 kr./klst.

Á döfinni

Við erum hvergi nærri hætt að þróa og bæta Hreim. Við vinnum nú að lausn sem býður upp á talgreiningu í rauntíma og stefnum á að innleiða hana á Málstað síðar á þessu ári. Þar að auki höldum við áfram að uppfæra og bæta viðmót Hreims til þess að auðvelda notendum enn frekar að vinna með úttakið á skilvirkan hátt.

Skráðu þig á póstlistann okkar!

Efnisorð:
Deildu þessari grein: