Nýtt! Prófaðu Málstað, vettvang fyrir allar helstu vörur Miðeindar.

Hvernig er veðrið í Borgarnesi?

Embla svarar spurningum á borð við: Hvernig er veðrið í Borgarnesi? Hvar er næsta stoppistöð? Hvenær kemur strætó númer 14 á Hlemm? Hvar er ég? og Hvað er langt í Melabúðina? Hún getur líka sagt þér hvað klukkan er, reiknað einföld stærðfræðidæmi og breytt upphæðum á milli gjaldmiðla.

Embla getur spáð fyrir um veðrið, svalað forvitni þinni um fólk sem hefur verið í fréttum og frætt þig um fyrirtæki, stofnanir og fyrirbæri. Þar að auki kann Embla nokkra brandara, en deila má um hversu góðir þeir eru.

Embla

Á bak við einfalt viðmót Emblu er flókin og margþætt tækni. Fyrirspurnum þínum er fyrst breytt í texta með raddgreiningu, sem skilar tíu líklegustu setningum sem þú gætir hafa sagt. Málgreiningarvél Miðeindar, Greyni, er síðan beitt til að finna hver af þessum tíu setningum – í lækkandi röð eftir líkindum – er rétt mynduð spurning sem Embla kann að svara. Þar er beitt jöfnum höndum almennum íslenskum málfræðireglum og sérreglum um spurningar á hverju sérsviði sem kerfið þekkir.

Þegar rétt mynduð spurning finnst er hún kóðuð í setningatré, sem Greynir veiðir síðan lykilatriði spurningarinnar upp úr, svo sem um hvaða strætó eða hvaða stað verið er að spyrja. Þar gerir íslenskukunnátta Greynis að verkum að ekki skiptir máli hvort talað er til dæmis um Hlemm, Hlemmi eða Hlemms, hann veit að staðurinn heitir Hlemmur.

Að þessu loknu er svarið fundið, ef til vill með uppflettingu í öðrum tölvukerfum. Þá er það mótað í rétta íslenska setningu þar sem gætt er að fallbeygingu og öðrum málfræðilegum eiginleikum. Loks er fullmótað svar sent til talgervils sem breytir því í hina ómþýðu rödd Emblu, sem velja má hvort er karl- eða kvenrödd.

Embla er byggð upp í einingum. Auðvelt er að smella inn nýjum einingum sem bæta við hana virkni. Til dæmis er eining í Emblu sem skilur fyrirspurnir um ferðir Strætó og getur svarað þeim út frá tímaáætlun og rauntímaupplýsingum um hvar vagnarnir eru staddir.

Nánar er fjallað um tæknina að baki Emblu í greininni Embla og tækifærin í íslenskri máltækni eftir Sveinbjörn Þórðarson í Tölvumálum nóvember 2022.

Ef þú ert með hugmynd að nýrri einingu inn í Emblu, eða ert með vöru, þjónustu eða upplýsingar sem eiga erindi inn í appið, þá endilega sendu okkur línu með tölvupósti á mideind@mideind.is.

Talaðu við mig!

Raddtækni Miðeindar er ekki bara bundin við raddþjóninn Emblu. Virknina sem liggur að baki Emblu má byggja inn í öpp og vefi fyrirtækja, svo viðskiptavinir geti sinnt erindum sínum með röddinni einni saman. Með hjálp Miðeindar geta spjallmenni einnig talað við notendur og tekið við fyrirspurnum á mæltu máli (talgreining og talgerving).

Raddvirkni eykur aðgengi að upplýsingum og þjónustu fyrir þau sem eiga erfitt með að nota hefðbundið lyklaborð og skjái, t.d. vegna blindu eða sjónskerðingar. Þannig stuðlar hún að bættri upplifun fyrir alla notendur.

Raddvirkni

Á bak við raddviðmót, á borð við Emblu, er flókin og margþætt tækni. Fyrirspurnum notanda er fyrst breytt í texta með talgreiningu. Þá er textinn sendur á fyrirspurnaþjón sem greinir hann og finnur viðeigandi svar á textaformi. Svarið getur verið fyrirfram tilgreint eða getur fengist með uppflettingu í ýmsum tölvukerfum. Svarið er mótað í rétta íslenska setningu þar sem gætt er að fallbeygingu og öðrum málfræðilegum eiginleikum. Svarið er svo sent í normun (text normalization) þar sem upphæðum, dagsetningum, skammstöfunum o.fl. er breytt í fullútskrifaðan og rétt beygðan texta, sem síðan er sendur til talgervils. Talgervillinn skilar hljóðstreymi í MP3 formi sem spilað er í vefrápara eða í appi og er úr ýmsum mismunandi röddum að velja.

Miðeind styður við alhliða raddþjónustu í gegnum kóðasafnið EmblaCore, sem fæst í tveimur útgáfum: Flutter útgáfu fyrir öpp og Javascript útgáfu fyrir vefsíður. Kóðasafnið EmblaCore, sem talar við þjónustu hjá Miðeind (Ratatosk) sem tekur við hljóðgögnum og vinnur úr þeim, býður upp á talgreiningu (þ.e.a.s. að breyta rödd notanda í texta), svörun fyrirspurna með Greyni, máltæknivél Miðeindar, og talgervingu (þ.e.a.s. að breyta texta í hljóð sem svo er spilað fyrir notanda). Mengi mögulegra fyrirspurna og svara er hægt að útfæra sérstaklega í hverju notkunartilviki fyrir sig.

Tónheimur Emblu

Halldór Eldjárn

Halldór Eldjárn tónlistarmaður samdi hljóðin sem heyrast þegar Embla er notuð. Þar var vandað til verka enda standa vonir til að þessi hljóð verði hluti af daglegu lífi notenda Emblu. Að sjálfsögðu var leitað í íslenskan tónlistararf og tengingu við náttúruna. Halldór sökkti sér í rannsóknarvinnu um íslensk hljóðfæri og niðurstaðan er spennandi blanda af nútíð og fortíð þar sem steinharpa Páls á Húsafelli kemur m.a. við sögu.

Persónuvernd

Um Emblu gildir ítarleg persónuverndarstefna. Þar kemur meðal annars fram að notandi þarf hvorki að gefa upp nafn, kennitölu, tölvupóstfang né aðrar persónuupplýsingar til að nota Emblu. Notandi getur hvenær sem er látið þurrka út öll fyrirspurnargögn úr gagnagrunnum Miðeindar sem tengjast snjalltæki í umsjá háns. Þá er auðvelt að stjórna því hvort Embla sendir staðsetningu snjalltækis með fyrirspurn.