Blogit

Automaattinen käännös- ja puheentunnistusteknologia etätapaamisten tukena

 

Blogisarjassa pohditaan digimaailman kehittymistä ja etsitään hyviä käytäntöjä digitaalisen osallisuuden edistämiseksi. Tässä kirjoituksessa pohdimme etätapaamisten saavutettavuutta ja käytettävyyttä sekä automaattista käännös- ja puheentunnistusteknologiaa.

Kuuloliiton Digitaidot-hanke on tukenut viimeisen vuoden aikana vapaaehtoisten valmiuksia järjestää ja osallistua etätoimintaan. Olemme järjestäneeyhteensä 40 etätyöpajaa, joissa on ollut 362 osallistujaa. On ollut innostavaa seurata, miten etäalustojen käyttö on alkanut sujua ja etätoiminnasta on innostuttu. Samalla olemme havainneet, että vaikka yhä useampi etäalusta kiinnittää huomiota niiden saavutettavuuteen, palveluiden käytettävyys ei ole kaikin osin parantunutEtäalustojen käyttö vaikuttaakin nojaavan osittaisiihen, miten hyvin erilaiset palvelut toimivat yhdessä. 

Olemme käyttäneet etätapaamisten järjestämiseen pääasiassa Zoomia. Päädyimme Zoomiin, sillä tällä hetkellä se tarjoaa kilpailijoitaan monipuolisemmat mahdollisuudet kirjoitustulkkauksen toteuttamiseen. Zoomin etuna on ollut myös se, että esitystä jakaessa puhujan kuva tai chattinäkymä eivät häviä. Tämä vahvistaa vuorovaikutuksen monikanavaisuutta ja helpottaa tapaamisten ohjaamista. Zoomin hintalappu on myös sen verran huokea, että sen voi ottaa käyttöön vähän pienempikin toimija.  

Zoomin käyttöön liittyy kuitenkin yksi iso miinus: ohjelma on englanninkielinen. Monelle tämä vaikeuttaa ohjelman käyttöä tai jopa estää sen käyttöönoton täysin. 

Markkinoilla toimii toki muitakin etäalustoja. Muun muassa yhdysvaltalainen Blackboard sisältää tekstitysominaisuuden ja toimii suomeksi. Alusta vaikuttaa erinomaiselta, mutta sen hinta on pienemmille toimijoille melko korkea. 

Etäalustat tekevät näkyväksi sen, että digitaalisessa maailmassa asiat toimivat englanniksi. Kärjistetysti meidän, jotka asumme pienillä kieli- ja markkina-alueilla, odotetaan sopeutuvan tähän. Jos haluamme ohjelmat täysine ominaisuuksineen käyttöömme, meidän tulee osata myös englantia. Alustojen ja ohjelmien rinnalla kehittyy kuitenkin automaattinen käännös– ja puheentunnistusteknologia. Parhaimmat lisäävät palvelujen käytettävyyttä ja saavutettavuutta. 

Automaattinen käännös- ja puheentunnistusteknologia tukevat digitalisaatiokehitystä ja voivat helpottaa myös etäosallistumista 

Kaksi henkilöä ovat tabletin äärellä. Vasemmalla herrasmies katsoo tablettia digikynä kädessään. Oikealla seisova henkilö neuvoo.

Automaattinen konekäännötoimii jo nyt varsin sujuvasti suurten kielten välillä. Käännösteknologiassa näkyy englannin ylivalta mutta myös suomeksi toimivat käännösohjelmat kehittyvätKonekäännös on tullut osaksi muun muassa internethakuselainten toimintoja ja nähtävissä on, että se tulee helpottamaan verkkopohjaisten ohjelmien käyttöä. Täysin ongelmaton ratkaisu ei ole; automaattiseen konekäännökseen ei voi ainluottaa. Pahimmillaan se voi jopa sotkea käyttäjää. Selainpohjaisten käännösten myötä myös yhä suurempi osa toimintojamme siirtyy internetjättien haltuun. Silti: vaikka osa käännöksistä on kömpelöitä, se tarjoajonkinlaista tukea esimerkiksi verkkopohjaisen Zoomin käyttäjälle. 

Toinen kiinnostava kehitys tapahtuu puheentunnistusteknologian saralla. Muun muassa Teams ja Google Meet –etäalustat tarjoavat toimivan englanninkielisen livetekstitysominaisuuden. Google Chromeen taas on tullut ominaisuus, joka mahdollistaa minkä tahansa Chromessa näytettävän videon englanninkielisen live-tekstityksenSuomenkielisenä tätä palvelua ei toistaiseksi ole. Sen sijaan esimerkiksi Android-laitteisiin ladattava LiveTranscribe toimii yllättävän hyvin. Toistaiseksi se toimii parhaiten, kun puhe on selkeästi artikuloitua yleiskieltä. Palvelua voi käyttää tarvittaessa vaikkapa etätapaamisten tukena. 

Puheentunnistusteknologia näyttää olevan lyömässä läpi laajemminkin. Yksi mainitsemisen arvoinen esimerkki on Microsoft Officeen kuuluva PowerPoint. PowerPointin uusin versio sisältää automaattiseen puheentunnistukseen pohjautuvan livetekstitysominaisuuden, joka toimii myös suomeksi – yllättävän hyvin. 

PowerPointin livetekstitys kytketään päälle automaatiovälilehdellä, jonka jälkeen se laitetaan diaesitystilaan. Kun livetekstitys on kytketty päälle, PowerPoint voidaan jakaa esimerkiksi etäalustoilla. Tekstin koko on melko pientä ja ilmestyy ruudulle pienellä viiveellä. Se voi kuitenkin tarjota tapaamisissa puheelle tukea. Voit tutustua PowerPointin livetekstitykseen webopettaja Esa Riutan havainnollistavan videon kautta. Käytännössä ominaisuuden myötä niin live- kuin etätapaamisistakin voi rakentaa matalalla kynnyksellä monikanavaisen. 

 Saavutettavuus täydentyy eri ohjelmien ja palvelujen yhteiskäytön tuloksena 

 Etätoiminnan myötä on ollut vaikea olla huomaamatta, että viimeisen vuoden aikana tehty digiloikka muuttaa arkeamme ehkä ennen näkemättömilläkin tavoilla; etätapaamisten myötä tekniikka, sen tarjoamat mahdollisuudet ja kehitysvauhti ovat tulleet uusilla tavoilla näkyviksi. Sen tarjoamat hyödyt tunnistetaan laajemmin – ja toisaalta myös sen aiheuttamat haitat puhuttavat. Saavutettavuuden ja käytettävyyden näkökulmasta onkin kiinnostavaa, hyödynnetäänkö etä– ja lähitapaamisissa jatkossa yhä enemmän erilaisia hybridiratkaisuja, joissa esimerkiksi automaattinen käännös- ja puheentunnistusteknologia tukevat palvelujen saavutettavuutta ja käytettävyyttä – ja näin erilaisten käyttäjien tarpeita. Ja viime kädessä: valuvatko nämä palvelut hiljalleen osaksi arkeamme? 

 ** Helsingin yliopisto, Valtion kehitysyhtiö Vake ja Yle ovat keränneet kesäkuusta 2020 lähtien Lahjoita puhetta –kampanjan kautta suomalaista puhetta. Tavoitteena on kerätä 10 0000 tuntia puhuttua suomea, jotta suomenkielisen automaattisen puheentunnistuksen luotettavuus lisääntyisi. Mitä enemmän erilaisia puheita, sitä virheettömämmäksi tekniikkakin kehittyy. Jos puheentunnistusteknologian mahdollisuudet kiinnostavat, käy lahjoittamassa puhettasi. 

 Teksti: 

Hanna Rantala ja Viivi Kilpeläinen