Tale-til-tekst kan være et nyttig hjelpemiddel i hverdagen

Collage med fargerike bilder av personer som holder en telefon opp til ansiktet og snakker

    1. Hva er tale-til-tekst-teknologi?

    Tale-til-tekst er en teknologi basert på kunstig intelligens. Kunstig intelligens er en type teknologi hvor systemet lærer å bli bedre til en oppgave dess mer den blir brukt. Vi kan snakke om to typer kunstig intelligens. Det som mange tenker med kunstig intelligens, er systemer som kan «tenke» og «ta over». Denne type kunstig intelligens hvor en maskin/system kan kombinere en rekke sanseinntrykk, erfaring og ny informasjon, og så utføre komplekse handlinger på bakgrunn av dette i nye og ukjente situasjoner slik som mennesker kan, kalles gjerne kompleks eller generell kunstig intelligens. Denne type kunstig intelligens er ikke utviklet i dag og det er usikkert om det noensinne vil bli mulig.

    Det vi snakker om når det gjelder kunstig intelligens i bruk i dag, er såkalt spesifikk kunstig intelligens. Dette er systemer som skal løse konkrete oppgaver som for eksempel gjenkjenne ord som blir sagt og transkribere dem til tekst eller å gjenkjenne at det er en person i søkeren når du tar et bilde med kameraet ditt, og automatisk fokusere på ansiktet slik at ansiktet blir klart på bildet. Systemet skal løse spesifikke oppgaver som det blir bedre på dess mer systemet brukes.

    For at et system skal lære noe, må det mates med informasjon; det vil si ha en slags grunninformasjon. Innen talegjenkjenningsteknologi må systemet mates både med hvordan ord skrives og hvordan, og på hvilke ulike måter det konkrete ordet uttales. I tillegg må systemet erfare hva som er sannsynlige ord i en setning. Et lærende system vil over tid lære at i setningen «Kjære, alle sammen», er det ordet «kjære» som skal brukes, ikke «tjære», selv om det uttales likt. «Tjære alle sammen» ikke er så vanlig å si, men fullt mulig å bruke for eksempel hvis konteksten er tjærebreing.

    Hvor intelligent et slikt talegjenkjenningssystem blir, avhenger derfor også av hvor mye av sammenhengen systemet klarer å lage en ordsammenheng av. Det vil si hvor mange ord systemet gjetter på om gangen for å lage den setningen systemet antar at blir sagt.

    For at systemet skal gjenkjenne hvordan ord blir uttalt, må det læres hvordan ordet uttales av menneskene som snakker språket. Dette kan for eksempel skje ved at samme tekst bli sagt av svært mange mennesker med ulik dialekt, aksent, kjønn og alder.

    Lenge var mangel på data å mate systemet på en utfordring på norsk, hvor vi har mange ulike dialekter. Dialektene kan også ligge mer eller mindre tett opptil en av de to målformene nynorsk og bokmål. Mange bruker også ord fra den andre målformen selv om de hovedsakelig snakker tettere opp mot den ene målformen. For eksempel en person som sier «eg» og «ikkje» i dialekten, kan likevel bruke mange bokmålsord som «adgang» og «egenerklæring» som ikke er korrekt nynorsk. Dette er en utfordring når man skal lage god taleteknologi på norsk. Hvordan skal dette da transkriberes? I tillegg har både nynorsk og bokmål mulighet til å skrive mer eller mindre konservativt, slik at skriftspråket også kan være veldig variert. Dette er annerledes på norsk enn i en del andre språk som i større grad har kun én måte å skrive noe på.

    Nå har det kommet flere løsninger for tale-til-tekst-teknologi på norsk, og noen kan transkribere både til nynorsk og bokmål, selv om de fleste løsningene kun er tilgjengelig for transkribering til bokmål. Transkribering av samisk eller tegnspråk er ennå ikke utviklet.

    2. Hva kan tale-til-tekst løse for hørselshemmede?

    Det er mange situasjoner hvor hørselshemmede og andre med eller uten en funksjonsnedsettelse kan ha nytte av tale-til-tekst-teknologi. Der det er dårlig lydmiljø, som for eksempel på en overfylt restaurant eller ved en trafikkert gate, vil flere ha problemer med å oppfatte det som blir sagt. Særlig hvis mange snakker samtidig. Dette er et problem som er særlig merkbart hvis man har redusert hørsel. Tale til tekst er også svært nyttig for blinde som kan diktere tekstmeldinger og dokumenter, og starte smarte høyttalere ved hjelp av stemmen.

    Direkte-teksting av digitale møter er et område hvor talegjenkjenningsteknologi kan hjelpe på forståelsen. Her er det også mulig å se hvem som sier hva. Automatisk teksting av videoer du ser på PC-en som ikke er tekstet fra før, er også en mulighet som nå finnes på norsk.

    Oversettelse til fremmedspråk er et annet område hvor alle kan ha nytte av talegjenkjenningsteknologi. Noen apper, som for eksempel Google Oversetter, lar deg lese eller skrive inn teksten på norsk og få den oversatt til svært mange ulike språk, enten som syntetisk tale eller tekst. På samme måte kan vedkommende som ikke snakker norsk svare, og du kan få svaret oversatt til tale eller tekst.

    Personer med skader eller redusert førlighet i fingre eller armer, kan også ha god nytte av verktøy for diktering av dokumenter og styring av PC-en.

    Selv om tale-til-tekst kan være en nyttig funksjon for mange, er det også mye tale-til-tekst ennå ikke kan løse for hørselshemmede eller døve, da teknologien ikke er god nok. Det er viktig å merke seg at det er stor forskjell på det som er naturlig tale og diktering. Naturlig tale er hvordan vi snakker sammen en eller flere, tenker høyt med andre, avbryter hverandre, tankesprang, stemmens utrykk og styrke, lyder og gester som til sammen utgjør hvordan vi kommuniserer med hverandre via stemmen. Å få dette ned til fornuftige og sammenhengene setninger og oppfatninger, er det foreløpig kun den menneskelige hjerne som greier.

    Tale-til-tekst fungerer best når det brukes som diktering eller for å gi talekommandoer til smartløsninger som smarte høyttalere eller smarttelefoner. Ved diktering formulerer man først setningen i hodet sier den deretter tydelig, gjerne på en normert målform, og avslutter gjerne med å si «punktum». Tale-til-tekst-løsninger fungerer ikke så godt i miljø med dårlig akustikk, dårlig mikrofon og bakgrunnsstøy og mange som snakker samtidig.

    3. Hva sier loven om tale-til-tekst?

    Alt rettet mot allmennheten skal etter norsk lov være universelt utformet. Dette er lovfestet i lov om likestilling og diskriminering. I § 17 står det:

    «Offentlige og private virksomheter rettet mot allmennheten har plikt til universell utforming av virksomhetens alminnelige funksjoner. Med universell utforming menes utforming eller tilrettelegging av hovedløsningen i de fysiske forholdene, slik at virksomhetens alminnelige funksjoner kan benyttes av flest mulig, uavhengig av funksjonsnedsettelse.»

    Når det gjelder digitale løsninger rettet mot allmennheten, er dette regulert av forskrift om universell utforming av IKT-løsninger. Mens teksting av video/filmer som er forhåndsinnspilt er lovpålagt, er det ikke pålagt å tekste direktesendinger enten det er gjort av offentlige eller private foretak. Det er spesielt her automatiske tale-til-tekst-løsninger vil være nyttige for hørselshemmede. Det er altså ikke noe krav om automatisk transkribering av direktesendinger, inntil videre.

    Forskrift om universell utforming av IKT gjelder ikke hvis det er en annen lov som går foran. På arbeidsplassen er det arbeidsmiljøloven som har forrang. I § 4-2 om krav til tilrettelegging, medvirkning og utvikling, bokstav b, heter det at «arbeidet organiseres og tilrettelegges under hensyn til den enkelte arbeidstakers arbeidsevne, kyndighet, alder og øvrige forutsetninger». Det står heller ikke noe her som direkte tilsier at direkteteksting, for eksempel av allmøter, er pålagt. Likevel er det ikke noe i veien for at dette gjøres. Når direkteteksting ikke er i mer ustrakt bruk ved direktestrømming, er det fordi feilprosenten er stor og fare for rare setninger, svært feilaktige eller uheldige ord og setninger.

    4. Finne og bruke


    4. 1. Søke etter programmer og apper for tale-til-tekst-funksjonalitet på norsk

    Bruk søkeord som tale-til-tekst, taletranskribering, transkribering, diktat, caption, closed caption Norwegian text, translate, oversetter og lignende enten på nett, Google Play eller App Store.

    Det er ofte vanskelig å vite om appene har norsk språk, da dette ikke alltid oppgis i informasjonen om appen for eksempel i App Store. De store teknologifirmaene Google og Microsoft har begge norsk bokmål som tale til- tekst-teknologi, men ikke alle produkter de leverer har dette implementert. Likevel kan det godt tenkes at norsk tekst-til-tale finnes i produkter fra et av disse selskapene. I neste kapittel går vi gjennom noen programmer fra disse selskapene i tillegg til noen andre. Mange apper som har norsk tale-til-tekst-funksjonalitet bruker enten Googles eller Microsofts språkmotor inne i sin egen løsning. Det er bare å prøve seg fram for å finne ut hva som fungerer best.

    4.2. Finne tale-til-tekst-funksjonen i programmer

    Selv om dagens tale-til-tekst-løsninger har sine begrensinger, kan det likevel være et nyttig hjelpemiddel i noen sitasjoner. Her kommer noen praktiske og generelle råd til hvordan du kan finne fram til taletil-tekst-funksjoner.

    Inne i programmer eller apper som du bruker, kan du se etter teksting ved å kikke etter noen av disse ikonene.

    Illustrasjon av de forskjellige tegnene og ikonene de forskjellige programvareleverandørene bruker for å indikere hvor man slår av eller på teksting

    Tre prikker er en markering i programmer som indikerer at her ligger det ytterligere verktøy, som for eksempel teksting eller andre innstillinger.

    Både Google og Microsoft har implementert norsk språk i en del av sine produkter slik at tale-til-tekst er tilgjengelig i en del av det de leverer, men ikke i alt.

    Mange apper og programmer har teksting på engelsk:

    Teksting kan enten hete «Caption» eller «closed caption». «Subtitles» brukes oftere om teksting av oversatte språk. I noen norskspråklige produkter kan for eksempel «cc» likevel indikere at her kan du sette på tekstingen.

    Illustrasjon av tilgjengelighetsfunksjoner. En sirkel med en person som strekker ut armene.

    Ellers indikerer ofte dette symbolet tilgjengelighetsfunksjoner. Så hvis du leter etter innstillinger som kan gjøre sytemet mer tilpasset ditt behov, er det lurt å undersøke hva som følger med av tilgjengelighetsfunksjoner ved å velge denne knappen.

    Ellers så vil som regel alle mikrofonikoner lede til tale-til-tekst:

    Illustrasjon av de forskjellige tegnene og ikonene de forskjellige programvareleverandørene bruker for å indikere hvor man slår av eller på mikrofonen

    4.3. Bruke tale-til-tekst-funksjonalitet

    Dessverre er det slik at i situasjoner hvor det som hørselshemmet er vanskelig å oppfatte det som blir sagt, også gjelder for tale-til-tekst-teknologien. Det beste er å bruke taletranskribering i rolige omgivelser med en god mikrofon, og legge vekt på å snakke tydelig. Hastighet er derimot ikke et problem for talegjenkjenning så lenge de andre forutsetningene er til stede. Ikke alle programmer har automatisk tegnsetting. De programmene som er ment for i farten, har det ofte ikke. Noen programmer har både automatisk og manuell tegnsetting ved redigeringsfunksjon.

    Det kan virke forvirrende at setningen forandrer seg underveis. Dette skjer fordi systemet prøver å gjette hva som blir sagt, og forslår det som systemet antar blir sagt, men endrer undervis da det kommer ny muntlig input og forandrer derfor teksten.

    5. Hvordan sette opp ulike programmer med tale-til-tekst

    Her har vi funnet fram til et lite utvalg av skrivebordsprogram og apper som har tale-til-tekst-funksjonalitet. Det finnes mange flere enn dette. Slike programmer oppdateres ofte og forandrer utseende. Ikke alle versjoner av et program har heller tale-til-tekst-funksjonalitet.

    Hvis det ser annerledes ut i ditt oppsett enn det det gjør i denne guiden, kan det være et du har et annet oppsett eller en annen versjon. Kikk litt rundt etter dette generelle vi har skrevet innledningsvis, snakk med IT-avdelingen på arbeidsplassen din om du har mulighet til det, eller forsøk å laste ned en nyere versjon. Nye løsninger og forbedringer kommer stadig. Søk litt rundt.

    5.1. Skrivebordsprogrammer brukt på PC

    Microsoft Teams

    Testing på norsk er tilgjengelig i skrivebords-appen. Hvis du ikke allerede har lastet den ned, må dette gjøres først. Det er også mulig å få opp teksting på mobilen, men der kan man ikke velge norsk som språk. Teksting er ikke tilgengelig i web-versjonen eller i eldre versjoner av Teams/Microsoft 365.

    1. Når møtet starter logger du deg på via PC/Mac.

    2. Klikk på de tre prikkene øverst for å få opp ulike valg for møtet.

    Skjermbilde av Teams med piler som forklarer hvor man slår på direktetekstingen

    Bilde1

    3. Klikk på Slå på direkteteksting. Da vil du få opp teksting av det som blir sagt. (bilde 1)

    Hvis tekstingen ikke automatisk kommer på norsk, klikk da på de tre prikkene helt til høyre for tekstingen og velg norsk (se bilde 2). Klikk bekreft.

    Skjermbilde fra Teams som viser effekten av å slå på direkteteksting

    Bilde 2

    Fordelen med tekstingen i Teams er at den viser hvem som snakker (den påloggede kontoen til møtet)

    Skjermdump fra Teams som spør om hvilket talespråk som benyttes i møtet

    Bilde 3

    Merk! Taletranskribering finnes bare tilgjengelig i de siste versjonene av Microsoft-pakken. Hvis du har en gammel versjon, er det ikke sikkert du finner denne funksjonen. Hvis du ikke finner denne funksjonen på din jobb, og dere bruker Teams der, kan det hende at de som drifter Microsoft-løsningen for dere ikke har aktivert denne muligheten. Ta i så fall kontakt med IT-avdeling og spør. Hvis du bruker Teams privat, må du laste ned appen til PC-en og ikke bruke web-versjonen. Automatisk transkribering er tilgjengelig i Teams mobilapp, men kun engelsk språk.

    Microsoft PowerPoint

    I PowerPoint kan du både diktere inn det du vil skal stå i presentasjonen og tekste det du sier mens du holder presentasjonen.

    Skjermdump fra PowerPoint som viser hvor man skal plassere fokus for diktat

    Bilde 1

    Sett markøren i feltet du vil diktere, trykk på den blå mikrofonen til høyre og les inn.

    Skjermdump fra PowerPoint som viser at man kan diktere i notatvisning

    Bilde 2

    Du kan lese inn alle visninger av presentasjonen, som for eksempel her i notatvisning. Sett markøren inn i feltet og klikk på mikrofonikonet på verktøylinjen.

    Hvis du vil at foredraget ditt skal transkriberes automatisk mens du snakker, gå til arkfanen «Lysbildefremvisning» i PowerPoint. Hvis du har en nyere versjon av programmet, vil du finne alternativer for undertekster. Velg riktig talespråk og velg mikrofon.

    Skjermdump fra PowerPoint som viser hvor man velger mikrofonen som skal brukes til diktat-funksjonen

    Bilde 3

    Hvis du er usikker på om det fungerer med den mikrofonen du har valgt, velg «lysbildeframvisning» «fra begynnelsen» og snakk i vei. Hvis det ikke kommer opp tekst, kan det hende du har valgt feil mikrofon.

    I skjermbildet under er det valgt at teksten skal komme nederst, overlagt:

    Skjermdump fra PowerPoint som viser hvordan direktetekstingen vil se ut for tilhører når presentasjonen blir holdt.

    Bilde 4

    Slik vi det se ut på skjermen eller lerretet for tilhørerne når presentasjonen blir holdt.

    Webcaptioner

    Dette er en løsning som kan direktetekste det som sies via mikrofonen på PC.

    Merk! Webkaptioner virjer bare i nettleseren Chrome levert av Google. Hvis du ikke vet hvilken nettleser du har, ser ikonet til Chrome slik ut:

    Bildet viser logoen til nettleseren Chrome

    Transkriberingen kan da brukes for eksempel i analoge møter, og for å vise tekstingen på en stor skjerm.

    Skriv inn https://webcaptioner.com/captioner i nettleseren.

    Klikk på den gule firkanten med teksten "Start captioning".

    Skjermdump av Web Captioner som viser hvor start-knappen er

    Det er også mulig å bygge inn tekstingen fra Webcaptioner i andre programmer som Zoom som brukes til nettmøter.

    Hvordan du setter opp dette, finner du på denne siden: https://webcaptioner.com/help/integrations/zoom

    Du kan også bruke Webcaptioner til å få transkribert lyd fra PC-en. Dette er en litt innviklet prosess. Hvordan du gjør det, finner du på denne siden: https://webcaptioner.com/help/integrations/captioning-audio-from-another-program-microphone

    Slik ser det ut i en test:

    Skjermdump fra Web Captioner som viser hvordan direktetekstingen kan se ut

    Bilde 6 Transkriberingen av naturlig tale ble litt så som så

    Det finnes en rekke muligheter for å stille inn Webcaptioner i "Settings":

    Skjermdump som viser innstillings-menyen i Web Captioner

    Bilde 7 For å gjøre det enklere å lese kan man endre tiden for linjeskift slik at det ikke blir en sammenhengende tekststrøm. Ved å sette ned til 1 sekund, vil det komme linjeskift ved kortere pauser.

    Microsoft Word

    • åpne Word og et nytt dokument
    • diktering er en knapp på høyre side formet som en blå mikrofon
    • trykk på mikrofonen for å starte diktering
    • dikteringer er startet når det er en rød prikk ved mikrofonen
    • velg riktig språk ved å trykke på tannhjulet

    Hvis det ikke kommer utslag på talelyden eller tekst når du snakker, sjekk om du må velge en annen mikrofon i listen:

    Skjermdump fra Word som viser innstillinger og valg for diktering

    Hvis du ikke ser det blå mikrofonikonet på verktøylinjen i Word, klikk på den lille nedoverhaken helt til høyre på verktøylinjen (på bildet over under den blå knappen hvor det står Del) Mest sannsynlig er ikonet skjult på grunn av plassmangel og du finner det ved å klikke på haken.

    Dragon Professionally Speaking Anywhere

    Program for diktering på norsk – bokmål og nynordk på Windows PC og mobile enheter. Årlig lisensavgift.

    Dragon kan brukes til å skrive e-post, dokumenter og tekster, i programmene man bruker. Programmet tilpasses den enkelte bruker ved å inkludere og trene spesifikke ord og uttrykk.

    Andre funksjoner inkluderer autotekster som man har lagt til selv for eksempel ved å si «mvh» skrives «Med vennlig hilsen, Mitt Navn» og stemmestyrte talekommandoer som lar brukeren utføre stegvise kommando-makroer for styring av PC-en slik som å åpne programmer og utføre handlinger på PC-en uten å bruke verken mus eller tastatur.

    Det er mulig å formattere og redigere teksten med stemmen både underveis, og etter, ferdig notat. Formattering i form av tegnsetting må sies og kommer ikke automatisk. Mer informasjon om hvordan du bruker Dragon PSA finner du på den norske leverandørens nettsider.

    Det er mulig å laste ned Dragon for en gratis 30-dagers prøveperiode. Finnes også for bruk på mobil.

    Diktering i Outlook

    Outlook leveres av Microsoft, og den blå mikrofonen går igjen i programmene som indikator for å aktivere taletranskribering. Slik gjør du: Start en ny melding. Klikk på den blå mikrofonen og les inn. Når transkribering er aktivert, blir det en rød prikk ved mikrofonen som indikerer opptak. Mikrofonen nede til høyre vil også blinke når du leser inn.

    Skjermdump fra Microsoft Outlook som viser hvor man finner dikter-funksjonen samt et eksempel på bruk

    Teksten i meldingen er:

    «Hei! Hvordan går det med leveransen?»

    Dette ble lest inn slik:

    "Hei utropstegn nytt avsnitt hvordan går det med leveransen spørsmålstegn"

    Speechtexter

    Dette er et gratisprogram hvor du kan diktere rett inn via nettsiden https://www.speechtexter.com/ og etterpå enten skrive det ut eller laste det ned som et Word-dokument.

    Merk! Speechtexter virker bare i den siste versjonen av nettleser Chrome.

    Åpne nettsiden i Chrome, velg norsk ved å trykke på flagget i det øverste blå banneret og finn norsk i listen. Til høyre i det grønne feltet står det hvordan du skal lese inn tegnsetting.

    Skjermdump fra Speechtexter som viser hvordan programmet ser ut og hvor man finner ulike funksjoner

    Ved å klikke på tannhjulet i det blågrønne feltet nest øverst, får du opp flere valg for innstillinger som for eksempel at alle setninger skal starte med stor bokstav. Av skjermdumpen over, ser man at både tegnsetting og stor bokstav ikke fungerer helt.

    Skjermdump fra Speechtexters innstillinger-meny og valgene som finnes der.

    5.2. Tale-til-tekst på mobiltelefonen

    Det er også mulig å bruke tale-til-tekst-funksjonen på mobilen, enten som talekommadoer til Siri på Iphone eller Google Assistent på Android-telefoner. Har kan tale-til-tekst-funksjonalitet brukes til for eksempel å diktere og få lest opp tekstmeldinger. I apper og funksjoner hvor det vises en mikrofon, er det som regel snakk om en tale-til-tekst-funksjon. Prøv deg fram. Nedenfor kommer et lite utvalg av apper som kan utforskes. Noen er tilgjengelig kun for noen typer mobiltelefon, og flere er gratis.

    Google Docs

    Google Docs er tilgjengelig både som mobilapp og for PC. Det finnes talegjenkjenning på norsk begge steder. Nedenfor viser vi hvordan du går fram for å bruke denne funksjonen på mobilappen.

    Logoen og programikonet til Google Docs

    Slik gjør du det:

    1. Last ned appen fra Google Play eller App Store
    2. Klikk på plussmerket nede til høyre for å lage et nytt dokument
    3. Gi dokumentet et navn
    4. Trykk på mikrofonen nede i skjermbildet (under tastaturet) og begynn å snakke.
    Skjermdump fra Google Docs og hvordan man gir dokumentet et navn

    Bilde 8 åpne et nytt dokument og gi det navn

    Skjermdump fra Google Docs som viser hvor man finner diktat-funksjonen

    Bilde 9 Trykk på mikrofonen for å starte innlesningen

    Skjermbilde av Google Docs som viser at diktat-funksjonen virker

    Bilde 10 Når du snakker, vises det i utslag på bølgene nederst og tekst kommer, HVis du vil rette i teksten, trykk på det lille tastaturikonet helt nederst.

    Google Oversetter

    Google Oversetter kan oversett mellom over 100 språk ved å skrive eller å snakke inn i appen. Du kan også holde kameraet over tekst på få den oversatt direkte, som tekst eller opplest. Den kan også brukes uten nettilgang, men da må du laste ned de aktuelle språkpakkene til telefonen. Du kan også snakke inn ditt eget språk få det ut som tekst eller syntetisk tale på et annet språk. Det vil si at to som snakker ulike språk kan snakke sammen på hvert sitt språk enten via syntetisk tale eller tekst (70 ulike språk).

    Slik gjør du det:

    1. Last ned appen
    2. Velg samtale
    Skjermdump fra Google Oversetter som viser en tekstet samtale på norsk oversatt til engelsk

    Bilde 11 Her er språkene norsk og engelsk valgt. Ved å trykke på mikrofonen i midten, nederstm kan både den engelsktalende og norsktalende snakke.

    Skjermdump fra Google Oversetter som viser muligheten til å laste ned norsk oversettelsesfil

    Bilde 12 Hvis du vil bruke appen uten at du har nettilgang, last ned språkene du vil trenge i situasjonen på forhånd

    Bilde av en plakat skrevet på engelsk. Det står \"Mark Rowlands everything I know I learned from TV. Philosopht for the unrepentant couch potato\". I tillegg er det en illustrasjon av et TV.

    Bilde 13 Appen kan også oversette tekst i sanntid ved at du holder den over teksten du vil oversette (her vist en engelskspråklig bok) og appen viser den norske teksten når du holder mobilen over, appen åpen og kamerafunksjonen valgt i menyen.

    Bilde av en plakat opprinnelig skrevet på engelsk,men er maskinoversatt til norsk. Det står \"Mark Rowlands Alt jeg vet, lærte jeg av TV. Filosofi for den uangvendende sofapotet\". I tillegg er det en illustrasjon av et TV.

    Bilde 14 Slik ser boken ut gjennom appen med kamerafunksjonen

    Deaf-Mute-Communication

    En gratis app levert av Apple. Transkriberer direkte norsk tale. det er veldig liten skrift i appen når du skal stille inn, men du kan øke størrelsen på teksten som blir transkribert til stor og lesbar skrift.

    Merk! Kun tilgjengelig på iPhone.

    App-ikonet til Deaf-Mute-Communication påiPhone. Det illustrerer et øre og en boks med tekst.

    Bilde 15 Slik ser ikonet til appen ut

    Skjermdump fra appen Deaf-Mute-Communication hvor man kan velge hvilket språk man vil benytte

    Bilde 16 I menyen nede som har svært liten skrift på mobilen, finner du norsk bokmål

    Skjermdump fra appen Deaf-Mute-Communication med et eksempel på hvordan appen fungerer. I appen står den dikterte teksten \"Hei dette er en test hvordan fungerer denne appen\

    Bilde 17 Størrelsen på skriften ved innlesning lar seg enkelt endre ved å dra i glidebryteren under tekstfeltet. Trykk på mikrofonen og snakk.

    Microsoft Word

    Denne fungerer på samme måte som på PC-en, men man trenger et abonnement på Microsoft 365 for å bruke den. Fordelen med denne appen er at den i tillegg til tale-til-tekst-funksjonalitet, har stavekontroll og to ulike måter for tegnsetting, enten med stemmen eller ved å trykke på ikoner på skjermen.

    Skjermdump fra Microsoft Word som et eksempel på transkribering i Word. Det legges vekt på at den først kommer når man har sagt hele setningen.

    Bilde 18 Det kan virke litt forvirrende at appen venter til den har en hel setning før det kommer tekst. I mange andre løsninger kommer ordene fortløpende mens du snakker.

    Kuriosa: Ved aktivering av «Filtrering av sensitive uttrykk» vil kraftsalver bli transkribert med *** i stedet for ord.

    Skjermdump fra Microsoft Word som viser innstillingsmuligheten for diktering

    Bilde 19 Filtrering av sensitive uttrykk aktivert

    Skjermdump fra Microsoft Word som viser et transkriberingseksempel hvor et sensitivt uttrykk har blitt maskert.

    Bilde 20 Sensitivt uttrykk maskert

    6. Erfaring fra brukertest av to ulike programmer

    Våren 2022 annonserte vi etter personer med nedsatt hørsel på Facebook for deltakelse i en test av ulike tale-til-tekst-løsninger. Vi ønsket å undersøke hvor godt slike løsninger fungerte for denne målgruppen. Vi laget tre ulike tenkte situasjoner hvor vi så for oss at tale-til-tekst ville være en nyttig funksjon for hørselshemmede. Det første vi undersøkte var digitale møter. Vi valgte møteplattformen Teams levert av Microsoft. Deretter ønsket vi å teste en løsning som kunne brukes ved én-til-én-samtaler. Vi ønsket også å teste en løsning for én-til-mange-transkribering.

    6.1. Webinar med spørsmålsrunde arrangert på Microsoft Teams

    Testen ble gjennomført som et ordinært Teamsmøte med tre innledere som snakket om ulike temaer i 5-10 minutter hver. De tre innlederne hadde norsk som morsmål, men snakket ulike dialekter. I forkant av møtet hadde alle deltakerne fått tilsendt informasjon om pålogging og hvordan de skulle aktivere tekstingen i Teams.

    Etter innleggene var det en spørsmålsrunde rundt temaene, som fort gikk over til å bli en diskusjon om selve tekstingen.

    Etter at møtet var ferdig, svarte møtedeltakerne på et digitalt spørreskjema som var sendt ut.

    Alle møtedeltakere hadde nedsatt hørsel, men ingen var helt døve.

    Erfaring og tilbakemelding fra deltakerne:

    • Alle greide å finne fram til funksjonen for å sette opp tekstingen av møtet.
    • Måten taleren snakker på er viktig. Hvis man snakker i ferdige setninger, uten mye fram og tilbake og ulike tankesprang, var det enklere å få tekstingen god. For innlederne gjaldt gjerne temaer som man hadde snakket om mange ganger og hvor man hadde de ferdige formuleringene klart i hodet som følge av erfaring. Innleder som snakket om et helt nytt tema, var vanskeligere å forstå kun ut fra tekstingen. Dess tettere man ligger opp mot diktering, dess bedre fungerte tekstingen.
    • Teksting av ulike dialekter fungerte bra. Alle ble transkribert til bokmål uansett.
    • Forkortelser og tall fungerte dårlig.
    • For mye tekst om gangen. Tekstingen kommer slik som det blir sagt og i det tempoet. Det er ikke noen menneskelig redigering av innhold.
    • Avhengig av resthørsel for å få med seg alt.
    • Skrivetolk fungerer bedre.
    • 4 av 5 ville bruke funksjonen i fremtiden.
    • Ved en samlet vurdering på en skala fra 1-5 hvor 5 var best, ga deltakerne løsningen 3 i denne testen.

    6.2. Bruk av Google Docs i én-til-én-samtale

    I valget av apper for dette formålet, valgte vi ut Google Docs. I brukerundersøkelsen skulle deltakerne på egenhånd laste ned appen og bruke den i samtale med en person for å spørre om veien eller en vare i en butikk eller lignende. Etterpå skulle de svare på noen spørsmål via et digitalt skjema.

    Tilbakemeldingene fra testerne var:

    • 3 av 5 syntes den var brukervennlig, godt lesbar tekst i appen og appen hadde god transkribering
    • 2 greide ikke bruke den
    • 3 ville kanskje bruke den (som nødløsning)
    • det fungerte kun i veldig rolige omgivelser
    • de syntes andre løsninger som allerede var tilgjengelig i telefonen for transkribering, var vel så gode

    7. Om denne guiden

    Denne guiden er laget av Universell Utforming AS i samarbeid med Hørselshemmedes Landsforbund i et prosjekt finansiert av Barne-, ungdoms- og familiedirektorater gjennom tilskuddsordningen Tilskudd til kunnskapsutvikling, kompetanseheving og informasjon innen universell utforming.

    Arbeidet med guiden ble avsluttet i oktober 2022.

    Oppdatert: 24. oktober, 2022.