Kategorier
Tendenser

Ny Amazon-stemme skal lyde som nyhedsoplæser

Ny Machine Learning-tilgang giver interessante muligheder med Amazons oplæsningsteknologi.

I de seneste år er lyd blevet udråbt til en af de store tendenser i mediebranchens fremtid, og et lidt længeresigtet perspektiv er syntetiske stemmer – altså robotstemmer, der læser artikler højt.

Som sådan er teknologien ikke ny, men den er endnu ikke hel moden til, at man kan holde ud at lytte til en hel longread-artikel på den måde — og slet ikke på dansk.

Men der sker hele tiden noget, og i øjeblikket er innovationen især drevet af udviklingen og væksten af smart speakers og digitale assistenter (såsom Apples Siri, Google Assistant og Amazons Alexa), der er de bankende hjerter i de smarte højttalere.

Herhjemme er Google #1 med deres Google Home-højttalere (som er den eneste smart speaker i handlen), men på verdensplan, er det Amazon, der fører – og det er dem, der har sendt seneste skud afsted i kampen om førstepladsen.

I et blogindlæg nævner de nogle af de seneste tiltag i Polly, der er deres syntetiske oplæser (Polly blev oprindelig lanceret i november 2016).

Blandt nyhederne fra Amazon er en ny stemme, der skal lyde som en nyhedsoplæser. Så hvis man som oplæser ikke allerede var klar over, at ens fremtidige jobsituation er truet, så er der ikke længere så meget at være i tvivl om.

“Speech quality is certainly important, but more can be done to make a synthetic voice sound even more realistic and engaging. What about style? For sure, human ears can tell the difference between a newscast, a sportscast, a university class and so on; indeed, most humans adopt the right style of speech for the right context, and this certainly helps in getting their message across.”

Her kan du høre et eksempel på, hvordan Amazon Pollys “newscaster” lyder:

Når man ved det, kan man godt høre, at det ikke er et menneske, der snakker. Men afspil lige lydfilen bare én gang til; det er vildt, hvor meget det lyder som et rigtigt menneske. Vi er meget tæt på noget, der kan erstatte de menneskelige oplæsere.

Amazon skriver, at der allerede er kunder i mediebranchen, der bruger teknologien – blandt andet canadiske The Globe And Mail. Pt. er nyhedsoplæseren kun tilgængelig på amerikansk og i to varianter, “Joanna” og “Matthew”.

I indlægget kan du også læse om andre nyheder til Polly, blandt andet “Neural Text-To-Speech”, der er en ny Machine Learning-tilgang, Amazon bruger. Og du kan høre flere eksempler på, hvad man kan med Amazons teknologi.

Læs indlægget hos Amazon Web Services

Jeg udgiver nyhedsbrevene Digital Ugerevy og Products in Publishing.


Lars K Jensen

Lars er journalist af baggrund og har arbejdet med digital udvikling i mediebranchen i mere end 10 år, bl.a. som leder af Ekstra Bladets redaktionelle udviklingsteam og chef for produktudvikling hos Infomedia.

Han hjælper medier og virksomheder med at forstå deres brugere og udvikle deres digitale produkter. Lars udgiver også Digital Ugerevy.

Kontakt Lars på lars@larskjensen.dk

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *