Gebruik jij al een voice assistent? Begin deze maand stond B. Amsterdam in het teken van Voice technology en deelden vele experts hun visie en verwachtingen over Voice. Onze Chief of Sound Gijs was met audio engineer Max van de partij om de Emerce podcasts te verzorgen. Tijd voor wat vragen over de toekomst van voice. En… ook lees je over de voice oplossing die wij ontwikkeld hebben.
Om gelijk met de deur in huis te vallen: heb jij een slimme speaker thuis?
Gijs: “Jazeker, ik heb ‘m thuis ook. Een Google Home om precies te zijn. Ik gebruik ‘m bijvoorbeeld om even te checken hoeveel file er staat, of om mijn agenda voor de komende uren te checken. Handig hoor, dat je dat gewoon kunt roepen terwijl je nog even je laatste spullen bij elkaar zoekt. Mijn kinderen gebruiken dat ding vooral als moppentrommel. Maar na een mop of 4 zijn ze er vaak toch wel klaar mee.”
Is zo’n smartspeaker gewoon een leuke gadget of heeft het een serieuze toekomst?
“De ontwikkelingen gaan snel. Je vraagt in de toekomst gewoon aan je telefoon of speaker: wil je een afspraak met de kapper maken op zaterdag om 9 uur? Die virtuele assistent belt dan op de achtergrond zelf met de kapper. Google gaf hier een demo over. Daar moet wel bij gezegd worden dat dit een best case scenario is. Er zijn natuurlijk ook veel momenten te bedenken waarop de assistent de ander niet verstaat en het hele gesprek in de soep loopt. Ik vraag me weleens af hoe lang het eigenlijk nog duurt voordat er aan de andere kant van de telefoon óók een assistent zit. Dan zijn er dus twee Google Assistenten met elkaar aan het praten. Hoe goed gaat dat dan? Ik denk dat het nog wel even kan duren voordat het maken van kappersafspraken, zoals je in de video ziet, echt gebeurt. Maar het komt er zeker aan.”
Google Duplex: A.I. assistent belt lokale bedrijven om een afspraak te maken (2018)
Wat voor kansen zie je verder voor bedrijven?
Sowieso denk ik dat er heel veel oplossingen te bedenken zijn. Ik weet alleen niet hoe snel de realiteit mijn antwoord al heeft verwezenlijkt. Morgen kunnen er ineens baanbrekende voice toepassingen zijn bijgekomen. Vooral het koppelen met andere slimme apparaten zie ik als een mooie stap. Dat Google in je voorraadkast kijkt en zegt: ik zie dat de chocola bijna op is. Zal ik nieuwe voor je bestellen? Ik laat je de bestelling nog even zien. Is dit OK zo? Je ziet je boodschappen verschijnen op je telefoon. Je hoeft alleen nog maar ‘ja’ te zeggen en de volgende dag heb je alles in huis.
Ook de gewone teksten op je websites moeten natuurlijk goed leesbaar zijn. Je hebt het bij ons al vaker gelezen, maar daar komen we weer: schrijf in spreektaal. Dus ik verwacht dat je naast SEO -de search engine optimalisation- straks ook op de AO moet letten, de Assistant Optimalisation. Hoe zorg je ervoor dat de teksten op je website ook goed te begrijpen zijn als een assistent het voorleest?
De podcasts die we opnamen bij Emerce Voice, kun je hier terugluisteren:
Wat betekent de ontwikkeling van voice voor text-to-speech?
“De meeste text-to-speech services klinken nog heel synthetisch. De klemtónen zijn verkeerd gelegd en de snel-heid laat soms te wen-sen o-ver. Google werkt op dit moment aan een API die echt veel beter moet zijn dan bestaande text-to-speech tools. De verwachting is dat het dit jaar op de markt komt en dan open source beschikbaar is. We zijn er nog niet, maar de ontwikkelingen gaan wel exponentieel hard. Daar ben ik heel benieuwd naar.”
Wanneer denk je dat computerstemmen niet meer van echte te onderscheiden zijn?
“Dat is koffiedik kijken. Een aantal sprekers van Google vergeleek het moment waar we nu zijn qua voice met het moment waarop de iPhone uitkwam in 2007. Waarom? De iPhone heeft natuurlijk heel veel veranderd in ons leven. Veel mensen bij de Emerce Update verwachten dat voice ook zo’n grote impact als de iPhone gaat hebben. We staan wel echt nog aan het begin. Wel kunnen we al zeggen dat voice dé manier wordt om interactie met je computer te hebben. Dus je hoeft niet meer alles te typen, want dat is van vroeger. En je hoeft ook niet meer te klikken, je kunt gewoon praten. Dat is natuurlijk een veel natuurlijkere manier van communiceren. Je haalt een barrière weg. Adobe laat in een demo zien dat ze maar een paar woorden nodig hadden om iemands stem na te bootsen. Dat werkte misschien in dat specifieke voorbeeld. Maar het komt er nu nog op neer dat je iemand tienduizenden rare zinnen moet laten inspreken, om alle klanken en ingrediënten voor de ‘stemgenerator’ te verzamelen. Laten we over een half jaar nog eens kijken, dan zijn we vast weer een heel stuk verder.”
Preview van een nieuwe tool van Adobe, die gesproken woorden in een voice-over kan aanpassen (2016)
En nu hebben jullie je eigen voice oplossing?
“Ja! We zijn al een tijdje met voice bezig en hebben gekeken naar de mogelijkheden voor de communicatie en content industrie. Voor het testen van voice-over scripts en het maken van guide tracks zagen we mogelijkheden. Hiervoor hebben we een voice-over generator ontwikkeld. Je typt als videomaker het script in, kiest de stem in de juiste taal en vervolgens kun je de toonhoogte en de snelheid nog aanpassen. Dat is natuurlijk geen stem die uitzendklaar is. Wel is het een heel handig hulpmiddel om de video qua timing te kunnen editen. Je kan dan, voordat de voice-over is ingesproken, alvast de stem onder de video leggen en bekijken en luisteren hoe de boodschap overkomt. Desnoods kun je nog een aantal woorden veranderen of omdraaien en pas als je tevreden bent en de video klaar is, laat je pas de echte voice-over de tekst inspreken. Dat scheelt tijd en retakes. Ik denk dat iedereen daar blij van wordt.”
Wil je als eerste onze gratis voice-over generator proberen? Er is geen snellere manier om een voice-over tekst te testen op timing en impact. We zijn benieuwd naar wat je er van vindt.