Recensie Voice - De spraakrevolutie: inzichten en kansen
Waarom swipen op een scherm als je ook kunt praten? Voice van Maarten Lens-Fitzgerald gaat over de ontwikkeling en inzet van spraakassistenten. Het boek leest als een trein en biedt veel nieuwe informatie en houvast, maar ziet ook enkele valkuilen over het hoofd.
Auteur Lens-Fitzgerald is gek op gadgets. Hij stuurde jaren geleden zijn verlichting al aan via een app. Maar waarom zou je, om een lamp aan te zetten, je smartphone pakken, een app openen en naar de juiste lamp navigeren? Begin 2015 kwam Alexa, de slimme speaker van Amazon, bij Lens-Fitsgerald in huis. Met Alexa en andere spraakassistenten bedient hij nu zijn licht, muziek, kookwekkers, de boodschappenlijstjes en de rolgordijnen. Een boek over de toepassing van spraakassistenten zoals Alexa, Siri, Google en Cortana kon niet uitblijven, want de auteur heeft een missie: ‘Voice' zo groot mogelijk maken.
Het boek is een handig standaardwerk voor iedereen die met spraakassistenten aan de slag wil. Lens-Fitzgerald behandelt in een logische volgorde de belangrijkste onderwerpen en begint dus bij het begin: spraakbesturing is een logische stap in de ontwikkeling van hoe wij apparaten bedienen. Ook het werkingsprincipe van spraakbesturing komt uitvoerig aan de orde. Dat loopt van het activeren van een spraakassistent tot het herkennen van spraak, het omzetten naar de intent (of bedoeling) van de spreker, tot aan het vinden van een antwoord in een tekstgebaseerde bron en het uitspreken van dit antwoord. Waardevol is ook dat Lens-Fitzgerald een goed beeld geeft van een nieuw niche-vakgebied: dat van conversational design. Hoe ontwerp en ontwikkel je succesvolle dialogen tussen mens en robot? Welke competenties heb je daarvoor nodig? En hoe zet je stemmen als onderdeel van je marketing (voice-branding)?
Spraakherkenningstechnologie is weliswaar zeer goed ontwikkeld, maar om de intent van een spreker echt goed te kunnen begrijpen is kunstmatige intelligentie enerzijds afhankelijk van relevante data (voor veel bedrijven een probleem wegens silovorming) en informatie over de context. Spraakassistenten zijn nog niet zo goed in het begrijpen van die intent en dat maakt hun inzet in bijvoorbeeld contact met klanten tot een riskant experiment met grote kans op teleurstelling. Het belang van toegang tot relevante data en de problemen rond begrip van de context blijven onderbelicht in het boek.
Lens-Fitzgerald is wel eerlijk als hij stelt dat de boot niet willen missen een goed argument kan zijn om toch te gaan experimenteren met spraakassistenten. Hij waarschuwt daarbij: ‘Wat je ook doet, vergeet marketing niet'. Ik zou daar de (eind)klant aan willen toevoegen. Ter illustratie wordt verderop in het boek in een case over Albert Heijn verzucht: ‘Gebruikers verwachten dat ze een normaal gesprek kunnen voeren met een voice-assistent'. Inderdaad, die verwachting dus... Ook in andere cases (Centraal Beheer, Rabobank, SVB, Auping en anderen) klinkt door dat er regelmatig van binnen naar buiten wordt gedacht bij de inzet van voice. De vraag of de klant er echt wat mee opschiet, krijgt te weinig aandacht.
De auteur geeft verder handige tips voor mogelijke aanvliegroutes om met voice te beginnen en een waardevol overzicht van de belangrijkste platformen (en dat zijn er meer dan alleen Google, Microsoft en Apple). En als spraak dan inderdaad echt de meest handige interface is om apparaten te bedienen, dan kan een paragraaf over voice search niet ontbreken. Wat komt er aan informatie bij je terug als je een spraakgestuurde zoekopdracht aan Google richt? En wat is de relatie met zoekmachineoptimalisatie?
Het boek laat ook zien dat het bij voice gaat om technologie én toepassingen daarvan die nog lang niet uitontwikkeld zijn. Terecht waarschuwt Lens-Fitzgerald aan het eind van zijn boek dat bij voice het (weer) de grote techbedrijven zijn die de dienst uitmaken. Wat kunnen zij doen met onze stem? En wat zijn de risico's als je stemmen van individuen gemakkelijk kunt namaken?
Erik Bouwer is journalist en hoofdredacteur Klantcontact.nl