Deze Case-study neemt u mee op een boeiende reis door de ontwikkeling van een synthetische stem, bedoelt om niet alleen het internetlandschap zal verrijken, maar ook het leven van degenen die vertrouwen op tekst-naar-spraaktechnologie zal gaan verbeteren.
We zullen u meenemen door de belangrijkste stadia van ons project, waarbij we de technologische aspecten, ontwerpprocessen en de beslissingen belichten die hebben geleid tot succes van het initiatief. We willen graag onze ervaringen, successen en uitdagingen met u delen, en we hopen dat deze case-study zal bijdragen aan een breder begrip van hoe technologie kan worden ingezet om een meer inclusieve samenleving te creëren.
Onze voornaamste doelgroep omvat in principe alle Nederlanders die profijt hebben van de ondersteuning van een synthetische stem bij dagelijkse taken zoals informatie opnemen. Echter, onze specifieke focus ligt op de blinde en slechtziende gemeenschap in Nederland, die afhankelijk is van voorleesstemmen in hun dagelijkse leven.
Deze stemmen worden gebruikt voor diverse toepassingen, waaronder telefoons, computers en meer. Uiteindelijk willen we een positieve impact hebben op hun levenskwaliteit en hen in staat stellen om informatie toegankelijk en efficiënt te consumeren.
Onze doelstellingen zijn tweeledig en omvatten zowel onderzoek, aspecten als ontwikkeling en design aspecten.
De aanleiding van dit project was de veroudering van de stemmen die jaren geleden zijn ontwikkeld en die tot op de dag van vandaag voornamelijk worden gebruikt door blinde en slechtziende mensen in Nederland. Deze stemmen, hoewel functioneel, voldoen niet meer aan de moderne standaarden van spraaktechnologie. De belangrijkste reden voor het voortdurende gebruik van deze stemmen leek simpelweg te zijn dat er geen goed toegankelijk alternatief beschikbaar was.
Daarnaast hebben we overwogen dat gebruikers mogelijk zo gewend zijn geraakt aan de stemmen die ze oorspronkelijk zijn gaan gebruiken, dat ze nu geen behoefte meer voelen om over te schakelen naar nieuwere, betere alternatieven. Om dit te onderzoeken en een dieper inzicht te verkrijgen, hebben we tijdens de gebruikersonderzoeken ook deze kwestie aan de orde gesteld.
Het project werd gestart op initiatief van Koninklijke Visio met ondersteuning van het SIDN fonds. Phoebe Ohayon en Maikel van der Wouden , namens Voice Branding, werkte nauw samen met Timon van Hasselt en Jesse Wienholts namens Visio. In het begin van het project was Maarten Lens-FitzGerald en de Nederlandse Spraak Coalitie betrokken.
Het project begon met een vooronderzoek naar de huidige oplossingen. We onderzochten welke stemmen momenteel beschikbaar zijn en welke het meest worden gebruikt. Naast het onderzoeken van de beschikbare stemmen, bekeken we ook hoe deze stemmen worden gebruikt door blinde en slechtziende mensen. We brachten de belangrijkste use-cases in kaart en onderzochten de verschillen en overeenkomsten tussen gebruikers met betrekking tot persoonlijke spraakinstellingen.
Dit deden we door in gesprek te gaan met gebruikers. Dit onderzoek is gebaseerd op menselijke inzichten, redeneringen en voorkeuren van gebruikers. De focus was hoofdzakelijk het verkrijgen van kwalitatieve informatie om te komen tot zinvolle inzichten en hypothesen.
We ontdekten dat sommige gebruikers de stem bijvoorbeeld 40% sneller hebben staan dan anderen, wat betekent dat een reader de tekst veel sneller voorleest in vergelijking met de normale spreeksnelheid. Het was echter opvallend om te leren dat lang niet alle gebruikers hun screenreader op een hogere snelheid hebben ingesteld. Daarnaast was het interessant om te ontdekken dat gebruikers soms wisselen van snelheid, afhankelijk van de soort content die zij op deze manier tot zich nemen. Ook hadden enkele gebruikers de pitch van hun stem aangepast om te zorgen dat de klank fijner in het gehoor ligt.
De meeste gebruikers werkten met VoiceOver, NVDA en JAWS. Deze software worden het meest gebruikt vanwege hun robuuste functionaliteit, brede compatibiliteit. NVDA is gratis en open-source, waardoor het toegankelijk is voor een breed publiek, inclusief mensen en organisaties met beperkte middelen. Xander en Claire zijn de meest gebruikte stemmen op dit moment.
Doormiddel van het documenteren en thematisch analyseren van de gebruikers interviews in het begin traject hebben de voorkeuren en behoeften van onze doelgroep zorgvuldig onderzocht om te identificeren waar ruimte was voor verbetering en innovatie:
In dit project hebben we geprobeerd de meningen en ervaringen van gebruikers centraal te stellen. Om hierover te leren in deze fundamentele onderzoeksfase hebben we 13 interviews gedaan met gebruikers waarin we testjes deden met 11 verschillende, huidig beschikbare, text-naar-spraak stemmen. Uit dit onderzoek kwamen allerlei belangrijke thema’s en gebruikersvoorkeuren waaronder;
Info@stemvannederland.com
© Alle rechten voorbehouden