Bientôt des applications pour maquiller sa voix ?

Maquiller sa voix comme on se met du rouge à lèvres ou du fond de teint, et susciter automatiquement la confiance auprès de son interlocuteur ? Grâce aux travaux de l'Institut de neuroscience de la Timone à Marseille, l'idée n'est plus fantaisiste.
par
Laura
Temps de lecture 3 min.

«On peut imaginer dans un avenir proche des applications sur smartphone qui modifieront notre voix en temps réel», explique Pascal Belin, professeur à l'université d'Aix-Marseille et auteur principal de cette étude démontrant comment il est possible, via un algorithme, de générer une voix suscitant automatiquement la confiance.

Confiance ou défiance

«Et cela à partir d'un seul mot comme 'bonjour'», insiste auprès de l'AFP ce chercheur de l'Institut de neuroscience de la Timone, l'un des quatre sites de l'AP-HM, l'hôpital public marseillais, à l'issue de recherches menées en collaboration avec l'université de Glasgow. «En fait, nous nous sommes rendus compte que les impressions de personnalité suscitées par la voix, que l'on pourrait penser totalement subjectives, ne sont pas du tout aléatoires», explique Pascal Belin.

Un simple «Hello» enregistré par 32 hommes et 32 femmes, à Glasgow, a été «jugé» par 320 auditeurs, en ligne: résultat, une quasi unanimité à 92% dans la notation de ces voix et dire si elles suscitaient confiance ou défiance.

Technique de morphing vocal 

Mais comment produire une voix inspirant la confiance ? «Nous avons commencé par prendre d'un côté les 8 'hello' inspirant le plus confiance, de l'autre les 8 suscitant le plus la défiance, et nous les avons mélangés, moyennés, par une technique de morphing», explique le chercheur marseillais: «Nous avons ainsi créé deux nouvelles voix, sorte de moyenne mathématique des huit voix de départ».

Etape suivante: les chercheurs de la Timone ont généré neuf 'hello' à partir de ces deux prototypes, en en modifiant certains paramètres «de la mélodie». «Nous avons même exagéré nos prototypes, pour créer deux voix sensées inspirer encore plus la confiance et la défiance». Puis ces neuf sons ont été jugés par 500 personnes.

«Nous avons été surpris par la fidélité avec laquelle les impressions des auditeurs suivaient nos manipulations acoustiques», a expliqué Phil McAleer, de l'université de Glasgow, co-auteur de cette étude, lors de sa publication fin 2017: «Comme si nous tournions un bouton de 'fiabilité vocale'».

«C'est hallucinant, en terme scientifique, nous avons atteint une corrélation de 0,99, le maximum étant 1», insiste Pascal Belin auprès de l'AFP. Plus étonnant, cette unanimité reste la même, que les auditeurs soient des hommes ou des femmes, qu'ils soient britanniques ou espagnols, comme le montre l'étude menée avec l'université de Barcelone.

Travaux avec l'Ircam, et Clooney 

Pour la petite histoire, le chercheur de la Timone a comparé le «Hello» de George Clooney, dragueur invétéré dans «Burn after reading» des frères Cohen, à sa série de «Hello» générés par ordinateurs. Test concluant: celui de l'acteur était au sommet de la gamme des «bonjours» inspirant confiance...

De la recherche à la vie courante, il n'y a qu'un pas, en passant par l'Institut de recherche et coordination acoustique/musique, fondé par le chef et compositeur Pierre Boulez: «Avec l'Ircam, nous disposons de la technologie pour moduler une voix en temps réel», explique Pascal Belin.

Application de modification de voix

«On peut donc imaginer une application sur smartphone qui maquillerait notre voix, de façon imperceptible, comme un maquillage bien fait... Le décalage est de 20 à 30 millisecondes, même pas un dixième de seconde, donc imperceptible pour l'auditeur». «Nous savons le faire pour un mot. Pour une phrase complète, ce sera plus compliqué, mais je suis persuadé que ce sera disponible d'ici un à deux ans», assure-t-il.

Télé-marketing, applications sur smartphone: «Potentiellement, je vois le même type de marché que pour le secteur du maquillage, qui est de plusieurs milliards d'euros par an, insiste le chercheur marseillais. Pour un centre d'appels, sur des centaines de milliers d'appels, ça peut faire une énorme différence...»