[Podcast] épisode 16 : La reconnaissance automatique du locuteur ou comment identifier une personne à l’aide de sa voix

A l’heure où les interactions vocales sont de plus en plus nombreuses et où certains assistants vocaux intègrent des fonctionnalités de reconnaissance des locuteurs extrêmement avancées, nous avons choisi de nous interroger sur la manière d’identifier une personne à l’aide de sa voix.

Tout d’abord, nous préciserons ce qu’est la voix, à ne pas confondre avec la parole et présenterons les différentes façons de reconnaître une personne en se basant uniquement sur sa voix. Nous nous interrogerons ensuite sur l’usage des caractéristiques vocales d’une personne, afin de constituer une signature vocale qui permettrait de l’identifier de manière unique. Nous aborderons également la question de la variabilité de la voix ainsi que la manière de pouvoir la surmonter.

Puis, nous nous intéresserons à l’apprentissage d’un système de reconnaissance automatique du locuteur et à l’impact de l’environnement acoustique sur cette phase d’apprentissage. Nous aborderons également la question de l’extraction automatique de l’identité d’une personne (prénom et patronyme) à partir d’enregistrements sonores, mais aussi la question de la sécurisation du processus de reconnaissance du locuteur.

Comme la reconnaissance automatique du locuteur n’est pas un concept nouveau, nous tenterons d’évaluer ce qui a changé aujourd’hui et où en sont les grands laboratoires, mais aussi les GAFAM et les BATX, qui travaillent sur le sujet. La question de l’évaluation de la performance d’un système de reconnaissance automatique du locuteur sera également abordée. Enfin, Carole Lailler et Jean-Luc Marini porteront un regard prospectif sur la reconnaissance automatique du locuteur.

Texte intégral de l’échange disponible ici.