Simulation d'erreurs de reconnaissance automatique dans un cadre de compréhension de la parole

Edwin Simonnet, Sahar Ghannay, Nathalie Camelin, Yannick Estève


Cet article propose une méthode de simulation d'erreurs de systèmes de reconnaissance automatique de la parole (SRAP) à partir de transcriptions manuelles, et montre son utilité pour rendre les systèmes de compréhension automatique de la parole (SCAP) plus robustes aux erreurs de SRAP. Partant du principe que le SRAP confond les mots acoustiquement et linguistiquement proches, cette méthode s'appuie sur l'utilisation de plongements de mots acoustiques et linguistiques pour calculer une mesure de similarité entre les mots : cette mesure vise à prédire les confusions de mots faites par le SRAP. Les expériences menées sur le corpus MEDIA (réservations d'hôtel) montrent que cette approche améliore significativement les performances des SCAP avec une réduction relative de 21,2% du taux d'erreur concept/valeur, en particulier quand le SCAP est neuronal (réduction de 22,4%). Une comparaison avec une méthode de bruitage naïf montre la pertinence de l'approche de bruitage proposée.


 DOI: 10.21437/JEP.2018-30

Cite as: Simonnet, E., Ghannay, S., Camelin, N., Estève, Y. (2018) Simulation d'erreurs de reconnaissance automatique dans un cadre de compréhension de la parole. Proc. XXXIIe Journées d’Études sur la Parole, 258-266, DOI: 10.21437/JEP.2018-30.


@inproceedings{Simonnet2018,
  author={Edwin Simonnet and Sahar Ghannay and Nathalie Camelin and Yannick Estève},
  title={{Simulation d'erreurs de reconnaissance automatique dans un cadre de compréhension de la parole}},
  year=2018,
  booktitle={Proc. XXXIIe Journées d’Études sur la Parole},
  pages={258--266},
  doi={10.21437/JEP.2018-30},
  url={http://dx.doi.org/10.21437/JEP.2018-30}
}