Etude de performance des réseaux neuronaux récurrents dans le cadre de la campagne d'évaluation Multi-Genre Broadcast challenge 3 (MGB3)

Salima Mdhaffar, Antoine Laurent, Yannick Estève


Ces dernières années, l'utilisation des réseaux neuronaux est devenue incontournable dans de nombreux domaines liés au traitement automatique des langues. Le travail présenté dans cet article s'inscrit dans le cadre de leur utilisation dans le domaine de la reconnaissance automatique de la parole. Nous présentons les résultats obtenus par des réseaux neuronaux récurrents (RNN) de natures différentes (LSTM, GRU, GRU-highway) sur les données de la campagne d'évaluation MGB 3. Les données de cette campagne, qui n'est pas encore terminée, correspondent à des enregistrements d'émissions très diverses de la chaîne de télévision britannique BBC. Nos expériences offrent une comparaison des résultats des différents RNN et comment, en combinant des réseaux de neurones récurrents et des modèles de langage n-gram classiques modélisant les phrases dans les deux sens de lecture, il est possible d'améliorer de manière très significative les performances d'un système de reconnaissance de la parole.


 DOI: 10.21437/JEP.2018-20

Cite as: Mdhaffar, S., Laurent, A., Estève, Y. (2018) Etude de performance des réseaux neuronaux récurrents dans le cadre de la campagne d'évaluation Multi-Genre Broadcast challenge 3 (MGB3). Proc. XXXIIe Journées d’Études sur la Parole, 169-177, DOI: 10.21437/JEP.2018-20.


@inproceedings{Mdhaffar2018,
  author={Salima Mdhaffar and Antoine Laurent and Yannick Estève},
  title={{Etude de performance des réseaux neuronaux récurrents dans le cadre de la campagne d'évaluation Multi-Genre Broadcast challenge 3 (MGB3)}},
  year=2018,
  booktitle={Proc. XXXIIe Journées d’Études sur la Parole},
  pages={169--177},
  doi={10.21437/JEP.2018-20},
  url={http://dx.doi.org/10.21437/JEP.2018-20}
}