Impact de la détection de la parole pour différentes tâches de traitement automatique de la parole

Florent Desnous, Anthony Larcher, Sylvain Meignier


Dans cet article, nous proposons de comparer plusieurs systèmes de détection de la parole et leurs impacts sur deux tâches du traitement de la parole : la Segmentation et le Regroupement de Locuteurs (SRL) et la Reconnaissance Automatique de la Parole (RAP). Des systèmes à base de mixtures de gaussiennes (GMM), de réseaux de neurones profonds (DNN) et récurrents (RNN) sont abordés, ainsi que l'utilisation d'un système de RAP pour détecter la frontière des mots. Les expériences présentées ici ont été conduites sur les corpus issus des campagnes d'évaluation ESTER 1 et 2, ETAPE et REPERE 1, constitués d'émissions de radio et de télévision française.


 DOI: 10.21437/JEP.2018-63

Cite as: Desnous, F., Larcher, A., Meignier, S. (2018) Impact de la détection de la parole pour différentes tâches de traitement automatique de la parole. Proc. XXXIIe Journées d’Études sur la Parole, 550-558, DOI: 10.21437/JEP.2018-63.


@inproceedings{Desnous2018,
  author={Florent Desnous and Anthony Larcher and Sylvain Meignier},
  title={{Impact de la détection de la parole pour différentes tâches de traitement automatique de la parole}},
  year=2018,
  booktitle={Proc. XXXIIe Journées d’Études sur la Parole},
  pages={550--558},
  doi={10.21437/JEP.2018-63},
  url={http://dx.doi.org/10.21437/JEP.2018-63}
}