Représentations de phrases dans un espace continu spécifiques à la tâche de détection d'erreurs

Sahar Ghannay, Nathalie Camelin, Yannick Estève


Cet article présente une étude sur la modélisation des erreurs de reconnaissance de la parole au niveau de la phrase, afin de compenser certains phénomènes mis en avant par l'analyse des sorties du système de détection d'erreurs que nous avons précédemment proposé. Nous avons étudié trois approches différentes, qui sont fondées respectivement sur l'utilisation des représentations continues (embeddings) de phrases dédiées à la tâche de détection d'erreur, d'un modèle contextuel probabiliste (MCP) et d'un réseau de neurones récurrent BLSTM. Une approche pour construire les embeddings spécifiques à la tâche est proposée et comparée à l'approche Doc2vec. Les expériences sont effectuées sur des transcriptions automatiques du corpus ETAPE générées par le système de reconnaissance automatique du LIUM. Elles montrent que les embeddings spécifiques à la tâche obtiennent de meilleurs résultats que les embeddings génériques et que leur intégration dans notre système améliore les résultats par rapport aux MCP et BLSTM. 


 DOI: 10.21437/JEP.2018-72

Cite as: Ghannay, S., Camelin, N., Estève, Y. (2018) Représentations de phrases dans un espace continu spécifiques à la tâche de détection d'erreurs. Proc. XXXIIe Journées d’Études sur la Parole, 630-638, DOI: 10.21437/JEP.2018-72.


@inproceedings{Ghannay2018,
  author={Sahar Ghannay and Nathalie Camelin and Yannick Estève},
  title={{Représentations de phrases dans un espace continu spécifiques à la tâche de détection d'erreurs}},
  year=2018,
  booktitle={Proc. XXXIIe Journées d’Études sur la Parole},
  pages={630--638},
  doi={10.21437/JEP.2018-72},
  url={http://dx.doi.org/10.21437/JEP.2018-72}
}