Loading...
Please wait, while we are loading the content...
Similar Documents
Adapter le vocabulaire d'un système de transcription automatique de la parole aux thèmes abordés
| Content Provider | Semantic Scholar |
|---|---|
| Author | Tissier, F. |
| Copyright Year | 2011 |
| Abstract | Pour acceder a la semantique de documents multimedias (flux de TV, videos), nous utilisons des systemes de reconnaissance de la parole qui produisent un texte correspondant a ce qui a ete prononce. Ces systemes fonctionnent, entre autres, grâce a un vocabulaire contenant l'ensemble fige des mots qu'ils peuvent reconnaitre, et a un modele de langue regroupant les probabilites de succession des mots du vocabulaire. Bien qu'en regle generale les transcriptions ainsi obtenues soient fiables, ces systemes ne sont pas specialises pour des themes bien precis (le sport, la guerre en Irak, etc.), ce qui conduit a des erreurs de transcription des termes specifiques aux themes. Une adaptation thematique du modele de langue et du vocabulaire est donc necessaire. C'est sur ce dernier point que porte le stage. En effet, il s'agit de selectionner les mots absents des transcriptions. Une solution immediate consiste a selectionner, dans un ensemble de textes traitant du theme d'une transcription (corpus d'adaptation), tous les mots absents du vocabulaire et a les ajouter au systeme. Cette methode n'est pas satisfaisante car elle peut conduire a un afflux de mots, sans interet reel et degradant eventuellement les performances du systeme. Ainsi, pour eviter ces problemes, deux methodes de filtrage, l'une phonetique et l'autre grammaticale, ont ete mises en place et permettent de recuperer, pour une transcription, 63.6% des mots manquants sur les 50% possibles de retrouver dans des corpus d'adaptation. Un second objectif est donc d'augmenter le nombre de mots recuperables en se basant sur les racines morphologiques des mots presents dans les transcriptions. |
| Starting Page | 38 |
| Ending Page | 38 |
| Page Count | 1 |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | https://dumas.ccsd.cnrs.fr/dumas-00636815/document |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |