Loading...
Please wait, while we are loading the content...
Similar Documents
Modèles génératifs pour la classification et la séparation de sources sonores en temps-réel
| Content Provider | Semantic Scholar |
|---|---|
| Author | Baelde, Maxime |
| Copyright Year | 2019 |
| Abstract | Cette these s'inscrit dans le cadre de l'entreprise A-Volute, editrice de logiciels d'amelioration d'experience audio. Elle propose un radar qui transpose l'information sonore multi-canale en information visuelle en temps-reel. Ce radar, bien que pertinent, manque d'intelligence car il analyse uniquement le flux audio en terme d'energie et non en termes de sources sonores distinctes. Le but de cette these est de developper des algorithmes de classification et de separation de sources sonores en temps-reel. D'une part, la classification de sources sonores a pour but d'attribuer un label (par exemple voix) a un son monophonique (un label) ou polyphonique (plusieurs labels). La methode developpee utilise un attribut specifique, le spectre de puissance normalise, utile a la fois dans le cas monophonique et polyphonique de part sa propriete d'additivite des sources sonores. Cette methode utilise un modele generatif qui permet de deriver une regle de decision basee sur une estimation non parametrique. Le passage en temps-reel est realise grâce a un pre-traitement des prototypes avec une classification hierarchique ascendante. Les resultats sont encourageants sur differentes bases de donnees (proprietaire et de comparaison), que ce soit en terme de precision ou de temps de calcul, notamment dans le cas polyphonique. D'autre part, la separation de sources consiste a estimer les sources en terme de signal dans un melange. Deux approches de separation ont ete considerees dans la these. La premiere considere les signaux a retrouver comme des donnees manquantes et a les estimer via un schema generatif et une modelisation probabiliste. L'autre approche consiste, a partir d'exemples sonores present dans une base de donnees, a calculer des transformations optimales de plusieurs exemples dont la combinaison tends vers le melange observe. Les deux propositions sont complementaires, avec chacune des avantages et inconvenients (rapidite de calcul pour la premiere, interpretabilite du resultat pour la deuxieme). Les resultats experimentaux semblent prometteurs et nous permettent d'envisager des perspectives de recherches interessantes pour chacune des propositions. |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | https://hal.archives-ouvertes.fr/tel-02399081/file/these.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |