Loading...
Please wait, while we are loading the content...
Similar Documents
Forêts aléatoires : aspects théoriques, sélection de variables et applications
| Content Provider | Semantic Scholar |
|---|---|
| Author | Genuer, Robin |
| Copyright Year | 2010 |
| Abstract | Cette these s'inscrit dans le cadre de l'apprentissage statistique et est consacree a l'etude de la methode des forets aleatoires, introduite par Breiman en 2001. Les forets aleatoires sont une methode statistique non parametrique, qui s'avere etre tres performante dans de nombreuses applications, aussi bien pour des problemes de regression que de classification supervisee. Elles presentent egalement un bon comportement sur des donnees de tres grande dimension, pour lesquelles le nombre de variables depasse largement le nombre d'observations. Dans une premiere partie, nous developpons une procedure de selection de variables, basee sur l'indice d'importance des variables calculee par les forets aleatoires. Cet indice d'importance permet de distinguer les variables pertinentes des variables inutiles. La procedure consiste alors a selectionner automatiquement un sous-ensemble de variables dans un but d'interpretation ou de prediction. La deuxieme partie illustre la capacite de cette procedure de selection de variables a etre performante pour des problemes tres differents. La premiere application est un probleme de classification en tres grande dimension sur des donnees de neuroimagerie, alors que la seconde traite des donnees genomiques qui constituent un probleme de regression en plus petite dimension. Une derniere partie, theorique, etablit des bornes de risque pour une version simplifiee des forets aleatoires. Dans un contexte de regression, avec une seule variable explicative, nous montrons d'une part que les estimateurs associes a un arbre et a une foret atteignent tous deux la vitesse minimax de convergence, et d'autre part que la foret apporte une amelioration en reduisant la variance de l'estimateur d'un facteur de trois quarts. |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | https://tel.archives-ouvertes.fr/tel-00550989/file/soutenance_Robin.Genuer.pdf |
| Alternate Webpage(s) | https://tel.archives-ouvertes.fr/tel-00550989/document |
| Alternate Webpage(s) | https://www.math.u-psud.fr/select/phd/these_Robin.Genuer.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |