Loading...
Please wait, while we are loading the content...
Similar Documents
Etude de l'influence des paramètres sur les performances des forêts aléatoires
| Content Provider | Semantic Scholar |
|---|---|
| Author | Bernard, Simon Heutte, Laurent Adam, Sébastien |
| Copyright Year | 2008 |
| Abstract | Dans cet article nous presentons nos travaux sur la parametrisation des Forets Aleatoires (RF pour Random Forest), et plus precisement sur la parametrisation de l'algorithme de reference Forest-RI. Dans cet algorithme, la "quantite" d'aleatoire injectee dans le processus d'induction d'un arbre est controlee par un hyperparametre, note K, qui joue a priori un role important pour construire un classifieur performant de type RF. Jusqu'a present pourtant, aucune regle de parametrisation n'a ete proposee dans la litterature et seulement certaines valeurs arbitraires de K sont traditionnellement utilisees lorsque Forest-RI est experimente, sans justification theorique. Nous presentons donc dans cet article une etude experimentale sur cet hyperparametre, qui a pour but de comprendre dans quelle mesure le choix de K agit sur les performances en classification des RF. Nous comparons notamment entre elles les valeurs de K de la litterature a l'aide d'un test statistique de significativite. Nous comparons egalement ces valeurs a un nouvel algorithme d'induction de RF, appele Forest-RK, pour lequel la valeur de K est choisie aleatoirement a chaque noeud de l'arbre, et n'est donc plus un hyperparametre de la procedure d'induction. Nous montrons que quelques unes de ces valeurs particulieres de K proposees dans la litterature sont statistiquement proches de l'optimalite sur la majorite des bases de donnees testees, a l'exception de certaines pour lesquelles elles sont significativement sous-optimales. Pour ces bases en particulier Forest-RK se montre en revanche au moins aussi performant que Forest-RI avec ces valeurs de K. Nous reportons aussi des experimentations complementaires qui mettent en evidence le role important joue par le caractere discriminant des caracteristiques pour determiner la valeur optimale de K. |
| Starting Page | 207 |
| Ending Page | 208 |
| Page Count | 2 |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | https://hal.archives-ouvertes.fr/hal-00334425/document |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |