Loading...
Please wait, while we are loading the content...
Similar Documents
Algorithme de bandit et obsolescence : un modèle pour la recommandation
| Content Provider | Semantic Scholar |
|---|---|
| Author | Louëdec, Jonathan Rossi, Laurent Chevalier, Max Garivier, Aurélien Mothe, Josiane |
| Copyright Year | 2016 |
| Abstract | Un nombre croissant de systemes numeriques font appel a des algorithmes de bandits pour combiner efficacement exploration de l'environnement et exploitation de l'information accumulee. Les modeles de bandits classiques sont toutefois assez naifs : ils se bornent a un nombre fixe de choix disponibles (appeles bras), et a des reponses ne variant pas au cours du temps. Pour les moteurs de recommandation, par exemple, il s'agit de limitations severes : de nouveaux items a recommander apparaissent regulierement, et les anciens ont une tendance previsible a perdre de l'attractivite. Pour faire face a ces problemes, des strategies capables de gerer l'evolution temporelle du gain moyen associe a chaque bras ont ete proposees. Si ces strategies sont assez generales, elles ne sont pas forcement les plus efficaces dans le cas ou la forme de cette evolution temporelle est largement connue a priori. Dans cet article nous proposons deux nouvelles strategies capables de prendre en compte d'une part l'obsolescence progressive de chaque bras, et d'autre part l'arrivee de nouveaux bras : Fading-UCB, pour laquelle nous fournissons une analyse detaillee de la borne superieure de regret, et Trust and abandon. Nous montrons experimentalement que les deux strategies proposees permettent d'obtenir de meilleures performances que celles obtenues par les strategies de l'etat de l'art. |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | https://www.irit.fr/publis/SIG/2016_CAP_LRCGM.pdf |
| Alternate Webpage(s) | http://oatao.univ-toulouse.fr/17130/1/louedec_17130.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |