Bandit Manchot (Mathématiques)

Bandit Manchot (Mathématiques): Bandit manchot (mathématiques)

Pour l’article homonyme, voir Bandit manchot.

Le problème dit du bandit manchot peut se schématiser de la façon suivante :

On est en face de deux machines à sous

L'une, $A$ , est en ordre de marche. Elle rapporte donc 1 euro par jeton avec une probabilité $p 0$ connue.

L'autre, $B$ , est détraquée, et rapporte donc 1 euro par jeton avec une probabilité $p 1$ inconnue.

On dispose de $N$ jetons. Que faire pour maximiser raisonnablement son gain ?

Dégrossir le problème

Quelques considérations permettent d'éviter l'explosion combinatoire :

Seule une mise sur $B$ peut nous apporter de l'information et seul un apport d'information peut nous amener à changer d'avis. Donc dès qu'on cesse de miser sur $B$ , on est certain de ne jamais avoir de raison de revenir sur elle.

Le problème se résume en conséquence à savoir combien de jetons on misera sur $B$ , en fonction des résultats, avant de commuter (définitivement) sur $A$ ou non. C'est le problème classique du plan d'expérience.

Application pratique

L'application la plus typique du problème du bandit manchot est celui du choix entre une ancienne et une nouvelle posologie d'un vaccin ou médicament (ou entre deux différents) : il faut déterminer le plus vite possible si le nouveau produit doit être adopté ou l'ancien maintenu. Toute erreur se traduirait en vies humaines perdues (ou, au minimum, en personnes souffrant de troubles consécutifs soit à un traitement incomplet, soit à des effets secondaires excessifs).

Voir aussi

Inférence bayésienne

Théorème de Bayes

Plan d'expérience

Ce document provient de « Bandit manchot (math%C3%A9matiques) ».

Catégories : Probabilités | Statistiques

Contenu soumis à la licence CC-BY-SA. Source : Article Bandit Manchot (Mathématiques) de Wikipédia en français (auteurs)

Игры ⚽ Поможем сделать НИР

Regardez d'autres dictionnaires:

Bandit manchot (mathematiques) — Bandit manchot (mathématiques) Pour l’article homonyme, voir Bandit manchot. Le problème dit du bandit manchot peut se schématiser de la façon suivante : On est en face de deux machines à sous L une, A, est en ordre de marche.… … Wikipédia en Français
Bandit manchot (mathématiques) — Pour l’article homonyme, voir Bandit manchot. Le problème dit du bandit manchot peut se schématiser de la façon suivante : On est en face de deux machines à sous L une, A, est en ordre de marche. Elle rapporte donc 1 euro par… … Wikipédia en Français
Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… … Wikipédia en Français
Arbre de probabilité — Pour les articles homonymes, voir Arbre (homonymie). En probabilité élémentaire, un arbre de probabilité est un schéma permettant de résumer une expérience aléatoire connaissant des probabilités conditionnelles. Ces arbres sont abondamment… … Wikipédia en Français
Arbre De Probabilité — Cet article fait partie de la série Mathématiques élémentaires Algèbre Logique Arithmétique Probabilités … Wikipédia en Français
Arbre de probabilite — Arbre de probabilité Cet article fait partie de la série Mathématiques élémentaires Algèbre Logique Arithmétique Probabilités … Wikipédia en Français
Plan d'expérience — On nomme plan d expérience la suite ordonnée d essais d une expérimentation, chacune permettant d acquérir de nouvelles connaissances en contrôlant un ou plusieurs paramètres d entrée pour obtenir des résultats validant un modèle avec une bonne… … Wikipédia en Français
Probabilité bayésienne — Théorème de Bayes Le théorème de Bayes est un résultat de base en théorie des probabilités, issu des travaux du révérend Thomas Bayes et retrouvé ensuite indépendamment par Laplace. Dans son unique article, Bayes cherchait à déterminer ce que… … Wikipédia en Français
Théorème de Bayes — Le théorème de Bayes est un résultat de base en théorie des probabilités, issu des travaux du révérend Thomas Bayes et retrouvé ensuite indépendamment par Laplace. Dans son unique article, Bayes cherchait à déterminer ce que l’on appellerait… … Wikipédia en Français
Théorème de bayes — Le théorème de Bayes est un résultat de base en théorie des probabilités, issu des travaux du révérend Thomas Bayes et retrouvé ensuite indépendamment par Laplace. Dans son unique article, Bayes cherchait à déterminer ce que l’on appellerait… … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Bandit Manchot (Mathématiques)

Bandit manchot (mathématiques)

Dégrossir le problème

Application pratique

Voir aussi

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Bandit Manchot (Mathématiques)

Bandit manchot (mathématiques)

Dégrossir le problème

Application pratique

Voir aussi

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link