Analyse du petit casse-tête agaçant

Dans un article précédent, j'ai posé un petit casse-tête de probabilité qui s'appelle  le paradoxe des deux enveloppes. Lisez-le avant de lire l'analyse que j'en propose ici.

Ce qui est surprenant, c'est qu'il y a beaucoup de discussions autour de ce petit problème. il est posé avec très peu d'information et les discussions sont dues selon moi à la confusion entre "absence d'information" et "une chance sur deux".

En tout cas, voici mon analyse.

Synthèse

Avant de choisir une enveloppe, on a une chance sur deux de choisir le montant simple et une chance sur deux de choisir le montant double. Ce résultat ne dépend pas de la manière dont l’organisateur du jeu remplit les enveloppes.
Une fois qu’on a ouvert une enveloppe et qu’on a pris connaissance du montant M qu’elle contient, il n’y a plus que deux paires possibles : (M, 2M) et (M/2, M).

La probabilité que l’autre enveloppe contienne 2M n’est pas 1/2 mais la probabilité que la paire (M, 2M) soit proposée par rapport à la paire (M/2, M).

Cette probabilité est une fonction de M qui dépend de la manière dont l’organisateur du jeu remplit les enveloppes. Le joueur n’a pas d’information mais ce n’est pas parce qu’il ignore cette probabilité qu’elle vaut 1/2.

Non seulement cette probabilité n’est pas 1/2 mais on démontre que, quelle soit la méthode utilisée par l’organisateur, il y a forcément un montant pivot à partir duquel la probabilité est inférieure à 1/3. Pour tous les montants supérieurs au montant pivot, l’espérance de gain du changement est inférieure à M et le joueur a intérêt à ne pas changer d’enveloppe.

En l’absence d’information sur les règles de remplissage des enveloppes, le joueur en est réduit à estimer un montant pivot au-delà duquel il ne changera pas. Cette règle est meilleure que changer systématiquement ou garder systématiquement.


Démonstration

Mettez-vous dans la peau d’un joueur. Si vous découvrez 10 euros dans l’enveloppe, vous allez très certainement changer pour l’autre enveloppe : vous imaginez que l’organisateur du jeu a tout aussi bien pu vous présenter la paire d’enveloppes 10 et 20 euros que la paire 10 et 5 euros. Il y a bien une chance sur deux qu’il y ait 20 euros dans l’autre enveloppe.
En revanche, si vous découvrez 1 000 euros, vous allez réfléchir avant de prendre l’autre enveloppe. La question est de savoir si l’organisateur est suffisamment généreux pour avoir mis 2 000 euros dans une enveloppe. Et si vous découvrez 10 000 euros, 100 000 euros, allez-vous vraiment risquer la moitié de cette somme en pariant sur un tel niveau de générosité de l’organisateur ?

Et c’est le bon raisonnement !


Dans les deux cas, vous tenez compte du montant de la première enveloppe pour estimer la probabilité que l’autre soit double. Vous considérez intuitivement que plus ce montant est élevé, moins il y a de chances que l’autre soit le double. Vous pensez donc que la probabilité dépend du montant et que ce n’est pas toujours la probabilité 1/2 d’avoir choisi la petite enveloppe comme l’énoncé du paradoxe le suppose dans son calcul de l’espérance de gain.

Mais quelle est cette probabilité alors ?


La probabilité que l’autre enveloppe contienne le montant double est la probabilité d’apparition de la paire d’enveloppes (montant, double du montant) par rapport à la paire (montant, moitié du montant).
Il se trouve que le joueur n’a aucune information pour calculer cette probabilité. Il en est réduit à faire des conjectures. Mais ne pas avoir l’information ne signifie pas que cette probabilité soit d’une chance sur deux. Ce raisonnement intuitif est valide dans le monde réel. Est-il valable mathématiquement ? Peut-on imaginer une procédure mathématique de remplissage des enveloppes telle que la probabilité soit toujours un demi ?

Et bien non !


Quelle que soit la procédure adoptée par l’organisateur du jeu, il y a forcément des valeurs avec une plus grande probabilité d’être le montant double que le montant simple de la paire. En changeant d’enveloppe, l’espérance de gain est négative. On démontre que les pertes subies sur ces montants annulent exactement les gains obtenus sur les autres montants.

On peut par exemple imaginer un jeu dans lequel le joueur a quasiment toujours raison de changer. Les paires d’enveloppes ne contiennent que des puissances de 2 successives, (4, 8) ou (32, 64) par exemple. L’organisateur tire une telle paire au hasard.

Imaginons un nombre de tirages fini. Le montant maximum, 2048 par exemple, ne peut être tiré que dans le couple (1024, 2048) parce que le couple (2048, 4096) n'existe pas. Avec ces règles, le raisonnement du joueur est bon pour tous les tirages sauf pour 2048 (il ne l’est pas non plus pour le plus petit montant mais dans ce cas le changement est la bonne décision). Pour toutes les valeurs, sauf une seule, le calcul de l’espérance de gain est exact et le joueur a intérêt à changer.

Aussi étrange que cela puisse paraître, dans ce jeu, la règle J’ouvre une enveloppe au hasard mais je prends systématiquement l’autre permet de gagner plus d’argent que J’ouvre une enveloppe au hasard et je garde ce qu’elle contient.

Toujours… sauf une fois


La fois où, pas de chance, le joueur tombe sur 2048 ! Et dans ce cas-là, en changeant, il se trompe systématiquement et perd 1024.
Je vous laisse faire les calculs pour vérifier que la perte subie sur ce seul cas annule complètement les gains obtenus sur tous les autres montants.

Et si on ne se donne pas de montant maximum ?


Quittons la vie réelle finie pour le monde mathématique infini sans limite supérieure de montant. Quel que soit le montant M qu’on découvre, aussi grand soit-il, on est sûr que les deux couples (M, 2M) et (M/2, M) sont possibles. La probabilité que l’autre enveloppe contienne le double n’est-elle pas alors toujours de un sur deux ?

Et bien non toujours pas !


Les calculs se font avec des fonctions continues de distribution des probabilités. On montre sans trop de difficultés que nécessairement la distribution est telle qu'à partir d’une certaine valeur, tous les montants ont plus de chance d’être un montant double qu’un montant simple. Ces cas se produiront rarement mais en termes d’espérance mathématique, ces pertes rares sont importantes et elles annulent les gains fréquents mais moins élevés.


Calcul des probabilités pour une distribution continue


On imagine que l’organisateur tire le nombre simple au hasard selon une fonction de distribution des probabilités \(f(x)\). L’intégrale de \(f\) entre 0 et \(\infty\) vaut 1. Il place ce montant \(x\) dans une enveloppe et le montant \(2x\) dans l'autre. Lorsque le joueur découvre le montant \(x\)  quelle est la probabilité \(d(x)\) qu’il s’agisse du montant double de la paire ?

Pour répondre, il faut comparer la probabilité que le nombre \(x\) soit tiré par l'organisateur en tant que nombre simple par rapport à la probabilité que sa moitié \(x/2\) soit tirée.

Si on note \(g(x)\) la probabilité que \(x\) soit le montant double, on a $$g(x) = {f(x/2)\over2}$$.
Attention, \(g(x)\) ne vaut pas \(f(x/2)\) mais \(f(x/2)/2\). En effet, l’intégrale d’une densité de probabilité vaut 1. L’intégrale de la fonction \(f(x/2)\) vaut 2. Il faut donc diviser \(f(x/2)\) par 2 pour obtenir une densité de probabilité.

La somme $$h(x) = {(f(x)+g(x))\over2}$$ donne la densité de probabilité que le nombre x soit tiré. Là encore, il faut diviser par deux pour assurer que l’intégrale de cette fonction vaut 1.

Nous pouvons maintenant répondre à la question : la probabilité que le nombre \(x\) soit un nombre double vaut $$d(x) = {g(x) \over {f(x) + g(x)}} = {f(x/2) \over {2f(x) + f(x/2)}}$$
Attention, \(d(x)\) n’est pas une densité de probabilité mais une probabilité, c’est à dire un nombre compris entre 0 et 1 pour toute valeur de x. C’est cette valeur \(d(x)\) que le joueur estime naïvement à 1/2 dans l’énoncé du paradoxe. Le bon calcul de l’espérance de gain du changement d’enveloppe vaut : $$e(x) = d(x){x \over 2} + (1-d(x))2x = (2-{3 \over 2}d(x))x$$

Premier exemple


Si l’organisateur tire le montant simple uniformément au hasard entre 0 et 10.

  • La fonction de densité \(f\) vaut \(f(x) = 1/10\) sur l’intervalle \([0, 10]\). Elle est nulle en dehors de cet intervalle.
  • La fonction \(g(x)\) vaut \(1/20\) sur l’intervalle \([0, 20]\). La somme \(f(x) + g(x)\) vaut \(3/20\) sur \([0, 10]\) et \(1/20\) sur \([10, 20]\).
  • La probabilité que le montant \(x\) soit double est donc de \(1/3\) sur \([0, 10]\) et \(1\) sur \([0, 20]\). Elle ne vaut jamais 1/2.

Second exemple


L’organisateur utilise la densité de probabilité $$f(x) = {n-1 \over (1+x)^n}$$ Cette fonction vaut \(n-1\) en 0. Son intégrale sur \(\infty\) vaut 1. Pour les grandes valeurs de \(x\), on peut utiliser la formule : \(f(x) = {n-1 \over x^n}\).  La densité \(g(x)\) vaut $$g(x) = {1 \over 2}{n-1 \over (1+x/2)^n} = {{(n-1)2^{n-1}} \over (2+x)^n}$$ Pour les grandes valeurs, on peut utiliser la formule \(g(x) = {(n-1)2^{n-1} \over x^n}\)
Restons maintenant dans les grandes valeurs. On peut écrire : \(g(x) = 2^{n-1}f(x)\). La somme \(f+g\) vaut $$f(x)+g(x) = (2^{n-1} + 1)f(x)$$ La probabilité \(d(x)\) que le montant \(x\) soit double vaut : $$d(x) = {g(x) \over f(x)+g(x)} =  {2^{n-1} \over 2^{n-1} + 1}$$

Avec n=2

La probabilité vaut \(d(x) = 2/3\). Lorsque le montant découvert dans l’enveloppe est grand, la probabilité qu’il s’agisse d’un nombre double est de 2 chances sur 3 et non de 1 chance sur 2. Mais cette densité de probabilité \(f(x)={1 \over (1+x)^2}\) donne une espérance de gain infinie. La question de l’augmentation du gain ne se pose pas vraiment…

Avec n=3

Cette fois-ci, l’espérance de gain est finie. La probabilité vaut \(d(x) = 4/5\). Il ne faut vraiment pas changer d’enveloppe lorsqu’un gros montant est découvert : 4 chances sur 5 de se tromper !


Calcul de l’espérance de gain


La question est de calculer l’espérance de gain du jeu. Bien évidemment, l’espérance de gain dépend de la manière dont l’organisateur remplit les enveloppes. On note \(S\) l’espérance de gain des montants simples, c’est-à-dire l’espérance de gain du cas où par malchance le joueur tombe systématiquement sur le plus petit montant. L’espérance de gain des montants doubles vaut alors \(2S\). En tirant simplement au hasard l’un des montants, l’espérance de gain vaut la moyenne des deux espérances précédentes : \( {3 \over 2}S\).

Avec une bonne stratégie, le joueur peut espérer faire mieux que \( {3 \over 2}S\) sachant qu’il ne peut espérer plus que \(2S\). On a vu que changer systématiquement ne sert à rien : l’espérance reste \( {3 \over 2}S\)  On a vu également que changer d’enveloppe avait une espérance de gain positive pour les "petits" montants et une espérance de gain négative pour les "gros" montants.

Une bonne stratégie consiste alors à estimer la valeur à partir de laquelle les montants deviennent "gros". Le joueur n’en a aucune idée. Cependant il a intérêt à se donner une valeur pivot au-delà de laquelle il garde le contenu de l’enveloppe ouverte. Dans le pire des cas, si son pivot est trop grand, ça ne lui sert à rien mais ça ne peut pas avoir de conséquences négatives pour lui. Si on contraire il choisit bien son pivot, son espérance de gain est supérieure à \( {3 \over 2}S\).

Quelle est la valeur du pivot qui maximise l’espérance de gain ?


Expressions des espérances de gain


En reprenant la définition précédente des fonctions \(f(x)\), \(g(x)\) et \(h(x)\), les espérances de gain s'expriment :

  • \( S = \int_0^{\infty} f(x)x\mathrm{d}x\)
  • \( 2S = \int_0^{\infty} g(x)x\mathrm{d}x\)
  • \( {3 \over 2}S = \int_0^{\infty} h(x)x\mathrm{d}x\)
On a également calculé l'espérance de gain \(e(x)\) du changement d'enveloppe :

  • \(e(x) = (2-{3 \over 2}d(x))x = x + (1-{3 \over 2}d(x))x\)

Introduction d'un pivot


Si le montant \(x\) est inférieur au pivot \(p\), le joueur change d'enveloppe et son espérance de gain est \(e(x)\). Dans le cas contraire, il garde l'enveloppe et son gain est \(x\).
L'espérance de gain est la somme des intégrales sur ces deux intervalles :
$$E(p) = \int_0^p h(x)e(x)\mathrm{d}x + \int_p^\infty h(x)x\mathrm{d}x$$
En utilisant l'expression \(e(x)=x+(1 – {3 \over 2}d(x))x\), on a :
$$E(p) = \int_0^\infty h(x)x\mathrm{d}x + \int_0^p h(x)(1 – {3 \over 2}d(x))x\mathrm{d}x$$
Ce qui donne :
$$E(p) = {3 \over 2}S + \int_0^p h(x)(1 – {3 \over 2}d(x))x\mathrm{d}x$$

Amélioration de l'espérance de gain


En adoptant la stratégie de changement d'enveloppe en dessous d'une valeur pivot \(p\), l'espérance de gain du joueur passe de \({3 \over 2}S\) à \({3 \over 2}S + A(p)\) où \(A(p)\) a pour expression :
$$A(p) = \int_0^p h(x)(1 – {3 \over 2}d(x))x\mathrm{d}x$$
Pour que cette amélioration soit intéressante, il faut que \((1 – {3 \over 2}d(x)) > 0\) , c’est-à-dire :
$$d(x) < 2/3$$
Un bon candidat pour être le meilleur pivot est la valeur \(p\) à partir de laquelle la densité \(d(x)\) est supérieure à \(2/3\).

Rappelons que le joueur n'a aucune information sur la loi utilisée par l'organisateur pour remplir les enveloppes. Il n'a donc pas accès à la meilleure valeur de \(p\). En revanche, en utilisant une valeur il sait qu'il améliore son espérance de gain.

Premier exemple


Rappelons ce que nous avons trouvé :

  • \(f(x) = 1/10\) sur \([0, 10]\)
  • \(g(x) = 1/20\) sur \([0, 20]\)
  • \(h(x) = 3/40\) sur \([0, 10]\) et \(1/40\) sur \([10, 20]\)
  • \(d(x) = 1/3\) sur \([0, 10]\) et \(1\) sur \([10, 20]\)

Le pivot \(p\) est donc \(10\), valeur à partir de laquelle la probabilité \(d(x)\) est supérieure à \(2/3\).
$$A(10) = \int_0^{10} {3 \over 40}\Big(1 - {3 \over 2}.{1 \over 3}\Big)x \mathrm{d}x = {3 \over 80} \int_0^{10} x \mathrm{d}x=1,875 $$
En changeant d'enveloppe lorsque le montant est inférieur à \(10\) et en gardant le montant dans le cas contraire, l'espérance du joueur s'améliore de \(1,875\), passant de \({3 \over 2}S=7,5\) à \(9,375\). Ce résultat est à comparer à l'espérance maximum \(2S=10\).

Cas général


On cherche la valeur \(p\) à partir de laquelle la densité \(d(x)\) est supérieure à \(2/3\). On a vu que :
$$ d(x) = {g(x) \over {f(x) + g(x)}} = {f(x/2) \over {2f(x) + f(x/2)}}$$
La condition sur \(d(x)\) donne :
$$ {f(x/2) \over {2f(x) + f(x/2)}} > {2 \over 3} $$
$$ 3f(x/2) > 4f(x) + 2f(x/2) $$
Ce qui conduit à :
$$ f(x) < {1 \over 4} f(x/2) $$
Ce qui signifie qu'il faut que la densité de probabilité diminue de plus d'un quart lorsque la valeur double. En d'autre termes, il faut que la densité de probabilité diminue plus vite qu'une fonction en \(1 \over x^2\).

Nous avons étudié cette densité de probabilité limite :
$$ f(x) = {1 \over (1+x)^2} $$
Nous avions vu que la probabilité tendait vers \(2/3\). Cette limite n'est jamais atteinte donc toute valeur de \(p\) est bonne et permet d'augmenter l'espérance de gain. Mais comme l'espérance de gain de cette distribution est infinie, ce cas n'est pas très intéressant.

Deuxième exemple avec n=3


Avec \(f(x)={2 \over (1+x)^3} \), on cherche le pivot \(p\) solution de l'équation :
$$ f(x) = {1 \over 4} f(x/2) $$
C'est-à-dire :
$$ {4 \over (1+x)^3} =  {1 \over (1+x/2)^3} $$
Ce qui amène à l'équation du troisième degré:
$$ (2+x)^3 = 2(1+x)^3 \Leftrightarrow x^3 - 6x - 6 = 0$$
On trouve comme valeur pivot \(p=2,847\).

L'espérance de gain minimum \(S\) vaut
$$ S = \int_0^\infty {2x \over (1+x)^3} \mathrm{d}x = 1$$

L'espérance de gain sans changement vaut donc \({3 \over 2}S = 1,5\).

Le pivot permet d'améliorer cette espérance de gain d'environ \(0,1\).

Commentaires

Articles les plus consultés