Thomas Lanzi
SKEMA Business School
Introduction
Nos intérêts individuels sont-ils compatibles avec ceux de la collectivité ?
La poursuite de nos motivations individuelles et de nos désirs égoïstes engendrent-elles nécessairement des situations collectivement optimales ?
La réponse à ces questions implique de comprendre précisément la distinction entre un équilibre et un optimum collectif.
Imaginons deux firmes se faisant concurrence par les prix. S’il existe une issue dans laquelle aucune des deux firmes n’a intérêt à modifier son prix compte tenu du prix pratiquer par son concurrent alors cette situation constituera un équilibre, i.e une issue stable.
Comment comparer des « états économiques », des issues ou des solutions possibles dans une interaction stratégique ?
Le critère de Pareto
Considérons 2 agents A et B dont les gains sont représentés par la fonction gi .
Une issue h est une issue strictement Pareto-dominé s’il existe au moins une issue z telle que le gain de tout agent i obtenu avec l’issue h est strictement inférieure à celui procuré par l’issue z :
Issue
g
Ag
B1
10
10
2
20
26
3
8
22
4
7
30
EXEMPLE
L’issue 1 est Pareto-dominée par l’issue 2 puisque gA(1) < gA(2) et gB(1) < gB(2).
L’issue 3 est Pareto-dominée par l’issue 2 puisque gA(3) < gA(2) et gB(3) < gB(2).
L’optimum de Pareto
Une issue est un optimum de Pareto:
- si elle n’est pas Pareto-dominée et,
- s’il n’existe aucune autre issue qui fait l’unanimité
auprès des agents, i.e si l’augmentation du gain d’un agent se réalise au détriment du gain d’au moins un autre agent.
Techniquement, deux issues h et z sont des optima de Pareto si
:
Comment sélectionner les optima de Pareto entre
eux ?
Construction des préférences collectives W :
- Critère Utilitariste : le planificateur maximise la somme
des gains ou utilités individuelles. Ex: On sélectionne l’issue 2 car W2 = 46 et W4 = 37.
- Critère Egalitariste : le planificateur minimise l’écart entre
- Critère Rawlsien : le planificateur maximise le gain ou
l’utilité de l’agent le plus défavorisé.
Ex: l’agent A est le plus défavorisé car gA(2) < gB(2) et
Les conséquences du raisonnement stratégique au travers de quelques exemples:
« Le dilemme du prisonnier » Considérons l’histoire suivante:
Représentation du jeu sous forme normale
Jeu simultané
Quelle est l’issue de cette interaction ?
Nier Avouer
Nier (-1 ; -1) (-10 ; 0)
Avouer (0 ; -10) (-8 ; -8)
A
Avouer est une stratégie strictement dominante pour chacun des joueurs, ils ont donc tous les 2 intérêts à jouer cette dernière.
Solution : (Avouer ; Avouer)
Cette solution est unique mais ne constitue pas l’issue la plus favorable aux deux individus.
Nier Avouer
Nier (-1 ; -1) (-10 ; 0)
Avouer (0 ; -10) (-8 ; -8)
A
Une des principales moralités du dilemme du prisonnier est que les interactions stratégiques entre des agents économiques rationnels peuvent rendre le résultat collectif inefficace.
Comment s’engager sur une solution efficace ? Dans cette exemple, coopérer n’est pas crédible.
Exemple en science politique: « le vote stratégique »
Une commission de 3 personnes (A, B et C) doit choisir un projet de texte de loi parmi 3 versions possibles: a, b et c.
Règle de vote: 1er tour - Majorité sans
abstention entre b et c. 2nd tour - Majorité
sans abstention entre le 1er vainqueur et
a.
Si le vote est naïf, alors b l’emporte au 1er
et 2nd tour.
Si A est stratégique, il votera pour c au 1er tour pour éliminer le projet b et faire
gagner le projet a au 2nd tour.
A
B
C
a
b
c
b
a
b
Eléments de bases des jeux non coopératifs
Description d’un jeu
• Représentation formelle d’une situation dans laquelle un certain nombre d’individus « rationnels » doivent prendre des décisions qui les affectent mutuellement.
• Les décisions sont stratégiques et dépendent des anticipations sur les actions des autres.
Eléments d’un jeu
a) les joueurs
b) le rôle du hasard (ou « nature ») c) les règles du jeu:
- qui joue quand ?
- quelle information ont les joueurs lorsqu’ils jouent ?
- que peuvent faire les joueurs lorsque c’est leur tour de jouer ( « stratégies »)
d) les résultats (pour chaque ensemble possible
d’actions des joueurs et de la nature, quel est le résultat du jeu ?
Nature des interactions
Jeux à somme nulle
• Les intérêts des joueurs sont diamétralement opposés. • Situation de pur conflit car ce qui est perdu par l’un est
gagné par l’autre. Jeux de coordination
• Les intérêts des joueurs sont alignés. • Problèmes de multiplicité d’équilibres.
Types de jeux
Les jeux simultanés
• Les actions sont retenues simultanément et par
définition on n’observe jamais le choix des autres joueurs.
• Anticipation des stratégies des autres joueurs.
Les jeux séquentiels
Les choix sont séquentiels et selon l’hypothèse faite sur
l’information les actions sont observées ou non par les
Deux types de représentations
Forme normale
• Forme condensée d’un jeu où apparaît directement les
stratégies de chaque joueurs et les résultats
conditionnels.
• Représentation des jeux simultanés et séquentiels.
Forme extensive
• Représentation sous la forme d’un arbre où les choix
sont séquentiels. Les arbres se caractérisent par des
branches et des nœuds.
Exemple : Un jeu d’entente
Deux firmes A et B en concurrence.
• Règles du jeu : chaque firme choisit soit une stratégie de
«concurrence» ou d’«entente».
• Logique du Dilemme du prisonnier
• Selon les règles du jeu, les résultats peuvent être
Version 1
• les choix sont simultanés
• Représentation sous forme normal
Concurrence Entente
Concurrence (2;2) (15;0)
Entente (0;15) (10;10)
Firme B
Version 2
• Les choix sont séquentiels en information parfaite • Forme extensive des jeux
Jeu avec 3 nœuds de décision et 6 branches
B B
A
Concurrence Entente
(2 ; 2) (15 ; 0) (0 ; 15) (10 ; 10)
Le concept de stratégie d’un joueur
Une stratégie n’est pas une action mais une règle de décision qui spécifie le choix du joueur dans toutes les circonstances dans lesquelles il pourrait avoir à choisir une action.
Elle constitue une planification du choix de ses actions à chacun de ses ensembles d’information.
L’écriture des stratégies constitue l’étape la plus importante dans la résolution du jeu.
La résolution d’un jeu consiste à déterminer les stratégies optimales de chaque joueur compte tenu des anticipations faites sur les choix de tous les joueurs.
Un équilibre en théorie des jeux s’apparente donc à un
ensemble de profil de stratégies mutuellement compatible avec un critère donné.
La recherche d’équilibres
Stratégies dominantes et dominées
Une stratégie Si est strictement (resp. faiblement) dominante pour le joueur i si, quoi que fassent les autres joueurs, Si lui procure un gain supérieur (resp. supérieur ou égal) à toute autre stratégie.
Exemples:
« Prix bas » est une stratégie dominante pour les deux firmes.
Prix bas Prix élevé
Prix bas (300 ; 300) (700 ; 100)
Prix élevé (100 ; 700) (500 ; 500) Peugeot
G D
H (1 ; -1) (-1 ; 1)
M (-1 ; 1) (1 ; -1)
B (-2 ; 5) (-3 ; 2)
Joueur 1
Joueur 2
G D
H (5 ; 1) (4 ; 0)
M (6 ; 0) (3 ; 1)
B (6 ; 4) (4 ; 4)
Joueur 1
Joueur 2
Equilibre de Nash
Couple de stratégies qui constitue un ensemble de meilleurs réponses (pas de déviations mutuellement avantageuses).
H B
H (a ; b) (c ; d)
B (e ; f) (g ; h)
Joueur 1
Joueur 2
On dira que par exemple (H,H) est un équilibre de Nash si :
MR1(H) = H, i.e la MR de J1 quand J2 joue H est H (a > e) MR2(H) = H, i.e la MR de J2 quand J1 joue H est H (b > d)
Exemples:
G M D
H (5 ; 3) (0 ; 4) (3 ; 5)
M (4 ; 0) (5 ; 5) (4 ; 0)
B (3 ; 5) (0 ; 4) (5 ; 3)
Joueur 1
Joueur 2
Choix technologiques : JVC vs Sony
Conquête du marché mondial des magnétoscopes.
Problématique liée à un programme d’investissement dans des nouvelles technologies incompatibles entre elles (VHS pour JVC et BETAMAX pour SONY).
2 équilibres de Nash (VHS ; VHS) et (BETAMAX ; BETAMAX)
VHS BETAMAX
VHS (3 ; 4) (1 ; 2)
BETAMAX (0 ; 0) (2 ; 5)
JVC
Pendant presque 10 ans, les deux entreprises se sont neutralisées. Cependant JVC préparait la victoire VHS en partageant la production de cette technologie avec d’autres entreprises d’électroniques - RCA aux Etats-Unis, Thorn-EMI en GB, Thomson en France, AEG en Allemagne.... et obtenant ainsi une diminution significative des coûts de production. La matrice des gains s’est transformée 10 ans plus tard de la manière suivante:
VHS est ainsi devenue une stratégie dominante pour JVC et ses alliés et SONY ne pouvait que s’aligner, ce qui a été le cas en 1988.
VHS BETAMAX
VHS (12 ; 3) (10 ; 1)
BETAMAX (0 ; 0) (3 ; 3)
JVC et alliés
Dynamique séquentielle et notion de
menace
Comme les joueurs jouent les uns après les autres, ils peuvent introduire dans leurs stratégies la notion de
menace.
On dira que les menaces peuvent être crédible ou non crédible.
Une menace consiste à retenir une décision
contraignante pour un joueur (une punition) si ce dernier retient une décision donnée.
N1
N2
N3
Joueur 1 Joueur 2
N1
N2
N3
Joueur 1 Joueur 2
Equilibres de Nash : E1 = ( H ; (h ; h))
E2 = ( H ; (h ; b)) E3 = ( B ; (b ; h))
(h ; h) (h ; b) (b ; b) (b ; h)
H (4 ; 1) (4 ; 1) (-5 ; 0) (-5 ; 0)
B (2 ; 2) (0 ; 0) (0 ; 0) (2 ; 2)
Joueur 1
E1 = ( H ; (h ; h))
Joueur 1 Joueur 2
(4 ; 1)
Menace crédible
Une stratégie repose sur une menace non crédible s’il existe au moins une action qui la compose qui ne constitue pas une meilleure réponse en un nœud de l’arbre de décision.
On peut donc proposer un raffinement de l’équilibre de Nash qui consiste à éliminer les équilibres reposant sur des menaces non crédibles.
N1
N2
N3
Joueur 1 Joueur 2
(4 ; 1)
Application au problème de l’innovation
Firme 1 : Entreprise innovante et a le choix entre développer deux types de technologies, la technologie 1 (T1) qui est plus innovante et plus coûteuse que la technologie 2 (T2).
Le jeu se déroule de la manière suivante :
La firme 1 choisit la technologie 1 ou 2 et la firme 2 décide de la copier ou non.
On suppose que si la firme 1 choisit la technologie 1 et quelle est copiée par la firme 2, alors la firme 1 est éliminée du marché.
N1
N2
N3
Firme 1 Firme 2
N1
N2
N3
Firme 1 Firme 2
(C ; C) (C ; NC) (NC ; NC) (NC ; C)
T1 (-1 ; 1) (-1 ; 1) (10 ; 2) (10 ; 2)
T2 (3 ; 3) (5 ; 2) (5 ; 2) (3 ; 3)
Firme 1
Firme 2
Equilibres de Nash
E1 = (T1 ; (NC ; NC))
E2 = (T1 ; (NC ; C))
N1
N2
N3
Firme 1 Firme 2
(-1 ; 1)
Equilibres de Nash
E1 = (T1 ; (NC ; NC))
E2 = (T1 ; (NC ; C))
E3 = (T2 ; (C ; C))
Menace non crédible
Menaces crédibles
N1
N2
N3
Firme 1 Firme 2
(-1 ; 1)
Application à une chaîne de montage