Qual é a relação entre um equilíbrio perfeito entre sub-jogos e um equilíbrio de nash?

Um equilíbrio de Nash é uma combinação de estratégias para todos os jogadores em um jogo em que cada jogador está jogando a melhor resposta à estratégia real do outro jogador, o que significa que cada jogador, agindo isoladamente, não pode obter um resultado melhor por si mesmo, alterando sua estratégia. , dada a estratégia adotada por cada jogador. Um equilíbrio de Nash perfeito no sub-jogo é um equilíbrio de Nash com a restrição adicional de que cada decisão individual na estratégia de um jogador seria a que obtém o melhor resultado, incluindo as decisões que nunca surgem na prática, dadas as estratégias que estão sendo jogadas. (essas são chamadas decisões "fora do caminho do equilíbrio" na linguagem da teoria dos jogos). Todos os equilíbrios perfeitos do sub-jogo são equilíbrios de Nash, mas o inverso não é verdadeiro. Uma maneira mais compreensível de descrever os equilíbrios perfeitos do sub-jogo são os equilíbrios onde "todas as ameaças dos jogadores são credíveis".

Uma coisa importante sobre a análise de equilíbrio para entender é que, para analisar se um jogo está em equilíbrio, é preciso saber que decisão um jogador planeja tomar em todos os pontos de decisão que possam ocorrer - incluindo os que não praticam na prática. . Os teóricos dos jogos definem uma 'estratégia' para um jogador dessa maneira - uma descrição das ações que o jogador executará em todas as circunstâncias possíveis.

A questão da perfeição de sub-jogo é mais aparente em jogos seqüenciais. Veja o seguinte exemplo de jogo com a Guerra Fria:

Existem dois jogadores, um presidente P e um secretário do partido S. P tem a primeira escolha - eles podem iniciar instigações ou não. Se eles não instigam, o jogo termina e P e S recebem uma recompensa de 0. Se P instigar, então S terá uma escolha. S pode escalar ou recuar. Se S recuar, o jogo acaba, S perde reputação (perde 5 pontos) e P ganha reputação (ganha 5 pontos). Se S aumentar, P terá uma decisão final - recuar ou iniciar uma guerra nuclear. Se P recuar nesse ponto, P parece fraco e perde 8 pontos e S ganha 8 pontos. Se P começa a guerra nuclear, o mundo inteiro sofre - ambos os lados perdem 10 pontos.

Considere o seguinte conjunto de estratégias: A estratégia de P é instigar no primeiro ponto de decisão e iniciar uma guerra nuclear no terceiro ponto de decisão; A estratégia de S é recuar no segundo ponto de decisão. Na prática, com esse conjunto de estratégias, P instigará, S recuará e o jogo terminará com P ganhando 5 pontos e S perdendo 5 pontos.

Isso é um equilíbrio de Nash? Se P mudar sua primeira opção para não instigar, eles obterão 0 em vez de +5 e, se mudarem sua opção posterior, o resultado permanecerá inalterado (+5 vs. +5). Se S mudar sua única opção de escalar, isso levará à guerra nuclear; portanto, essa mudança de estratégia resultaria em -10 para S em vez de -5. Então, sim, é um equilíbrio de Nash: cada jogador considerado isoladamente não pode melhorar seu próprio resultado alterando um aspecto de sua estratégia.

Este é um equilíbrio perfeito de Nash no sub-jogo? Se chegarmos ao ponto de decisão em que P pode optar por recuar ou disparar as armas nucleares, a melhor opção de P não seria o que sua estratégia indica - eles podem recuar e marcar -8 em vez de disparar as armas nucleares e marcar -10. Portanto, eles não estão tomando a melhor decisão em cada ponto de decisão; não é um equilíbrio perfeito do sub-jogo.

Observe que, se simplesmente mudássemos a estratégia de P para (instigar no estágio 1, recuar no final), agora não temos mais um equilíbrio de Nash: S poderia mudar sua estratégia para aumentar em vez de recuar e obter uma pontuação mais alta.

A boa notícia é que geralmente é mais fácil encontrar o equilíbrio perfeito do sub-jogo para a maioria dos jogos simples, trabalhando para trás. Como sabemos que cada decisão individual precisa ser economicamente racional, podemos começar na última decisão e observar as trocas disponíveis diretamente para os jogadores. Por exemplo, neste jogo, como dissemos acima, se chegarmos à última decisão, P escolheria não disparar as armas nucleares no equilíbrio perfeito do sub-jogo. Isso significa que, da perspectiva de S, a recompensa de levar o jogo à decisão final de P é +8, pois é para isso que a escolha 'racional' de P levaria. Isso significa que a melhor estratégia da S é escalar no ponto de decisão. Agora aplicamos a mesma lógica mais uma vez à primeira decisão de P: se eles instigarem, S aumentará e P terá que recuar, para que P ganhe -8. Isso é pior do que o zero que eles obtêm se não instigarem, então eles escolheriam não aumentar. Assim, o equilíbrio perfeito de Nash no sub-jogo é (P: não instiga, não dispara armas nucleares; S: escalada).

Observe que, neste exemplo, qual conceito de equilíbrio que usamos muda drasticamente o resultado que esperamos que ocorra! Se desconsiderarmos a ameaça de P de lançar armas nucleares como irracional, concluímos que elas não serão instigadas em primeiro lugar. Se não o fizermos, esperamos que eles sejam instigados. Normalmente, o equilíbrio perfeito de Nash no sub-jogo reflete mais de perto o que esperamos ver na vida real, mas nem sempre: se um jogador é capaz de se comprometer publicamente com uma estratégia que de outra forma parece irracional (comprometendo-se a lançar as armas nucleares à la Strangelove neste exemplo), isso pode mudar o resultado (embora, estritamente falando, se incorporarmos esse compromisso no jogo, alteramos as regras do jogo).