GTO? Ou melhor, GT-não!

Hoje vamos desmistificar 4 mitos sobre teoria ótima de jogo, ou GTO!

Com insights do Ryan Fee e o aclamado escritor de poker Matthew Janda (do novo modulo de GTO para o Upswing Lab), estamos determinados a clarear esses conceitos errados de uma vez por todas.

Uma estratégia GTO é uma estratégia que não consegue ser ganha a longo prazo, independente de como seu oponente jogue.

Mito #1: Os maiores jogadores de poker do mundo usam estratégia GTO

A estratégia GTO para No Limit Hold’em existe, mas ainda não é sabido por nenhum humano, ou computador. O jogo é muito complicado e ainda não foi resolvido. Jogos de poker menos complexos, como heads-up Limit Hold’em já foram resolvidos (ou pelo menos o essencial).

GTO se tornou uma palavra sinônimo de qualquer coisa desde “melhor estratégia” a “bom” dependendo do jogador. Talvez você escute alguém descrever seu jantar como GTO ou ainda ter um cachorro como “GTO”.

Nota do tradutor: quando se diz “ter um cachorro é GTO” isso se dá no pelo fato de que ter um cachorro é bom para sua saúde emocional e, portanto, é “gto” pois te ajuda a jogar melhor e etc.

Quando você ouve as pessoas conversando sobre estratégia GTO, eles provavelmente querem dizer uma estratégia de jogo baseada em teoria. Ate veteranos no jogo erram nisso.

Dito isso, nós acreditamos que alguns conceitos de GTO são úteis para as partes simples do jogo, e nós recomendamos usar elas para construir sua estratégia base. Antes de dar mais detalhes, vamos começar a desvendar os 4 mitos de GTO.

Mito #2: Uma estratégia GTO sempre escolherá a linha mais lucrativa

Errado. A estratégia GTO é aquela que explora ao máximo um “oponente onisciente”. Isto é, quando um jogador sabe exatamente tudo que o outro jogador faria com cada mão, a solução GTO é aquela que explora ao máximo – com contra estratégias – a estratégia do adversário até chegar no “equilíbrio de nash”. Equilíbrio de nash é o ponto de um jogo em que nenhum adversário consegue mudar a opção estratégia, sem perder recompensa (que no caso do poker é EV).

Então você poderia dizer, mas isso não é a solução amis lucrativa? Sim, se você estiver no vácuo, jogando contra um computador.

A questão é que durante o jogo não estamos jogando contra máquinas e sim contra seres humanos que, de acordo com suas personalidades, conhecimentos e estados emocionais, implementam certas estratégias ao longo do tempo.

Vejamos um exemplo conceitual: um software que oferece soluções ótimas para a interação entre dois ranges, a priori vai blefar em todas as streets, se você estiver jogando contra um adversário que nunca folda no river, você blefaria? Seria prudente que não. O inverso é verdadeiro, se você está jogando contra um adversário que folda mais do que ele deveria – de acordo com a frequência mínima de defesa – porque não blefar sempre?

Logo esse mito é um mito porque está for a de contexto. A solução GTO é a mais lucrative, contra um adversário que joga perfeitamente. Contra um adversário que joga de forma falha, queremos jogar de forma a explorar tais falhas. Os solvers são boas ferramentas para nos ajudar a encontrar um bom ajuste, através dos nodelockes.

Todavia não precisamos de um canhão para matar uma formiga. Por exemplo: se você sabe que a população blefa menos que deveria (“underblefa”) em flops monotônicos, um ajuste seria foldar todas suas mãos que não sejam flushs no river contra um triple barrel em board monotônico. Isso seria um ajuste explorável em sua estratégia de defesa.

Entretanto, jogadas exploráveis (que visam, por definição, atacar os desvios do adversário em relação a solução perfeita) tem seus pontos negativos. Os dois principais são:

  1. Alguns exploits estarão errados (e isso geralmente custará muito valor esperado), uma vez que faremos pressuposições equivocadas sobre o real comportamento do adversário.
  2. Sempre que você explorar você estará abrindo brecha para ser explorado.

Nota do Tradutor

uma analogia que desenhei para entender isso foi a seguinte -> imagine que a interação entre dois jogadores é como uma luta entre dois gladiadores. Cada um tem uma espada e um escudo. A estratégia GTO é aquela que ataca com a espada na mão direita e ao mesmo tempo levanta o escudo e se protege com a mão esquerda. Quando você sabe que seu adversário nunca te contra ataca pela esquerda, você larga o escudo e segura a espada com as duas mãos, então infere um golpe mais forte e causa mais dano no adversário. Porém, se seu adversário ver isso você estará muito vulnerável.

Evidente que emu ma luta, mano a mano, de gladiadores isso seria ridículo, pois imediatamente o outro oponente daria um contra golpe. Felizmente, no poker isso não acontece, pois ele não está vendo o que estamos fazendo.

Traduzindo isso para uma situação concreta, vamos considera um exemplo. Estamos jogando online contra um regular, e temos uma enorme base de dados de mãos que mostra que ele dá fold do SB contra 3-bets. Contra este jogador, somos incentivados a 3-bet do BB de forma agressiva, pois sabemos que o SB dará fold normalmente.

No entanto, ao fazer esse ajuste, nós nos tornamos desequilibrados e abertos a ser explorados. Caso tivermos sorte o adversário não notará que estamos atacando uma fraqueza dele, que poderia facilmente ser contra atacadas com várias 4bets lights.

Mito 3: “Você deve ser um mestre da matemática para usar uma estratégia influenciada pela solução ótima”

Obviamente, há matemática envolvida em um jogo de poker ideal, mas você não precisa ser um especialista em matemática para entender melhor o assunto.

Quase todos os cálculos que você precisa saber envolvem operações simples – não há necessidade de álgebra ou equações lineares e não há notação assustadora. As fórmulas mais usadas estão disponíveis online. Por exemplo, você pode ler sobre duas das peças mais importantes para uma estratégia baseada em teoria dos jogos aqui: calculando pot odds e frequências mínimas de defesa .

Trabalhando essas coisas como pot odds e frequências de call ficam mais fácil com a experiência. Em breve, será uma segunda natureza e você dificilmente precisará pensar neles!

Por exemplo, a fórmula para calcular a proporção ótima de apostas de valor/blefes que você precisa com base no tamanho da sua aposta é simples e pode ser rapidamente memorizada. Digamos que estamos heads-up e apostamos $100 em um pote de $200 no river, dando ao nosso oponente uma chance de 3 para 1 em um call. Neste caso, o nosso range de apostas deve consistir em 75% de mãos de valor e 25% de blefes para tornar seus bluff- catchers indiferentes a call ou fold (o melhor que eles podem fazer é empatar).

Essa relação muda dependendo do tamanho da nossa aposta. Aqui está uma tabela com alguns dos tamanhos de aposta mais comuns para ajudá-lo a lembrar-se deles:

  

Tamanho da Aposta

         Aposta de valor para o índice de blefe

2x pot

2 blefes para cada 3 combinações de valor

1x pot

1 blefe para cada 2 combinações de valor

0.75 pot

3 blefes para cada 7 combinações de valor

0.5 pot

1 blefe para cada 3 combinações de valor

Como a tabela acima mostra quanto menor apostarmos, mais mãos de valor precisamos ter, e quanto maior apostamos, mais devemos blefar.

Nota do tradutor

Se quer entender mais sobre os conceitos essenciais do poker, convido você a conhecer o CEP.

Mito #4: “Não adianta aprender GTO já que uma estratégia explorável tem um potencial de lucro maior”

Embora já tenhamos estabelecido que um estilo explorável eficaz renderá mais valor esperado (EV) do que uma estratégia de GTO, isso não significa que você deva desconsiderar o GTO. Muito pelo contrário.

Jogar de uma forma equilibrada e ideal é melhor quando você sabe pouca ou nenhuma informação sobre seus oponentes. Geralmente, são necessárias milhares de mãos para que você possa detectar com segurança possíveis pontos exploráveis em outras pessoas, por isso é aconselhável empregar uma estratégia de linha de base que proteja você de ser explorado enquanto coleta essas informações. Quando você captar ajustes em potencial, então, planeje uma contra-estratégia e sinta-se à vontade para desviar-se de sua estratégia inicial.

Além disso, uma boa compreensão dos conceitos do GTO ajudará você a identificar potenciais explorações nos jogos de seus oponentes. Se você é bem familiarizado em como deve ser uma estratégia ideal, então será capaz de identificar claramente quando um jogador está se desviando dele e saber como puni-lo de acordo.

Tempo para o GT-Go

A estratégia do GTO é um tópico complexo que merece mais atenção do que a que apresentamos aqui hoje, mas esperamos que tenha esclarecido algumas das confusões mais comuns.

 

Artigo escrito por George Mathias em 27 de Fevereiro de 2019, para a Upswing.

Traduzido e Adaptado por Luigi Soncin, para a ROYALpag.