Gå till innehåll

KimHartman

Members
  • Innehåll Antal

    188
  • Gick med

  • Besökte senast

Allt postat av KimHartman

  1. Innan du funderar över om en linjär approximation är rimlig eller inte, fundera över varför det du kallar effektivt antal BB i stacken öhv ska vara en kontinuerlig funktion av A.
  2. För 27 kort är upplägget fö också informationsmaximerande.
  3. Det låter otroligt att det skulle vara vanligt förekommande att förändringar i blinds/stack förhållande för framtida händer/rundor drar ner ens framtida hand/runda-EV så mkt att man tycker det är ok att ta -EV lägen tidigare.
  4. Räcker att du mixar upp det lite då och då.
  5. Jag säger inte att det är rätt att höja till 6bb med AQ just här, men varför kan man inte höja olika mycket med olika händer i olika situationer?
  6. Räcker att åka till Limhamn.. http://www.youtube.com/watch?v=0R7CCV2ZO2U
  7. Jag har aldrig trott på riggen innan, men iochmed detta går det ju inte blunda längre. Skål!
  8. Antag två spelare, A och B, samt två "runnings", 1 och 2. Låt oss kalla händelsen att A vinner run 1 för A1, och övriga händelser enligt samma notation. Eftersom paren A1,B1 och A2,B2 är disjunkta och täcker hela utfallsrummet gäller P(A2) = P(A2|A1) + P(A2|B1) P(A1) = P(A1|A2) + P(A1|B2) Eftersom vi är fria att köra run 2 före run 1 (ska vi vara praktiskt petiga kan vi ju plocka ut de aktuella korten utan att titta på dom) gäller pga av symmetriskäl att P(A2|A1) = P(A1|A2) och P(A2|B1) = P(A1|B2), vilket ger P(A2) - P(A1) = 0 och på samma sätt P(B2) - P(B1) = 0 Alltså är verkligen P(A1) = P(A2) och P(B1) = P(B2)
  9. Carl Hostrup?
  10. Så du förutsätter att det blir rundcheck på turn även om nån sätter färgen. Om nån av dom hade betat, hade du kastat då? (förutsatt att beten inte är så liten att du odds för ditt redraw)
  11. Har nån av dom färgdraget oftare än riktigt sällan (och det lär nån av dom ha) måste du ju straffa dom genom att höja floppen. Fanns inte flushdraget med i din blid av deras HD?
  12. Helt klart är det så man ska se det. Det är ju den typen av resonemang som "bakåtspolat" leder till vad som är optimalt preflop. Det är såklart också sant att ju fler beslut man ställs för i en hand, dessto större chans är det att man gör ett dominerat val. Jag kan tänka mej att "bra spelare" som ställs inför ett val som har "mixade lösningar" har en bra känsla för att välja den den av trädet som i fortsättningen av handen minskar risken för att begå dominerade val.
  13. Ett av skälen att vilja limpa från knappen måste ju vara att inte sabba implicita odds för typ små sc och liknande. Frågan är om värdet man vinner på detta väger upp det värde man förlorar på att tvingas balansera limparna med stål. Helt klart är att stackstorlekar måste spela in, och att en optimal jämnviktsstrategi måste se olika ut för olika stackstorlekar. För övrigt finns det inget som säger att det inte existerar flera jämnviktsstrategier, vissa som inbegriper limpande, och andra som inte gör det.
  14. fel tråd
  15. I NL har man ju ofta oändligt många möjligheter. Om en bet på $10 ingår i en eq-strat., är det svårt att tänka sig att en bet på $10.1 inte gör det, osv. Så om det existerar mixade NL-strategier, bör dom ju innehålla nån sannolikhetsfördelning som man använder för att välja bet sizes. Om det finns stora intervall där sannolihetstäthetsfunktionen > 0, bör man ju kunna komma undan billigt i många fall som människa mot en eq.-strat.
  16. En annan intressant grej är att fundera över hur mixade strategier kan se ut i NL. Det känns ju spontant som om man kan "träffa rätt" ganska ofta om sånna strategier inte är diskreta.
  17. Ungefär så som jag tänkte. Han strategi är ju framtagen under förutsättningen att vi spelar med optimala frekvenser. Om vi struntar i att göra det riskerar vi inget eftersom han vägrar att frångå sin stil.
  18. Hitta ett paper till som håller med det första: http://www.dudziak.com/dudziak-fictitious_play.pdf Tyvärr är det inte så mycket "kött" på argumentationen, men det verkar tydligen som om det är stämmer. Notera att ref [2] är till den fösta avhandlingen. från sid 2: The key disadvantage of playing an optimal strategy is that the optimal play only accrues an advantage over opponents only when opponents make dominated errors. For example: if there are three choices facing a human player at a given decision node, and the optimal strategy states to play choice A 20% of the time, choice B 0% of the time, and choice C 80% of the time; if the human player were to choose action B, then that would be a dominated mistake, and the optimal opponent would gain an advantage. However, if the opponent were to choose A or C at any frequency (0%-100% of the time), this is a strategic error known as a non-dominated error; though this strategy may be suboptimal, an optimal player will be unable to gain any advantage from this behavior. An Example to Illustrate the Properties of Nash Equilibria and Dominated/Non-Dominated Error: The game Rock-Paper-Scissors (paper beats rock, rock beats scissors, scissors beats paper), has a remarkably simple optimal solution: play rock with 1/3 probability, paper with 1/3 probability, and scissors with 1/3 probability. Using Rock-Paper-Scissors, it should be apparent that a strategy of ‘always play rock’, is not a preferred solution. However, if playing against an optimal opponent, the strategy will not incur any penalties since the player will continue to win 1/3 of the time, lose 1/3 and tie 1/3. This is an illustration of non-dominated error. The player is not playing by the rules of the optimal solution, however since the optimal solution involves non-zero probabilities of playing rock/paper/scissors, any strategy involving those elements will not sustain any penalty when playing against an optimal opponent. A fourth element can be added to this game to demonstrate dominated error. We can call the game Rock-Paper-Scissors-Dynamite (the only change to the rules is that dynamite beats rock, and is beaten by paper or scissors). The optimal strategy given these rules is: play rock with 1/3 probability, paper with 1/3 probability, scissors with 1/3 probability, and dynamite with 0 probability. If playing against an optimal opponent and the decision is made to play dynamite, this incurs a dominated error, and the projected winnings from the game will decrease as result. After this example, it seems that playing dominated errors should be a rare occurrence in games, since the decision seems so clear cut. However, testing has shown that in complicated games, especially games of imperfect information, dominated errors occur often enough (even among pseudo-optimal players), that if played over the long-term, weaknesses in strategy are evident [2].
  19. Jag måste helt enkelt fundera på detta..
  20. Eller så är det kanske logiskt. "Mixandet" är ju till för att dölja information, för att göra det omjöligt för sin motståndare att hitta ett alternativ som är bättre än något annat. Med en datormotståndare som ändå inte gör nån "opponent modeling" spelar det ju ändå ingen roll om man själv är förutsägbar.
  21. Tål definitivt att tänkas på. Jag köper att felet inte är lika allvarligt. Men som du säger, det står ju i pincip att man inte gör fel alls, vilket verkar märkligt.
  22. Jag är osäker på hur många beslut som är "rena" och hur många som är mixade, och det beror säkert på vilken form av poker man spelar. THFL FR eller extrem shortstack har säkert mindre andel mixade jämfört med djupstackad THNL (jag gissar bara). Hursomhelst påpekar författarna att på flera ställen att just mixade strategier är nödvändigt mot vad de kallar "advanced players" och när det granskar spelet mellan sina botar och duktiga människor är det tydligen just där det brister. Bottarna spelar fö THFL HU. Helt säkert är iaf att folk kommer begå misstag förr eller senare, "human master" eller inte..
  23. Absolut, men optimal strategi innehåller mixade/randomiserade beslut (eftersom poker är ett spel utan fullständig information). Det går att hitta på enkla fall där tex ett uppenbart drag sitter eller inte sitter på river, som kräver en mixad strategi för att inte släppa info. Just på grund av att den optimala strategin, eller en av de optimala strategierna, är mixad(e) kan en bra spelare unvika många dominerade fel.
  24. Drar upp denna igen: http://www.cs.ualberta.ca/~darse/Papers/billings-phd.pdf från s. 111 In a simple game like RoShamBo (also known as Rock-Paper-Scissors), playing the equilibrium strategy ensures a break-even result, regardless of what the opponent does, and is therefore insufcient to defeat weak opponents, or to win a tournament ([2, 1]). Poker is more complex, and in theory an equilibrium player can win, but only if the opponent makes dominated errors. Any time a player makes any choice that is part of a randomized mixed strategy of any game-theoretic equilibrium policy, that decision is not dominated. In other words, it is possible to play in a highly sub-optimal manner, but still break even against an equilibrium player, because those choices are not strictly dominated. Since the pseudo-optimal strategies do no opponent modeling, there is no guarantee that they will be especially effective against very bad or highly predictable players. They must rely only on these fundamental strategic errors, and the margin of victory might be relatively modest as a result. The critical question is whether such errors are common in practice. There is no denitive answer to this question yet, but preliminary evidence suggests that dominated errors occur often enough to gain a measurable EV advantage over weaker players, but may not be very common in the play of very good players.
×
×
  • Skapa nytt...