Gå till innehåll

Mastersuppsats om lösning för HU-nl vid umeå


Hjort

Recommended Posts

Någon här som skrev: http://www.cs.umu.se/education/examina/Rapporter/RickardAndersson.pdf

 

Är lite nyfiken på ett stycke som verkar smått bisarrt. Nämligen att ena spelaren i en jämnviktslösning viker nötterna 30% av tiden.

 

Jag tittade på stycket, och det är bara summerande och deskriptivt. Några beräkningar finns alltså inte med. Det är besynnerligt för en avhandling. Jag gissar att det absurda resultatet beror på egenheter i den metod som används. Det som eftersöktes var det som lite vilseledande kallas optimal strategi. I de förenklade spelen i Mathematics of Poker redovisas beräkningarna för att ta fram en jämvikt där motståndarna är indifferenta. Det ligger rätt nära vad som i Rickard Anderssons paper kallas 'the normal form' - tror jag, har inte tittat så någa. Men Rickard använder en mer komplex metod med matriser, tydligen så datorstödd och invecklad att han inte ens kan redovisa dem i avhandlingen.

 

Rickards motiv för att det absurda resultatet skulle vara vettigt är fragmentariskt och inkonsekvent.

 

Givetvis ska den som har ambitionen att spela balanserat inte välja fold med nötterna, när alternativen call respektive raise finns kvar. För att det ska finnas en jämvikt måste det finnas alternativ att växla mellan. I sten-sax-påse kan man t ex se fluktuationer när spelare försöker exploatera varandras tendenser ( spela extra mycket sten - bli exploaterad - spela extra lite sten o.s.v). Det är dessa fluktuationer man eliminerar genom att hitta en jämvikt (spela random). Denna jämvikt kan aldrig leda till vinst i längden, utan bara till att man spelar balanserat/optimalt och inte kan exploateras. Men om man söker en jämvikt i ett spel där man har mer information, i detta fall av typen 'nu sitter jag med bästa möjliga hand', kan det inte finnas några vinster att göra genom att spela 'mer balanserat'. Det finns nämligen inget som helst utrymme för motståndaren att exploatera att man hellre gör call eller raise än fold med nötterna.

Länk till kommentar
Dela på andra webbplatser

Någon här som skrev: http://www.cs.umu.se/education/examina/Rapporter/RickardAndersson.pdf

 

Är lite nyfiken på ett stycke som verkar smått bisarrt. Nämligen att ena spelaren i en jämnviktslösning viker nötterna 30% av tiden.

 

Jag har läst igenom det stycket flera gånger men jag förstår fortfarande inte vad det är som medför att det är optimalt att vika 30 % av gångerna.

 

Någon som kan förklara?

Länk till kommentar
Dela på andra webbplatser

på en första blick att den inte säger så mycket då den är simulerad i dator-miljö.

Inte i närheten av den komplexitet en människa (vanligtvis) besitter vad gäller bluffar, slowplay, floating osv..

 

Ser t.ex. att "Caller" har bäst BB/100.

Nog för att man varit med om fiskens tur emellanåt men att en callstation skulle vara vinnare i långa loppet?

 

:shock:

Länk till kommentar
Dela på andra webbplatser

typ att motståndaren inte kan få en read på dig om du även foldar nötterna?

 

1. I en optimal strategi är "reads" värdelösa eftersom man spelar just optimalt.

2. Att folda nötterna kan bara ge en sorts read, jag brukar sätta noten "Praktmongo" eller dylikt och det är allt man behöver veta om spelaren.

 

Jag vill inte kommentera denna uppsats i sak men allmänt verkar det som Master i Umea maste ha svart att hävda sig internationellt.

Länk till kommentar
Dela på andra webbplatser

Ser t.ex. att "Caller" har bäst BB/100.

Nog för att man varit med om fiskens tur emellanåt men att en callstation skulle vara vinnare i långa loppet?

:shock:

 

Det är ju AggroBots resultat mot just Caller, alltsa vinner den 169bb/100 händer, galet mycker med stackar pa 20bb. Han verkar tydligen helt ha glömt bort att programmera in utdragningsfaktorn mot en cs ;).

Länk till kommentar
Dela på andra webbplatser

1. I en optimal strategi är "reads" värdelösa eftersom man spelar just optimalt.

2. Att folda nötterna kan bara ge en sorts read, jag brukar sätta noten "Praktmongo" eller dylikt och det är allt man behöver veta om spelaren.

 

Jag vill inte kommentera denna uppsats i sak men allmänt verkar det som Master i Uppsala maste ha svart att hävda sig internationellt.

 

Tror den klarar sig bättre än den i Umeå :P

Länk till kommentar
Dela på andra webbplatser

Har inte tittat igenom särkilt noga, bara lite svepande på metoder och så.

 

Är verkligen målet med uppsatsen att komma fram till en optimal strategi? Kan ju vara så att det inte är målet som är intressant utan beräkningarna på vägen dit. Alltså att han i de olika momenten visat upp färdigheter som kan vara väldigt svårbesmästrade utan att för den delen kommit fram till en fullständig lösning.

Länk till kommentar
Dela på andra webbplatser

Någon här som skrev: http://www.cs.umu.se/education/examina/Rapporter/RickardAndersson.pdf

 

Är lite nyfiken på ett stycke som verkar smått bisarrt. Nämligen att ena spelaren i en jämnviktslösning viker nötterna 30% av tiden.

 

Antar att man kan dra två slutsatser.

 

1. Samma strategi med skillnaden att man synar i den noden till 100% är också optimalt.

2. noden är ett felspel av den andra spelaren. Ointressant nod helt enkelt. Ett försök att exploatera som inte fungerar trots 30% fold.

Länk till kommentar
Dela på andra webbplatser

Antar att man kan dra två slutsatser.
Nej, man kan inte dra de slutsatserna. Angående 1. så är det alltid bättre att syna nötterna. Angående 2. så är en strategi som presterar likadant som en optimal strategi, bortsett från en nod, inte optimal.
Länk till kommentar
Dela på andra webbplatser

Nej, man kan inte dra de slutsatserna. Angående 1. så är det alltid bättre att syna nötterna. Angående 2. så är en strategi som presterar likadant som en optimal strategi, bortsett från en nod, inte optimal.

 

Klart det är bättre med den dominanta strategin att syna med nötterna mot någon som inte spelar optimalt, men båda strategierna leder till samma jämviktsläge mot någon som spelar optimalt. (dvs båda är "optimala"). Rätt slutsats är inte att det av någon o-intuitiv anledning skulle vara bra att folda nötterna ibland.

 

Rätt slutsats är att det är rent åt helvete fel att direkt gå allin i det där spelet.

 

En annan personlig slutsats från det här forumet är att jag med nödvändighet och trots min ålder måste plussa fantastiskt på poker om jag bara ger det en ärlig chans.

Länk till kommentar
Dela på andra webbplatser

Klart det är bättre med den dominanta strategin att syna med nötterna mot någon som inte spelar optimalt, men båda strategierna leder till samma jämviktsläge mot någon som spelar optimalt. (dvs båda är "optimala"). Rätt slutsats är inte att det av någon o-intuitiv anledning skulle vara bra att folda nötterna ibland.

 

Rätt slutsats är att det är rent åt helvete fel att direkt gå allin i det där spelet.

 

En annan personlig slutsats från det här forumet är att jag med nödvändighet och trots min ålder måste plussa fantastiskt på poker om jag bara ger det en ärlig chans.

 

Det är något som inte verkar stämma här. Men jag förstår inte den matris-metod som använts, så jag vet inte.

 

Om vi söker en jämvikt mot en perfekt fi, får ett resultat och sedan lägger till att fi inte alls är perfekt, utan kan exploateras - vad har vi då fått? Troligen ett absurt resultat, eftersom en av premisserna inte håller. Kanske vi kan uppnå 'samma jämviktsläge' genom att folda nötterna, men vi har ju faktiskt möjligheten att göra en ordentlig vinst i stället. Om motståndaren gör något 'rent åt helvete fel', så är ambitionen att gå +- 0 ( som t ex att spela helt slumpmässigt i sten-sax-påse) inte rationell. Om motståndaren alltid väljer sten, så är det inte rimligt att fortsätta att spela 'balanserat' och välja mellan alternativen helt slumpmässigt. Om man ovanpå detta lägger fram resultatet som en upptäckt att det är 'optimalt' att folda nötterna, så är man väl verkligen ute och cyklar.

Länk till kommentar
Dela på andra webbplatser

Det är något som inte verkar stämma här. Men jag förstår inte den matris-metod som använts, så jag vet inte.

 

Om vi söker en jämvikt mot en perfekt fi, får ett resultat och sedan lägger till att fi inte alls är perfekt, utan kan exploateras - vad har vi då fått? Troligen ett absurt resultat, eftersom en av premisserna inte håller. Kanske vi kan uppnå 'samma jämviktsläge' genom att folda nötterna, men vi har ju faktiskt möjligheten att göra en ordentlig vinst i stället. Om motståndaren gör något 'rent åt helvete fel', så är ambitionen att gå +- 0 ( som t ex att spela helt slumpmässigt i sten-sax-påse) inte rationell. Om motståndaren alltid väljer sten, så är det inte rimligt att fortsätta att spela 'balanserat' och välja mellan alternativen helt slumpmässigt. Om man ovanpå detta lägger fram resultatet som en upptäckt att det är 'optimalt' att folda nötterna, så är man väl verkligen ute och cyklar.

 

Suck. Det där spelet var inget nollsumme-spel. Den som lägger blinden förlorar vid optimalt spel av båda. Genom att den som inte lägger blinden går allin direkt förlorar den som lägger blinden mindre, dvs han som lägger blinden blir inte alls exploaterad.

 

Att den "optimala" spelaren ger en liten bonus (som uppmuntrar till vidare felspel kanske), spelar ingen roll för jämviktsläget. Bonusen får naturligtvis inte vara så stor att den andra spelaren skulle kunna tjäna på det.

 

Tänk dig själv att du efter sju svåra år, får fram en (av flera möjliga) "optimal" strategi. Klart att du vill testa den mot lite enkla strategier för verifikation. T ex testar du mot en spelare som går allin hela tiden för att se hur det går. Ja, precis så är det väl i det här fallet, och som sagt. Att direkt gå allin är väldigt fel i det där spelet.

Det stämmer nog i vanlig poker i många fall också.

 

Säg att ni har 600BB headsup och sb direkt går allin preflop. Smart?

 

EDIT: "suck" går att härleda till min egen oförmåga att uttrycka mig korrekt, och bör inte tolkas annorlunda.

Länk till kommentar
Dela på andra webbplatser

Suck. Det där spelet var inget nollsumme-spel. Den som lägger blinden förlorar vid optimalt spel av båda. Genom att den som inte lägger blinden går allin direkt förlorar den som lägger blinden mindre, dvs han som lägger blinden blir inte alls exploaterad.

 

Att den "optimala" spelaren ger en liten bonus (som uppmuntrar till vidare felspel kanske), spelar ingen roll för jämviktsläget. Bonusen får naturligtvis inte vara så stor att den andra spelaren skulle kunna tjäna på det.

 

Tänk dig själv att du efter sju svåra år, får fram en (av flera möjliga) "optimal" strategi. Klart att du vill testa den mot lite enkla strategier för verifikation. T ex testar du mot en spelare som går allin hela tiden för att se hur det går. Ja, precis så är det väl i det här fallet, och som sagt. Att direkt gå allin är väldigt fel i det där spelet.

Det stämmer nog i vanlig poker i många fall också.

 

Säg att ni har 600BB headsup och sb direkt går allin preflop. Smart?

 

Jag ger upp. Jag förstår inte ditt resonemang. Det kan ju stämma, men jag hittar inget vettigt att tolka, inga klargjorda reflektioner i ämnet varken i dina tre försvarande inlägg eller i originalet (avhandlingen). Förstår inte vad te x 'uppmuntrar till vidare felspel' ö.h.t har för relevans.

Länk till kommentar
Dela på andra webbplatser

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Gäst
Svara i detta ämne...

×   Du har klistrat in innehåll med formatering.   Ta bort formatering

  Endast 75 max uttryckssymboler är tillåtna.

×   Din länk har automatiskt bäddats in.   Visa som länk istället

×   Ditt tidigare innehåll har återställts.   Rensa redigerare

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Skapa nytt...