Mastersuppsats om lösning för HU-nl vid umeå

Hjort · 8 Maj , 2008

Någon här som skrev: http://www.cs.umu.se/education/examina/Rapporter/RickardAndersson.pdf

Är lite nyfiken på ett stycke som verkar smått bisarrt. Nämligen att ena spelaren i en jämnviktslösning viker nötterna 30% av tiden.

gulapa · 8 Maj , 2008

Galet kul om den har gått igenom :-D

gulapa · 8 Maj , 2008

Galet kul om den har gått igenom

FMP

Galet kul att den gått igenom :-D

folder · 8 Maj , 2008

Är det det som kallas för bluffold?

sulla · 8 Maj , 2008

Orkar inte läsa den nu, ska vänta och se vad jag kan få ut av detta kl 05 på söndagmorgon efter att bakfyllan börjar slå in.

Matfrid · 8 Maj , 2008

Någon här som skrev: http://www.cs.umu.se/education/examina/Rapporter/RickardAndersson.pdf

Är lite nyfiken på ett stycke som verkar smått bisarrt. Nämligen att ena spelaren i en jämnviktslösning viker nötterna 30% av tiden.

Jag tittade på stycket, och det är bara summerande och deskriptivt. Några beräkningar finns alltså inte med. Det är besynnerligt för en avhandling. Jag gissar att det absurda resultatet beror på egenheter i den metod som används. Det som eftersöktes var det som lite vilseledande kallas optimal strategi. I de förenklade spelen i Mathematics of Poker redovisas beräkningarna för att ta fram en jämvikt där motståndarna är indifferenta. Det ligger rätt nära vad som i Rickard Anderssons paper kallas 'the normal form' - tror jag, har inte tittat så någa. Men Rickard använder en mer komplex metod med matriser, tydligen så datorstödd och invecklad att han inte ens kan redovisa dem i avhandlingen.

Rickards motiv för att det absurda resultatet skulle vara vettigt är fragmentariskt och inkonsekvent.

Givetvis ska den som har ambitionen att spela balanserat inte välja fold med nötterna, när alternativen call respektive raise finns kvar. För att det ska finnas en jämvikt måste det finnas alternativ att växla mellan. I sten-sax-påse kan man t ex se fluktuationer när spelare försöker exploatera varandras tendenser ( spela extra mycket sten - bli exploaterad - spela extra lite sten o.s.v). Det är dessa fluktuationer man eliminerar genom att hitta en jämvikt (spela random). Denna jämvikt kan aldrig leda till vinst i längden, utan bara till att man spelar balanserat/optimalt och inte kan exploateras. Men om man söker en jämvikt i ett spel där man har mer information, i detta fall av typen 'nu sitter jag med bästa möjliga hand', kan det inte finnas några vinster att göra genom att spela 'mer balanserat'. Det finns nämligen inget som helst utrymme för motståndaren att exploatera att man hellre gör call eller raise än fold med nötterna.

Playboy · 8 Maj , 2008

Någon här som skrev: http://www.cs.umu.se/education/examina/Rapporter/RickardAndersson.pdf

Är lite nyfiken på ett stycke som verkar smått bisarrt. Nämligen att ena spelaren i en jämnviktslösning viker nötterna 30% av tiden.

Jag har läst igenom det stycket flera gånger men jag förstår fortfarande inte vad det är som medför att det är optimalt att vika 30 % av gångerna.

Någon som kan förklara?

Playboy · 8 Maj , 2008

Text.

typ att motståndaren inte kan få en read på dig om du även foldar nötterna?

gdaily · 8 Maj , 2008

Kan ingen klaga hos examinatorn?

Nidson · 8 Maj , 2008

Jag vet vem han är, har träffat honom några gånger. Tror han spelar en lite poker, men är tveksam till om han hänger här något.

xplosivo · 8 Maj , 2008

på en första blick att den inte säger så mycket då den är simulerad i dator-miljö.

Inte i närheten av den komplexitet en människa (vanligtvis) besitter vad gäller bluffar, slowplay, floating osv..

Ser t.ex. att "Caller" har bäst BB/100.

Nog för att man varit med om fiskens tur emellanåt men att en callstation skulle vara vinnare i långa loppet?

:shock:

lok123 · 8 Maj , 2008

typ att motståndaren inte kan få en read på dig om du även foldar nötterna?

1. I en optimal strategi är "reads" värdelösa eftersom man spelar just optimalt.

2. Att folda nötterna kan bara ge en sorts read, jag brukar sätta noten "Praktmongo" eller dylikt och det är allt man behöver veta om spelaren.

Jag vill inte kommentera denna uppsats i sak men allmänt verkar det som Master i Umea maste ha svart att hävda sig internationellt.

lok123 · 8 Maj , 2008

Ser t.ex. att "Caller" har bäst BB/100.

Nog för att man varit med om fiskens tur emellanåt men att en callstation skulle vara vinnare i långa loppet?

Det är ju AggroBots resultat mot just Caller, alltsa vinner den 169bb/100 händer, galet mycker med stackar pa 20bb. Han verkar tydligen helt ha glömt bort att programmera in utdragningsfaktorn mot en cs .

Solidify · 8 Maj , 2008

1. I en optimal strategi är "reads" värdelösa eftersom man spelar just optimalt.
2. Att folda nötterna kan bara ge en sorts read, jag brukar sätta noten "Praktmongo" eller dylikt och det är allt man behöver veta om spelaren.

Jag vill inte kommentera denna uppsats i sak men allmänt verkar det som Master i Uppsala maste ha svart att hävda sig internationellt.

Tror den klarar sig bättre än den i Umeå

lok123 · 8 Maj , 2008

Tror den klarar sig bättre än den i Umeå

Jepp, definitivt, jag ändrade nu, läste rätt men skrev fel.

Sideshow · 8 Maj , 2008

Balansera riverspelet genom att bluffsyna och folda nöten är ju... nöten

CopShootCop · 10 Maj , 2008

Har inte tittat igenom särkilt noga, bara lite svepande på metoder och så.

Är verkligen målet med uppsatsen att komma fram till en optimal strategi? Kan ju vara så att det inte är målet som är intressant utan beräkningarna på vägen dit. Alltså att han i de olika momenten visat upp färdigheter som kan vara väldigt svårbesmästrade utan att för den delen kommit fram till en fullständig lösning.

Hjort · 10 Maj , 2008

Är verkligen målet med uppsatsen att komma fram till en optimal strategi?

Poängen var att använda något linjär programmeringstjosan för att lösa problemet, så är ju inte bara resultatet som är relevant.

honest99 · 15 Maj , 2008

Någon här som skrev: http://www.cs.umu.se/education/examina/Rapporter/RickardAndersson.pdf

Är lite nyfiken på ett stycke som verkar smått bisarrt. Nämligen att ena spelaren i en jämnviktslösning viker nötterna 30% av tiden.

Antar att man kan dra två slutsatser.

1. Samma strategi med skillnaden att man synar i den noden till 100% är också optimalt.

2. noden är ett felspel av den andra spelaren. Ointressant nod helt enkelt. Ett försök att exploatera som inte fungerar trots 30% fold.

Hjort · 15 Maj , 2008

Antar att man kan dra två slutsatser.

Nej, man kan inte dra de slutsatserna. Angående 1. så är det alltid bättre att syna nötterna. Angående 2. så är en strategi som presterar likadant som en optimal strategi, bortsett från en nod, inte optimal.

honest99 · 16 Maj , 2008

Nej, man kan inte dra de slutsatserna. Angående 1. så är det alltid bättre att syna nötterna. Angående 2. så är en strategi som presterar likadant som en optimal strategi, bortsett från en nod, inte optimal.

Klart det är bättre med den dominanta strategin att syna med nötterna mot någon som inte spelar optimalt, men båda strategierna leder till samma jämviktsläge mot någon som spelar optimalt. (dvs båda är "optimala"). Rätt slutsats är inte att det av någon o-intuitiv anledning skulle vara bra att folda nötterna ibland.

Rätt slutsats är att det är rent åt helvete fel att direkt gå allin i det där spelet.

En annan personlig slutsats från det här forumet är att jag med nödvändighet och trots min ålder måste plussa fantastiskt på poker om jag bara ger det en ärlig chans.

tok_junior · 16 Maj , 2008

En annan personlig slutsats från det här forumet är att jag med nödvändighet och trots min ålder måste plussa fantastiskt på poker om jag bara ger det en ärlig chans.

Hur resonerar du nu?

Matfrid · 16 Maj , 2008

Klart det är bättre med den dominanta strategin att syna med nötterna mot någon som inte spelar optimalt, men båda strategierna leder till samma jämviktsläge mot någon som spelar optimalt. (dvs båda är "optimala"). Rätt slutsats är inte att det av någon o-intuitiv anledning skulle vara bra att folda nötterna ibland.

Rätt slutsats är att det är rent åt helvete fel att direkt gå allin i det där spelet.

En annan personlig slutsats från det här forumet är att jag med nödvändighet och trots min ålder måste plussa fantastiskt på poker om jag bara ger det en ärlig chans.

Det är något som inte verkar stämma här. Men jag förstår inte den matris-metod som använts, så jag vet inte.

Om vi söker en jämvikt mot en perfekt fi, får ett resultat och sedan lägger till att fi inte alls är perfekt, utan kan exploateras - vad har vi då fått? Troligen ett absurt resultat, eftersom en av premisserna inte håller. Kanske vi kan uppnå 'samma jämviktsläge' genom att folda nötterna, men vi har ju faktiskt möjligheten att göra en ordentlig vinst i stället. Om motståndaren gör något 'rent åt helvete fel', så är ambitionen att gå +- 0 ( som t ex att spela helt slumpmässigt i sten-sax-påse) inte rationell. Om motståndaren alltid väljer sten, så är det inte rimligt att fortsätta att spela 'balanserat' och välja mellan alternativen helt slumpmässigt. Om man ovanpå detta lägger fram resultatet som en upptäckt att det är 'optimalt' att folda nötterna, så är man väl verkligen ute och cyklar.

honest99 · 16 Maj , 2008

Det är något som inte verkar stämma här. Men jag förstår inte den matris-metod som använts, så jag vet inte.

Om vi söker en jämvikt mot en perfekt fi, får ett resultat och sedan lägger till att fi inte alls är perfekt, utan kan exploateras - vad har vi då fått? Troligen ett absurt resultat, eftersom en av premisserna inte håller. Kanske vi kan uppnå 'samma jämviktsläge' genom att folda nötterna, men vi har ju faktiskt möjligheten att göra en ordentlig vinst i stället. Om motståndaren gör något 'rent åt helvete fel', så är ambitionen att gå +- 0 ( som t ex att spela helt slumpmässigt i sten-sax-påse) inte rationell. Om motståndaren alltid väljer sten, så är det inte rimligt att fortsätta att spela 'balanserat' och välja mellan alternativen helt slumpmässigt. Om man ovanpå detta lägger fram resultatet som en upptäckt att det är 'optimalt' att folda nötterna, så är man väl verkligen ute och cyklar.

Suck. Det där spelet var inget nollsumme-spel. Den som lägger blinden förlorar vid optimalt spel av båda. Genom att den som inte lägger blinden går allin direkt förlorar den som lägger blinden mindre, dvs han som lägger blinden blir inte alls exploaterad.

Att den "optimala" spelaren ger en liten bonus (som uppmuntrar till vidare felspel kanske), spelar ingen roll för jämviktsläget. Bonusen får naturligtvis inte vara så stor att den andra spelaren skulle kunna tjäna på det.

Tänk dig själv att du efter sju svåra år, får fram en (av flera möjliga) "optimal" strategi. Klart att du vill testa den mot lite enkla strategier för verifikation. T ex testar du mot en spelare som går allin hela tiden för att se hur det går. Ja, precis så är det väl i det här fallet, och som sagt. Att direkt gå allin är väldigt fel i det där spelet.

Det stämmer nog i vanlig poker i många fall också.

Säg att ni har 600BB headsup och sb direkt går allin preflop. Smart?

EDIT: "suck" går att härleda till min egen oförmåga att uttrycka mig korrekt, och bör inte tolkas annorlunda.

Matfrid · 16 Maj , 2008

Suck. Det där spelet var inget nollsumme-spel. Den som lägger blinden förlorar vid optimalt spel av båda. Genom att den som inte lägger blinden går allin direkt förlorar den som lägger blinden mindre, dvs han som lägger blinden blir inte alls exploaterad.

Att den "optimala" spelaren ger en liten bonus (som uppmuntrar till vidare felspel kanske), spelar ingen roll för jämviktsläget. Bonusen får naturligtvis inte vara så stor att den andra spelaren skulle kunna tjäna på det.

Tänk dig själv att du efter sju svåra år, får fram en (av flera möjliga) "optimal" strategi. Klart att du vill testa den mot lite enkla strategier för verifikation. T ex testar du mot en spelare som går allin hela tiden för att se hur det går. Ja, precis så är det väl i det här fallet, och som sagt. Att direkt gå allin är väldigt fel i det där spelet.

Det stämmer nog i vanlig poker i många fall också.

Säg att ni har 600BB headsup och sb direkt går allin preflop. Smart?

Jag ger upp. Jag förstår inte ditt resonemang. Det kan ju stämma, men jag hittar inget vettigt att tolka, inga klargjorda reflektioner i ämnet varken i dina tre försvarande inlägg eller i originalet (avhandlingen). Förstår inte vad te x 'uppmuntrar till vidare felspel' ö.h.t har för relevans.

Logga in

Mastersuppsats om lösning för HU-nl vid umeå

Recommended Posts

Hjort

gulapa

gulapa

folder

sulla

Matfrid

Playboy

Playboy

gdaily

Nidson

xplosivo

lok123

lok123

Solidify

lok123

Sideshow

CopShootCop

Hjort

honest99

Hjort

honest99

tok_junior

Matfrid

honest99

Matfrid

Join the conversation

Members

Bläddra

Aktivitet