Gå till innehåll

Recommended Posts

  • Svars 57
  • Created
  • Senaste svar

Top Posters In This Topic

Top Posters In This Topic

Postad
Till att börja med kan det vara bra att definiera begreppet varians, som många på detta forum verkar använda utan att ha någon större aning om vad det är.
Det kan inte vara så att de faktiskt menar något helt annat än vad du snackar om?

 

Bara för att statistiker använder ordet "varians" på ett väldigt specifikt sätt innebär det inte att det är den enda, eller ens rätta, betydelsen. Allt du uppnår genom att rätta folk som menar något annat är att du har fel med väldigt hög precision.

 

Och att intala folk att de faktiskt menar en specifik statistisk term när de i själva verket avser något mycket luddigare är inte heller särskilt lyckat.

 

För övrigt är det totalt värdelöst att över huvud taget använda statistiska tekniker på poker i någon särskild utsträckning eftersom eländet vare sig är normalfördelat eller stationärt. Har lite med en massa olika insatsnivåer och extremt varierande motstånd att göra. Sådana här modeller tar inte direkt hänsyn till att tokrusha och hamna HU med en fisk på 100-200 NL, fastän sådana händelser är skitviktiga.

 

Mycket bättre att totalt skita i allt vad standardavvikelser och säkerhetsintervall heter och tänka igenom riskerna man tar noggrant istället.

Postad
Det kan inte vara så att de faktiskt menar något helt annat än vad du snackar om?

 

Bara för att statistiker använder ordet "varians" på ett väldigt specifikt sätt innebär det inte att det är den enda, eller ens rätta, betydelsen. Allt du uppnår genom att rätta folk som menar något annat är att du har fel med väldigt hög precision.

 

Och att intala folk att de faktiskt menar en specifik statistisk term när de i själva verket avser något mycket luddigare är inte heller särskilt lyckat.

 

Min poäng var egentligen inte att försöka "läxa upp" de som använder sig av uttrycket varians när de egentligen menar någonting annat, utan snarare initiera en diskussion om varians, statistik och poker.

 

Varians är definierat som en statistisk storhet och betyder just det som statistiker menar att det betyder. Variation, däremot, är ett mer vardagligt uttryck som är bättre att använda i icke-statistiska sammanhang.

 

 

För övrigt är det totalt värdelöst att över huvud taget använda statistiska tekniker på poker i någon särskild utsträckning eftersom eländet vare sig är normalfördelat eller stationärt.

 

Jaså?

 

 

Har lite med en massa olika insatsnivåer och extremt varierande motstånd att göra. Sådana här modeller tar inte direkt hänsyn till att tokrusha och hamna HU med en fisk på 100-200 NL, fastän sådana händelser är skitviktiga.

 

Absolut, och om du rensar datan för "skott" och liknande så kan du applicera den på din normala nivå ändå. Tanken var inte att skapa en modell som kan förklara alla framtida vinster utifrån tidigare data, utan enbart använda tidigare data för att analysera uppkomna avvikelser.

 

 

Mycket bättre att totalt skita i allt vad standardavvikelser och säkerhetsintervall heter och tänka igenom riskerna man tar noggrant istället.

 

Utesluter det ena det andra?

Postad

För övrigt är det totalt värdelöst att över huvud taget använda statistiska tekniker på poker i någon särskild utsträckning eftersom eländet vare sig är normalfördelat eller stationärt. Har lite med en massa olika insatsnivåer och extremt varierande motstånd att göra.

Sådana här modeller tar inte direkt hänsyn till att tokrusha och hamna HU med en fisk på 100-200 NL, fastän sådana händelser är skitviktiga.

 

 

 

 

Håller inte med om utvecklar en spel strategi kan det vara väldigt bra att veta ungefär hur poker sessioner vinster (och förluster) är fördelat. För att se hur strategin fungerar.

 

Dessutom blir folk väldigt oroliga när dom har hamnat i en downswing eller går upp en nivå. Så kan det vara till vis hjälp att se hur sannolik förlusten är om man fortfarande är en vinnade spelare.

 

För det tredje så är det väl inte j*vla svårt att göra en model som tar hänsyn till dina händelser, dessutom inte normal approximerar.

Postad

Ett antagande om normalfördelning är något som bör kunna fungera bra över en pokersession med relativt många händer, eftersom centrala gränsvärdessatsen säger att en summan av ett stort antal slumpvariabler hämtade från en och samma fördelning (oavsett hur sned den är) i sig är en slumpvariabel som är normalfördelad. (Att typen av motstånd varierar över tid spelar ingen roll så länge denna variation inte är systematisk - d.v.s. om de olika typerna av motståndare kommer och går slumpmässigt. Har man däremot olika typer av motstånd med systematik vid olika tillfällen så blir det däremot mer komplicerat, precis som Hjort konstaterade.)

 

Eftersom både väntevärden och varianser (men inte standardavvikelser) är additiva så gäller följande: Om den slumpfördelning vi hämtar vårt stora antal observationer från har medelvärdet M och standardavvikelsen S så kommer summan att vara en normalfördelad slumpvariabel med medelvärdet n*M och variansen n*S^2 (och således standardavvikelsen (n*S^2)^0,5), där n är storleken på stickprovet.

 

Om vi t.ex. spelar en pokersession om 10000 händer (ett stort antal) där den enskilda handen har väntevärdet 1 och standardavvikelsen 10 och därmed variansen 10^2=100 (siffror helt tagna ur luften, men det spelar ingen roll för principen) så kommer det förväntade utfallet av sessionen i sig att vara en approximativt normalfördelad slumpvariabel med väntevärdet 10000*1=10000 och standardavvikelsen (10000*10^2)^0,5=1000.

Postad

Grejen är att vår fördelning inte är normalfördelad. En vinnande spelare kommer ha en förskjutning på positiva resultat, blandat med en eller annan "katastrofsittning" på grund av fylla eller tilt, och en förlorande spelare kommer ha en skev fördelning mot mer negativa värden ju längre sittningen gäller

 

Bland annat, sedan har vi de spelare som slutar spela efter några timmar om de ligger plus, men som nöter hela natten om de ligger minus, bara för att lägga av så fort de kommer plus. Detta måste tas i beaktande om man tror att det är normalfördelat.

Postad
Grejen är att vår fördelning inte är normalfördelad.

 

Klart den inte är. Finns ingenting som är normalfördelat ute i verkligheten, men:

 

[...]centrala gränsvärdessatsen säger att en summan av ett stort antal slumpvariabler hämtade från en och samma fördelning (oavsett hur sned den är) i sig är en slumpvariabel som är normalfördelad.
Postad
Grejen är att vår fördelning inte är normalfördelad. En vinnande spelare kommer ha en förskjutning på positiva resultat, blandat med en eller annan "katastrofsittning" på grund av fylla eller tilt, och en förlorande spelare kommer ha en skev fördelning mot mer negativa värden ju längre sittningen gäller

 

Bland annat, sedan har vi de spelare som slutar spela efter några timmar om de ligger plus, men som nöter hela natten om de ligger minus, bara för att lägga av så fort de kommer plus. Detta måste tas i beaktande om man tror att det är normalfördelat.

 

Du har missuppfattat normalfördelningens egenskaper en aning. Att någonting följer en normalfördelning innebär inte att väntevärdet är noll - det innebär att värdena i populationen är normalfördelade kring sitt medelvärde.

 

En normalfördelning definieras av två storheter: väntevärde och standardavvikelse (varians). Väntevärdet bestämmer fördelningens förskjutning i x-led (det vill säga vid vilket x-värde "toppen på kullen" ligger) och standardavvikelsen avgör hur toppig fördelningen är.

 

Resultaten för en vinnande och en förlorande spelare med exakt samma varians skulle således kunna följa exakt "likadana" normalfördelningar undantaget förskjutningen till följd av de olika väntevärdena.

Postad
<klipp>

För övrigt är det totalt värdelöst att över huvud taget använda statistiska tekniker på poker i någon särskild utsträckning eftersom eländet vare sig är normalfördelat eller stationärt. <klipp>

 

Det är detta som behöver analyseras mer noga. Turneringsresultat är t ex inte normalfördelade utan har 'skew', d.v.s du får inte en symmetrisk kurva utan många små förluster gentemot några stora vinster. Detta och andra egenheter för fördelningen när man beräknar sin bankroll och risk tas upp i Mathematics of Poker, s291 och framåt.

 

Du har väl dock på ett sätt rätt, eftersom statistisk analys så ofta används felaktigt - inte minst missbrukas 95% konfidensintervall hela tiden. Det är kanske för att slippa dessa komplexiteter som Malmuth i sina beräkningar av hur stor bankroll man behöver helt enkelt håller sig till tre standardavvikelser för att dra slutsatser.

Postad
Det här är en mycket bra poäng, och påverkar beräkningen av sannolikheten att en session hamnar i ett visst intervall avsevärt, men det borde ha marginell påverkan på sannolikheten att medelvärdet av ett större antal, säg 30, hamnar i ett bestämt intervall, då de avvikande sessionerna bör ta ut varandra något sånär.

 

Frågan är väl hur relevant problemet är. Är det verkligen till någon nytta att beräkna sannolikheten att vinsten i en session hamnar i ett särskilt intervall?

 

Det är ett av de mer skriande och ofta diskuterade problemen, iallafall om du även tar med sannolikheten att förlusten ruinerar dig. Många vinnande spelare ruinerar sig då och då.

Postad
Är det verkligen till någon nytta att beräkna sannolikheten att vinsten i en session hamnar i ett särskilt intervall?

 

Visst är det det. Jag skulle vilja säga att det är en fundamental utgångspunkt när man bestämmer sin bankrulle.

 

Det är exempelvis enkelt att visa med hjälp av nämnda princip att en lös spelare behöver en större bankrulle än en tight spelare, om båda spelarna har samma väntevärde per hand i sitt spel.

Postad
Nej, inte en session.

 

Jo.

 

Vet du vilket intervall din bankrulle med en viss sannolikhet ligger i efter en session så kan du enkelt räkna ut vilket intervall man med en viss sannolikhet kommer att ligga i efter ett godtyckligt antal sessioner med hjälp av principen om additivitet som jag skrev om i tidigare inlägg i denna tråd.

Postad

Beräkna % att vinsten i en session hamnar i ett särskilt intervall tycker jag inte verkar intressant.

 

Säg att man har medelvärdet 2BB/100. Efter 30k händer.

Intressant fråga är istället att fråga sig vad sannolikheten är tex:

Sanna medelvärde > 2BB

1BB < Sanna medelvärde < 2 BB

Sanna medelvärde < 0

 

Sedan sa någon att N-fördelningen inte fanns i naturen, men det finns den visst det + i samhället!

Postad

Sedan måste man ju dela upp vissa data.

Man kan ju inte räkna ut varians och medelvärde från en databas som innhåller både fullring och headsup spel. Då måste man ju dela upp dessa och räkna ut, i detta fall två stycken medelvärden och två stycken varianser.

 

Man kan ju sedan dela upp ytterligare om man alltid möter säg 3 typer av motståndare i headsup spel. (Krävs förstås stort antal händer för varje kategori då)

Postad
Jo.

 

Vet du vilket intervall din bankrulle med en viss sannolikhet ligger i efter en session så kan du enkelt räkna ut vilket intervall man med en viss sannolikhet kommer att ligga i efter ett godtyckligt antal sessioner med hjälp av principen om additivitet som jag skrev om i tidigare inlägg i denna tråd.

 

Jo, visst men det är ju det godtyckliga antalet sessioner vi är ute efter, och eftersom det är i princip hopplöst att beräkna bra intervall för en enskild session, men relativt enkelt att beräkna för ett stort antal sessioner så är det ointressant att försöka beräkna för den enskilda sessionen.

Postad

Sedan sa någon att N-fördelningen inte fanns i naturen, men det finns den visst det + i samhället!

 

Visst, visst kroppsvikt för högre djur och lite såna grejer kan med lite god vilja betraktas som normalfördelat (men i regel är det den mest orealistiska fördelning som tänkas kan nästan). Det jag egentligen ville ha sagt är att det är ju inte populationens fördelning i sig som är intressant utan fördelningen för mätvärdena på den parameter vi skattar. Därför gör det inget om pokervinster är fördelade lite hursomhelst.

Postad
vadå orealistisk? den är ju en av de mest vanligaste fördelningar som finns i statistiken.

 

Samplingfördelning ja. Populationsfördelning nej. Men det här är helt OT so lets just agree to disagree.

Postad
Jo, visst men det är ju det godtyckliga antalet sessioner vi är ute efter, och eftersom det är i princip hopplöst att beräkna bra intervall för en enskild session, men relativt enkelt att beräkna för ett stort antal sessioner så är det ointressant att försöka beräkna för den enskilda sessionen.

 

Om intervallet vid en viss konfidensnivå är M +- B för en session så är det M*n +- B*rot(n) för n sessioner.

Postad
Om intervallet vid en viss konfidensnivå är M +- B för en session så är det M*n +- B*rot(n) för n sessioner.

 

Problemet var ju att det är enkelt att skapa intervall för många sessioner, svårt för enstaka - inte det motsatta. Men sak samma, det känns inte överdrivet relevant att grotta ned sig i eftersom det knappast är någon som försöker skapa konfidensintervall för enstaka kvällar i vilket fall som helst.

Postad
Nej, inte riktigt. Låt oss säga att du har ett stickprov med mycket fler observationer, men att ditt väntevärde fortfarande är 6 och standardavvikelsen 2,65. Då kan man approximera din vinst en viss session med en normalfördelning, och således bestämma sannolikheten att hamna i ett visst intervall.

 

Vi kommer då få följande resultat:

 

Förväntat värde: 6

 

Sannolikhet att värdet ligger mellan 3,35 och 8,65 (dvs 6 +/- 2,65): 68 %

Sannolikhet att värdet ligger mellan 0,7 och 11,3 (6 +/- 2*2,65): 95 %

osv.

 

Intervallen har valts som väntevärde +/- ett visst antal standardavvikelser, men vilka intervall som helst kan väljas (t.ex. sannolikheten att värdet är mindre än 0, sannolikheten att värdet är över 10 etc).

 

 

Hur tillämpar man detta med hjälp av pokertracker? Låt oss ta mina (avrundade till heltal) värden i pokertracker från en viss nivå NL Hold'em på en pokersite: winrate 6 Big Bets/100 händer, standardavvikelse 35 Big Bets/100 händer efter att ha spelat 35000 händer

 

I så fall ligger vinsten enligt ovan efter 100 händer inom intervallet 6 +/- 70 Big Bets med 95% sannolikhet (två standardavvikelser).

 

Man kan dock inte bara använda samma beräkning för session med n antal händer. Enligt ett inlägg i pokertrackers forum är konfidensintervallet standardavvikelsen delat med roten av antalet händer/100.

 

[Edit: jag hade här lagt in en formel för att beräkna konfidensintervallet av förväntad vinst efter n antal händer. Det blev dock alldeles galet, så jag tar bort den]

Postad

Jag har gjort lite excelark som räknar skiten åt en som jag kan lägga upp om nån är intresserad. Både en där man använder poketrackers siffror för std, och en sng-variant där enbart behöver fylla i antal placeringar per prisplats.

Postad
Beräkna % att vinsten i en session hamnar i ett särskilt intervall tycker jag inte verkar intressant.

 

Säg att man har medelvärdet 2BB/100. Efter 30k händer.

Intressant fråga är istället att fråga sig vad sannolikheten är tex:

Sanna medelvärde > 2BB

1BB < Sanna medelvärde < 2 BB

Sanna medelvärde < 0

 

Sedan sa någon att N-fördelningen inte fanns i naturen, men det finns den visst det + i samhället!

 

Nämn ett exempel där normalfördelning finns i naturen.

Postad
Det jag egentligen ville ha sagt är att det är ju inte populationens fördelning i sig som är intressant utan fördelningen för mätvärdena på den parameter vi skattar. Därför gör det inget om pokervinster är fördelade lite hursomhelst.
Nu suger jag på statistik, och fattar inte riktigt vad ni ska ha det här till. Men när poker är en aktivitet där många vinner lika mycket på en månad som de tidigare gjort under en 3-årig karriär så känns det lite märkligt att göra så mycket uppskattningar över huvud taget.

 

Lika så är det ju rätt knepigt att avgöra saker som att folk gör sig konsumtionsgula under upswing eller blir stejkade.

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Gäst
Svara i detta ämne...

×   Du har klistrat in innehåll med formatering.   Ta bort formatering

  Endast 75 max uttryckssymboler är tillåtna.

×   Din länk har automatiskt bäddats in.   Visa som länk istället

×   Ditt tidigare innehåll har återställts.   Rensa redigerare

×   You cannot paste images directly. Upload or insert images from URL.


×
×
  • Skapa nytt...