Gå till innehåll

Konfidensintervall på ROI%


CopShootCop

Recommended Posts

  • Svars 51
  • Created
  • Senaste svar

Top Posters In This Topic

Mnjae, jag skulle ju kunna ändra åsikt om nån skrev något vettigt som hävdade motsatsen, liksom.

 

Jag är inte säker i frågan, kan inte tänka och spela samtidigt.

I och med att du klev in i tråden så ökade sannolikheten att jag har en blackout.

 

Skämt åsido.

Skulle också vilja att någon utvecklade det.(kanske när du spelat klart)

Själv är jag tömd och vill inte att fingret ska komma farande:-)

Länk till kommentar
Dela på andra webbplatser

Är det verkligen så?

Säg att du har en LAG-spelare som nästan aldrig kommer i pengarna men att han vinner oftare. Jmf med en som ofta kommer i pengarna men inte vinner.

Behöver man inte mer turrar hos LAGspelaren då? Kommer inte det sanna intervallet bli bredare hos LAG-spelaren efter ett godtyckligt antal turrar?

Tycker det verkar ganska självklart men kanske har jag en blackout.

 

en mer aggressiv spelare kan efter 20 matcher verka förlorande, lixom förlorat alla, sen vinner han 10 i rad, BAM, han är plus, men går väldigt mkt upp och ner, den tajte killen vinner lite men ofta så går sakta men säkert uppåt.

 

Nåt sånt kanske?

Länk till kommentar
Dela på andra webbplatser

Mnjae, jag skulle ju kunna ändra åsikt om nån skrev något vettigt som hävdade motsatsen, liksom.

 

Jag är inte säker i frågan, kan inte tänka och spela samtidigt.

 

intressant att du inte är säker på frågan men att du samtidigt har svårt att se att klyka har fel, lite motsägande????

 

nåja hursomhelst har klyka rätt eftersom standard avvikelsen bara beaktar p och ifall deras p är densamma så blir standavvikelsen densamma för dem.

 

Marginal error=standardfelet=

 

roten ur(p(1-p)/n)

 

för övrigt är ju standardavvikelsem upphöjt två =varians.

D.v.s att variansen för de båda är densamma när man beaktar konfidensintervallet.

 

p-et i fråga är ju roien.

n=antal spel

För att lösa konfidensintervallsproblemet utför vi följande

 

p - roten ur(p(1-p)/n) x (värdet på den felmargnal vi vill ha,t.e.x (5%/2)) < p < p - roten ur(p(1-p)/n) x (värdet på den felmargnal vi vill ha,t.e.x (5%/2)

p.

 

de värden vi får att p befinner sig emellan är då vårt konfidenstinervall. För att utföra beräkningarna hemma kan nämnas att för att finna ett konfidensintervall som stämmer till 95% gör ni följande.

 

p -1,96roten ur(p(1-p)/n) < er riktiga roi< p + 1,96roten ur(p(1-p)/n)

 

insätt er roi där p befinner sig och lägg in ert n = antal sngs där n befinner sig.

 

så får ni ett intervall där er riktiga roi befinner sig med 95% sannolikhet. Lite oklar men det skall stämma

 

edit kom på att denna formel inte är tillämpar i det här fallet.

Länk till kommentar
Dela på andra webbplatser

Alltså, den allra enklaste metoden är att helt enkelt bara rita upp ett löpande snitt och nöja sig när det slutar svänga med mer än någon procent.

 

Om vi nu ska anta att processen är någorlunda stationär, vilket man ju ändå måste göra om man ska använda formler.

 

Eller så kan man börja bli jätteavancerad och titta på vad priordistributionen av resultat är och justera efter det. Fast det vete fan hur man gör i en graf.

Länk till kommentar
Dela på andra webbplatser

som jag ser på saken måste man använda sig av t distributionen eftersom variansen är okänd, hitta sample standardavvikelsen och därefter kombinera det med ens observerade average profit. Utifrån detta kan man då finna ett interval för ens average profit. Därefter kan man finna estimerade roi intervallet. Vette fan snurrig som satan nu, trodde binomialfördelningen funkade men jag ser inte hur man kan använda den. Problemet är ju att ifall man ansätter p = roi i den tidigare formeln kan man ju får att p =200, detta är ju absurt så roi motsvarar inte p i den tidigare formeln. Aja pallish

Länk till kommentar
Dela på andra webbplatser

Det går att givet en ROI beräkna sannolikheten för att man har en viss ROI efter Y antal SnG.

 

Notera att detta inte är korrekt. När man prövar hypotesen om ifall man har en viss ROI så är det chansen att få det observerade resultatet givet att hypotesen är sann man beräknar. Alltså inte chansen att man har en viss ROI givet den observerade datan. Det är exempel på prosecutors fallacy.

 

Ska man beräkna sannolikheten för att ha en viss ROI givet ett resultat blir det betydligt mer komplicerat.

Länk till kommentar
Dela på andra webbplatser

som jag ser på saken måste man använda sig av t distributionen eftersom variansen är okänd, hitta sample standardavvikelsen och därefter kombinera det med ens observerade average profit.

 

Det har ju nästan ingen betydelse om du använder T-fördelningen eller normalfördelningen om du har ett hyfsat stort urval.

 

Annars är det här inte så dumt:

Alltså, den allra enklaste metoden är att helt enkelt bara rita upp ett löpande snitt och nöja sig när det slutar svänga med mer än någon procent.
Länk till kommentar
Dela på andra webbplatser

Notera att detta inte är korrekt. När man prövar hypotesen om ifall man har en viss ROI så är det chansen att få det observerade resultatet givet att hypotesen är sann man beräknar. Alltså inte chansen att man har en viss ROI givet den observerade datan. Det är exempel på prosecutors fallacy.

 

Ska man beräkna sannolikheten för att ha en viss ROI givet ett resultat blir det betydligt mer komplicerat.

 

Vad jag kan se så blandar du ihop hypotestest med konfidensintervall. Ett konfidensintervall är "bara" ett intervall inom vilket sanna värdet för en viss populationsparameter finns med en viss sannolikhet (konfidens). Ett sådant intervall är i sig därmed egentligen bara en del av den deskriptiva statistiken, eller möjligen ett slags mellansteg mellan den deskriptiva och den analytiska.

 

En hypotestest är däremot en del av den analytiska statistiken, eftersom förkastandet av en nollhypotes leder till att man drar en konkret slutsats rörande den aktuella populationsparametern - nämligen att det som nollhypotesen uttrycker inte stämmer. Sannolikheten att man har fel när man drar en slutsats baserat på en hypotestest är det som kallas p-värde.

Länk till kommentar
Dela på andra webbplatser

Vad jag kan se så blandar du ihop hypotestest med konfidensintervall. Ett konfidensintervall är "bara" ett intervall inom vilket sanna värdet för en viss populationsparameter finns med en viss sannolikhet (konfidens).

 

Nej det gör jag inte, vilket framgår av att jag svarar på ett inlägg som handlar om beräkning av sannolikheten att ha en viss ROI.

 

Exakt samma problematik uppstår ju med konfidensintervall, dvs. när du väl har du gjort ett 95%-intervall och tittat på det så kan du inte tolka det som att du är 95% säker på att populationsparametern ligger inom intervallets gränser.

Länk till kommentar
Dela på andra webbplatser

Nej det gör jag inte, vilket framgår av att jag svarar på ett inlägg som handlar om beräkning av sannolikheten att ha en viss ROI.

 

Exakt samma problematik uppstår ju med konfidensintervall, dvs. när du väl har du gjort ett 95%-intervall och tittat på det så kan du inte tolka det som att du är 95% säker på att populationsparametern ligger inom intervallets gränser.

 

I ett frekventistiskt perspektiv har du helt rätt, eftersom sannolikheten att parametern ligger i intervallet antingen är 0 eller 1. Men det är helt vedertaget, i alla fall inom beslutsteori som är min vetenskap, men även bland många statistiker, att använda den bayesiska tolkningen av ett sådant intervall. (Se t.ex. http://en.wikipedia.org/wiki/Credible_interval.)

 

Enklaste sättet att lösa problemet i praktiken är nog ändå Hjorts metod.

 

Alltså, den allra enklaste metoden är att helt enkelt bara rita upp ett löpande snitt och nöja sig när det slutar svänga med mer än någon procent.
Länk till kommentar
Dela på andra webbplatser

Exakt samma problematik uppstår ju med konfidensintervall, dvs. när du väl har du gjort ett 95%-intervall och tittat på det så kan du inte tolka det som att du är 95% säker på att populationsparametern ligger inom intervallets gränser.

 

Kan du förklara det här mer i detalj? Populationsparametern är i detta fallet vad? Är ett tag sen jag läste matstat så termerna är lite rostiga.

 

EDIT: Hjorts metod är ju väldigt praktiskt applicerbar, dock så bör man ju i efterhand alltid göra en statistisk analys av resultatet man fått med den metoden.

Länk till kommentar
Dela på andra webbplatser

Kan du förklara det här mer i detalj? Populationsparametern är i detta fallet vad? Är ett tag sen jag läste matstat så termerna är lite rostiga.

 

Populationsparametern är i det här fallet ditt verkliga EV. Problemet är att det är felaktigt att anta att chansen för ett EV givet data är detsamma som sannolikheten för data givet ett visst EV.

 

Exempel på situation som kan uppstå: Säg att du beräknar ett 95%igt konfidensintervall för din ROI som sträcker sig mellan 14% och 21%. Hur troligt är det då att ditt verkliga EV ligger i intervallet? Det vet vi egentligen inte. Känner vi t.ex. till att bara de absolut bästa spelarna når över 13% på den aktuella nivån så är det ganska troligt att intervallet inte täcker det verkliga värdet. Hur man ska tolka konfidensintervall är ett filosofiskt problem som man kivas hur mycket som helst om och det görs också.

 

Anledningen att jag tog upp det är att det finns en risk att man tror att bara för att man har räknat ett 95%-intervall som visar att man har en helt ohygglig winrate så är man 95% säker på att man har en sådan ohygglig winrate.

 

EDIT: Hjorts metod är ju väldigt praktiskt applicerbar, dock så bör man ju i efterhand alltid göra en statistisk analys av resultatet man fått med den metoden.

 

Jag vet faktiskt inte om det är nödvändigt egentligen. För de allra flesta spelarna duger det nog att veta att deras ROI är typ "10% plus minus nån dryg procent".

Länk till kommentar
Dela på andra webbplatser

Jag kan inte se på vilket sätt Klyka kan ha fel

 

I största allmänhet, antar jag att du menar? :mrgreen:

 

Brut, det jag menar är att en spelare som har observerat X antal 1:a-placeringar, Y antal 2:a-placeringar och Z antal 3:e-placeringar på A antal spelade turneringar har precis samma ROI, konfidensintervall, etc som en annan spelare med samma siffror för X, Y, Z och A. Detta oavsett deras spelstil.

 

Däremot kommer spelare med olika spelstil som du säger ofta att få olika siffror för X, Y, Z och A, men det är en annan sak. När siffrorna väl är fastställda så kan vi räkna på konfidensintervallet.

Länk till kommentar
Dela på andra webbplatser

Det stämmer ju att det inte är samma sak att uppskatta "sann" ROI givet beräknad som tvärtom. Däremot så stämmer väl konfidensintervallen likaväl, D.v.s. ifall man spelar 100 serier om 500 SNG vardera så kommer man väl fortfarande förvänta att den sanna ROI% ska ligga inom det beräknade konfidensintervallet på 95 av 100 serier?

 

Så länge vi antar en symmetrisk sannolikhetsfördelning (vilket detta måste bli) så är det analogt att gå från beräknad till "sann" som att gå från "sann" till uppskattad. Alltså detta är inte sant för alla sannolikhetsfördelningar men det är sant för just den här fördelningen.

Länk till kommentar
Dela på andra webbplatser

I största allmänhet, antar jag att du menar? :mrgreen:

 

Brut, det jag menar är att en spelare som har observerat X antal 1:a-placeringar, Y antal 2:a-placeringar och Z antal 3:e-placeringar på A antal spelade turneringar har precis samma ROI, konfidensintervall, etc som en annan spelare med samma siffror för X, Y, Z och A. Detta oavsett deras spelstil.

 

Däremot kommer spelare med olika spelstil som du säger ofta att få olika siffror för X, Y, Z och A, men det är en annan sak. När siffrorna väl är fastställda så kan vi räkna på konfidensintervallet.

 

Ja det låter ju lite mer rimligt, att låta, som du gör, siffrorna definera spelstilen. Men det låter ju sig inte exakt göras särskilt inte om du har ett litet sample.

Så jag tror fortfarande inte att det exakt stämmer. Spelar du en högvarianspoker så kommer antagligen det sanna kofidensintervallet vara bredare särskilt om samplet är litet. Men det är ju självklart bara av akademiskt interesse. Och de här mattesnubbarna verkar ju ha en viss koll på det;-). Får väl anamma någon av deras teser. Skulle inte känna mig helt säker fören jag hade en empirisk graf(enligt hjort) dock.

Länk till kommentar
Dela på andra webbplatser

Ja det låter ju lite mer rimligt, att låta, som du gör, siffrorna definera spelstilen.

 

Nja, asså, jag låter inte siffrorna identifiera spelstilen. Glöm spelstilen. Den är inte intressant. En spelstil är bara ett sätt att komma fram till en viss uppsättning siffror, men när vi väl har denna uppsättning siffror så är vägen dit inte lägre intressant.

 

Men det låter ju sig inte exakt göras särskilt inte om du har ett litet sample.

 

Jodå. Eller snarare: Det som jag menar att vi ska göra låter sig göras oavsett sample size. Om vårt sample är litet så kommer våra siffror att ge ett stort konfidensintervall (eller om det heter tvärt om, är inte så haj på terminologin. Men vad jag menar är: Litet sample ger stor osäkerhet).

 

Men att osäkerheten är stor hindrar ju inte beräkningen. Det var ju osäkerheten vi var ute efter att beräkna.

Länk till kommentar
Dela på andra webbplatser

Men vänta nu, med en volatil och marginell spelstil så tar det väl längre tid att få tillförlitliga placeringssiffror, då variansen där är högre?
Spelstilens volatilitet definieras helt och hållet av de förväntade placeringarna i pengarna. Om ens underliggande, förväntade resultat är 12-8-12, så är ens volatilitet exakt densamma om man i ena fallet spelar 90% av händerna jämfört med att spela 10% av händerna.

 

Det tar inte längre tid i sig att konvergera på 80-10-5 än på 10-10-10. Däremot så ser man ju i det första fallet mycket snabbare på vilken sida om plustecknet man hör hemma.

Länk till kommentar
Dela på andra webbplatser

Så här tänker jag och det kan vara fel, det kanske inte heller går att applicera på turrar.

Först undrar jag om vi kan överföra detta till chashgame. Att göra ett kofidensintervall ex som enhet BB/hand.

Jag tänker mig då 2 st spelare den ena tar 80%+ och den andra tar 80%+ men även alla chanser mellan 30%-70%. Vi bortser från blindsen. Hela tiden hamnar de all in för 100 BB när de spelar. Båda spelarna får hela tiden exakt samma kort duplicerade som typ i bridgeturrar, samma kort kommer till fi och läggs upp på bordet. Motståndaern går alltid all in mot oss.

80% killen dubblar alltså upp 80% av gångerna han spelar.

Den andra kommer att få exakt samma resultat eftersom han spelar exakt samma händer men han spelar även alla 30-70% are(snittet på detta blir0 kr ).

Båda spelarna kommer i genomsnitt att vinna z (BB)per han tilldelad.

 

Om vi gör ett koordinatsystem med BB på y axeln och handantal på x axeln så kommer den matematiska linjen att vara rät med lutningen z.

Sedan har vi olika mätvärden för spelarna och vi börjar med att rita ut 80% killens graf.

Alla dessa värden ingår ju även i högvarianskillens graf och denna kommer om att svänga runt 80% killens och även runt z linjen.

Skilnaden mellan spelarnas linjer är att hövariansspelarens kurva kommer att svänga med högre amplitud och frekvens borde det ju bli.

Så alltså när man läser av ett visst värde för att räkna intervall eller p värde med mera så måste man på något sätt kompensera för kurvans utseende(=variansen). men som jag förstår det hela så gör man ju inte detta.

Kurvorna ser olika ut pga spelstilarna alltså.

Är detta rätt?

Länk till kommentar
Dela på andra webbplatser

Så alltså när man läser av ett visst värde för att räkna intervall eller p värde med mera så måste man på något sätt kompensera för kurvans utseende(=variansen). men som jag förstår det hela så gör man ju inte detta.

 

Jodå. Variansen skattas från urvalet och tas med i beräkningen när man skapar intervallet. För att skatta variansen behöver du endast information om varje vinst/förlust. I fallet med sng så innehåller alltså placeringarna all information du behöver för att kunna skatta variansen.

Länk till kommentar
Dela på andra webbplatser

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Gäst
Svara i detta ämne...

×   Du har klistrat in innehåll med formatering.   Ta bort formatering

  Endast 75 max uttryckssymboler är tillåtna.

×   Din länk har automatiskt bäddats in.   Visa som länk istället

×   Ditt tidigare innehåll har återställts.   Rensa redigerare

×   You cannot paste images directly. Upload or insert images from URL.


×
×
  • Skapa nytt...