Gå till innehåll

Vem kan slå Filip och Fredrik: Först till 40


Recommended Posts

I vem kan slå Filip och Fredrik ikväll hade de ett tärningsspel som de även haft med i samma program tidigare. Det går ut på att man ska komma upp först till 40 genom att slå med en tärning. Men får man en sexa åker man ner på noll igen. Men man har möjlighet att låsa in sin summa och då går turen över till motståndaren.

 

Nu har jag funderat på hur man ska spela det här spelet matematiskt korrekt. Det här är det jag kommit fram till men jag vet inte om det är rätt.

 

I snitt får man ju 2,5 poäng per kast. Det är 1/6 risk att slå en sexa. Alltså borde man slå tills man har 15(2,5*6). Eller tänker jag fel nu?

Länk till kommentar
Dela på andra webbplatser

  • Svars 52
  • Created
  • Senaste svar

Top Posters In This Topic

när man ska låsa in beror på vad motståndaren och man själv har. t ex står det 28-38 och inlåset är 0-38 vill man ändå kasta tärning.

 

gissar jag rätt är spelträdet rätt stort typ en bit under 40^4.

 

Jo såklart. Men säg att det att det är första omgången och du är först ut. När stannar du då?

Länk till kommentar
Dela på andra webbplatser

Ditt snitt är inte 2,5 per kast. Sexan måste du räkna från allt från noll till minus 39, beroende på vad du står på.

 

Blir det inte samma sak om man räknar så? Räknar man så ska man väl kasta varje gång man har ett snitt över 0. När man står på 15 är det breakeven.

Länk till kommentar
Dela på andra webbplatser

blir inte spelträdet oändligt med tanke på att de kan slå 6or i all evighet? fast det borde ju innebära att spelet är olösbart, vilket det inte borde vara.

 

Spelet slutar när du får 40p, så vi kastar inte tärning i all evighet. Lyckas du få 40p utan att kasta några 6or har du vunnit.

 

t.ex. om du kastar en 5a 8ggr i rad.

Länk till kommentar
Dela på andra webbplatser

Jo såklart. Men säg att det att det är första omgången och du är först ut. När stannar du då?

 

beror på vad min motståndare har för score och hur mycket han har inlåst.

 

Blir det inte samma sak om man räknar så? Räknar man så ska man väl kasta varje gång man har ett snitt över 0. När man står på 15 är det breakeven.

 

målet är inte att öka sin score, målet är att vinna. vad vi själva har är bara en fjärdedel av informationen vi fattar vårt beslut på. säg att vår motståndare har 15/0 och vi 15/0 tror jag det är ett kast. men kan ha fel, lurigt spel, ska nog passa sig för att tro att svaren är intuitiva.

 

 

blir inte spelträdet oändligt med tanke på att de kan slå 6or i all evighet? fast det borde ju innebära att spelet är olösbart, vilket det inte borde vara.

 

noden kan ses som den samma.

Länk till kommentar
Dela på andra webbplatser

Jag räknade faktiskt ut det själv av ren nyfikenhet. Vet dock inte om det är rätt.

 

Jag fick det till att brytpunkten är vid 20. Dvs är man under 20 så har man värde att slå igen, men över 20 så har man ett negativt värde.

 

jag avrundade till att 85%(5/6) är grön och 15%(1/6) är "åter till noll". Genomsnittsvärdet per grönt kast blir 3 ((1+2+3+4+5)/5)

 

15% av 20 är 3

 

Dvs 85% av kasten får du i genomsnitt 3 extra poäng och 15% av kasten förlorar du 20(ger ett nettovärde på -3 per kast)

 

Mao kasta tills du kmr till 20, stanna efter 20 = GTO

Länk till kommentar
Dela på andra webbplatser

beror på vad min motståndare har för score och hur mycket han har inlåst.

 

 

 

målet är inte att öka sin score, målet är att vinna. vad vi själva har är bara en fjärdedel av informationen vi fattar vårt beslut på. säg att vår motståndare har 15/0 och vi 15/0 tror jag det är ett kast. men kan ha fel, lurigt spel, ska nog passa sig för att tro att svaren är intuitiva.

 

 

 

 

noden kan ses som den samma.

tror spelet är turnbaserat så motståndaren har bara en score som är låst.

Länk till kommentar
Dela på andra webbplatser

beror på vad min motståndare har för score och hur mycket han har inlåst.

 

 

 

målet är inte att öka sin score, målet är att vinna. vad vi själva har är bara en fjärdedel av informationen vi fattar vårt beslut på. säg att vår motståndare har 15/0 och vi 15/0 tror jag det är ett kast. men kan ha fel, lurigt spel, ska nog passa sig för att tro att svaren är intuitiva.

 

Jag var kanske lite otydlig med reglerna. Motståndaren får inte slå förrän du har låst. Så om du är först ut så står ju motståndaren på 0 tills du bestämmer dig för att lämna över/slår en sexa. Om den som började kommer upp till 40 först får den efter chansen efter dig.(Konstig regel eftersom du gynnas av att vara sist då). Vet inte dock inte vad som skulle hända om båda kom upp till 40 i samma omgång.

Länk till kommentar
Dela på andra webbplatser

Jag räknade faktiskt ut det själv av ren nyfikenhet. Vet dock inte om det är rätt.

 

Jag fick det till att brytpunkten är vid 20. Dvs är man under 20 så har man värde att slå igen, men över 20 så har man ett negativt värde.

 

jag avrundade till att 85%(5/6) är grön och 15%(1/6) är "åter till noll". Genomsnittsvärdet per grönt kast blir 3 ((1+2+3+4+5)/5)

 

15% av 20 är 3

 

Dvs 85% av kasten får du i genomsnitt 3 extra poäng och 15% av kasten förlorar du 20(ger ett nettovärde på -3 per kast)

 

Mao kasta tills du kmr till 20, stanna efter 20 = GTO

 

Förstår inte hur du tänker men så är jag mosig i huvudet också. Men jag är ganska säker på ett annat svar:

 

Vid 15 poäng ger ett kast 0EV. Pga att du har 1+2+3+4+5=15 poäng för alla vinstkast och du har -15 för sexan. Har du istället 16 poäng backar du i snitt ett poäng per kast.

 

Men det här utgår som sagt från att vi inte spelar mot motståndarens utan bara om vi ska stanna första omgången vi spelar och vi öppnar spelet.

Länk till kommentar
Dela på andra webbplatser

Förstår inte hur du tänker men så är jag mosig i huvudet också. Men jag är ganska säker på ett annat svar:

 

Vid 15 poäng ger ett kast 0EV. Pga att du har 1+2+3+4+5=15 poäng för alla vinstkast och du har -15 för sexan. Har du istället 16 poäng backar du i snitt ett poäng per kast.

 

Men det här utgår som sagt från att vi inte spelar mot motståndarens utan bara om vi ska stanna första omgången vi spelar och vi öppnar spelet.

 

fattar nada... matte är inte min starkaste sida :D

 

genomsnittsvärdet på ett giltigt kast är 3poäng. Så länge du har X mindre än 3/0.15 så ska du fortsätta.

 

Har du tex 19 så är ditt förväntade negativa värde 19*0.15 = 2.85 dvs mindre är din förväntade positiva värde på 3.

 

Jag vet dock inte om man bör räkna 85%(5/6) av 3 för genomsnittsvärdet. Det blir isf 2,55 och då blir brytpunkten lägre än 20, snarare runt 17.

 

 

Edit: Såhär tror jag det är

0.85((1+2+3+4+5)/5) = +2.55

0.15(y)=-x

 

x är det negativa snittvärdet per kast beroende av Y, som är antalet olåsta poäng.

Y är ju extremt låg i början och stiger ju fler olåsta poäng du har. Brytpunkten nås någonstans vid 17 beroende på hur noga man räknar. Jag avrundade ju till heltal.

 

(5/6)*((1+2+3+4+5)/5) = +2.55

(1/6)*(Y)= -x

 

Bryt ut det den som orkar.

 

MAO, utan alltför mycket tanke lagd på expo så borde man bara köra på till 16-17 och stanna. Sätta direkt press på motspelaren. Förhoppningsvis gör motspelaren misstagen att låsa in för ofta eller för sällan.

Länk till kommentar
Dela på andra webbplatser

fattar nada... matte är inte min starkaste sida :D

 

genomsnittsvärdet på ett giltigt kast är 3poäng. Så länge du har X mindre än 3/0.15 så ska du fortsätta.

 

Har du tex 19 så är ditt förväntade negativa värde 19*0.15 = 2.85 dvs mindre är din förväntade positiva värde på 3.

 

Jag vet dock inte om man bör räkna 85%(5/6) av 3 för genomsnittsvärdet. Det blir isf 2,55 och då blir brytpunkten lägre än 20, snarare runt 17.

 

 

Edit: Såhär tror jag det är

0.85((1+2+3+4+5)/5) = +2.55

0.15(y)=-x

 

x är det negativa snittvärdet per kast beroende av Y, som är antalet olåsta poäng.

Y är ju extremt låg i början och stiger ju fler olåsta poäng du har. Brytpunkten nås någonstans vid 17 beroende på hur noga man räknar. Jag avrundade ju till heltal.

 

(5/6)*((1+2+3+4+5)/5) = +2.55

(1/6)*(Y)= -x

 

Bryt ut det den som orkar.

 

MAO, utan alltför mycket tanke lagd på expo så borde man bara köra på till 16-17 och stanna. Sätta direkt press på motspelaren. Förhoppningsvis gör motspelaren misstagen att låsa in för ofta eller för sällan.

 

Du har fel. Du försöker räkna ut hur du maximerar EV i en enskild omgång och du räknar inte rätt. Brytpunkten som du kallar det är vid 15 och räknas ut genom ekvationen 1+2+3+4+5-x=0

 

Att brytpunkten är 15 betyder att om du har fått 15 är det egalt om du kastar igen eller "bankar".

 

Dock räcker det inte att tänka så eftersom man också måste ta hänsyn till att målet är att komma till 40 före motståndaren, skulle detta däremot vara en evighetsgrej skulle slå igen på allt under 15 vara GTO.

Länk till kommentar
Dela på andra webbplatser

Du har fel. Du försöker räkna ut hur du maximerar EV i en enskild omgång och du räknar inte rätt. Brytpunkten som du kallar det är vid 15 och räknas ut genom ekvationen 1+2+3+4+5-x=0

 

Att brytpunkten är 15 betyder att om du har fått 15 är det egalt om du kastar igen eller "bankar".

 

Dock räcker det inte att tänka så eftersom man också måste ta hänsyn till att målet är att komma till 40 före motståndaren, skulle detta däremot vara en evighetsgrej skulle slå igen på allt under 15 vara GTO.

 

Så vid 16 så riskerar du mer än du vinner?

 

Det genomsnittliga förväntade negativa värdet är 2,4 dvs 15% av 16.

 

Det genomsnittliga förväntade positiva värdet är ju 2,5 dvs 85% av 3.

 

Var räknar jag fel :D

 

Genomsnittsvärdet på ett lyckat kasst är ju 3, det är väl rätt? Det får man 85% av kasten -> 2,5?

Länk till kommentar
Dela på andra webbplatser

Så vid 16 så riskerar du mer än du vinner?

 

Det genomsnittliga förväntade negativa värdet är 2,4 dvs 15% av 16.

 

Det genomsnittliga förväntade positiva värdet är ju 2,5 dvs 85% av 3.

 

Var räknar jag fel :D

 

Genomsnittsvärdet på ett lyckat kasst är ju 3, det är väl rätt? Det får man 85% av kasten -> 2,5?

 

Du räknar inte tillräckligt noga. 5/6=83.33%. 83.33%av 3=2,5.

 

1/6=16.67%. 16.67% av 15=2,5.

 

Alltså är brytpunkten 15.

Länk till kommentar
Dela på andra webbplatser

  • 1 year later...
Mao kasta tills du kmr till 20, stanna efter 20 = GTO

 

Ursäkta sen bump men jag såg det senaste avsnittet av Vem kan slå Filip och Fredrik och då var detta spel med igen. Efter jag sett det blev jag också intresserad av den bästa strategin så jag skapade ett datorprogram och provade lite olika strategier.

 

Det första jag testade var att slå ett visst antal kast varje gång innan man bankar. I det fallet är 7 det bästa antal kast.

 

En annan strategi är att spela tills man når en viss summa. I det fallet kom jag fram till att det är bäst att fortsätta slå så länge man ligger under 20 poäng.

 

Sen provade jag en del hybridstrategier men ingen som var extra framgångsrik.

 

Den bästa metoden jag fann var just att slå så länge man har 0-19 poäng och annars banka. Den slår även strategin med att slå 7 gånger. Det är mycket intressant och jag blev positivt överraskad av archtilas inlägg eftersom han kommit fram till samma resultat oberoende. Jag gjorde dessa tester långt innan jag hittat denna tråd.

 

Simulerar jag 9.000.000 matcher så blir detta resultaten:

7 kast varje gång vs. slå under 20: 4358306 (48,4%) / 4641694 (51,6%)

slå under 15 vs. slå under 20: 4126428 (45,8%) / 4873572 (54,2%)

 

Notera att jag nu inte tar hänsyn till motståndarens poäng även om jag skulle kunna göra ändringar för att också beakta den. Sen tror jag också det är viktigt att använda olika strategi beroende på om man börjar eller ej.

Länk till kommentar
Dela på andra webbplatser

Som formulerat så är ju den optimala strategin att bara hamra på till man får 40. Det nämndes ju inte att det blev andre spelarens tur när man slår en sexa :)

 

Edit:

 

Jag får det till att den enda informationen som borde vara relevant för en gto-strategi är fryst poäng, nuvarande poäng och motståndarens poäng (alltid fryst). Vilket för en spelare ger 40*(40 + 39 + 38 + ... + 1) = 32800 möjliga tillstånd att ta hänsyn till.

 

Givet att den bästa strategin i varje beslutspunkt är omixad, vilket verkar väldigt rimligt, så finns det alltså maximalt 32800 olika kandidatstrategier.

 

För att hitta jämviktsstrategin så borde man i princip bara testa varje strategi mot alla andra strategier vilket inte borde röra sig om så ruskigt mycket mer än någon miljard tester och vara genomförbart på random hemmaburk. Är det här rätt tänkt borde det också finnas en rackarns massa utrymme för optimering.

Länk till kommentar
Dela på andra webbplatser

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Gäst
Svara i detta ämne...

×   Du har klistrat in innehåll med formatering.   Ta bort formatering

  Endast 75 max uttryckssymboler är tillåtna.

×   Din länk har automatiskt bäddats in.   Visa som länk istället

×   Ditt tidigare innehåll har återställts.   Rensa redigerare

×   You cannot paste images directly. Upload or insert images from URL.


×
×
  • Skapa nytt...