Tjaba!
För att jag ska hitta en utgångsstrategi så måste jag utgå ifrån att Dan hoppar av 50/50 vid första och andra hållplatsen.
När jag väl hittat en optimal strategi så kommer Dans bästa strategi vara att hoppa av på hållplatserna lika ofta som jag gör.
Därför om det vore 80% att bli mördad på 1an och 40% på 2an så skulle jag hoppa av på 1an en tredjedel av gångerna (då förhållandet är 2:1 i risk).
Sannolikhet för att bli mördad på första hållplatsen är Q/2
Sannolikhet för att bli mördad på andra hållplatsen är (PQ+Q)/4
(här förutsätter jag att Dan ännu väljer hållplats helt slumpmässigt)
Om sannolikheten att bli mördad på 1an kallas A och 2an B så ska man hoppa av på A så här ofta:
B / (A+B)
Så nu blir formeln så här:
((PQ+Q)/4) / ( (Q/2) + ((PQ+Q)/4))
En förenkling ger:
(P+1) / (P+3)
Tihi, resultatet verkar vara samma oberoende av Q
Dan tar då och optimerar sitt resultat genom att föra statistik över hur ofta jag hoppar av på hållplatserna och själv följa samma sannolikhet.
Nu har jag hoppat över några steg i bevisföringen och är inte hundra på mitt resultat, men det känns rätt och ger vettiga resultat när jag testade det 2 gånger.