优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
$ J4 ?! c) H% }# T2 G5 t4 n
9 w" Q; {: y. p8 C6 D
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
2 w+ O$ c, o0 i, J% @$ \. T6 [# O& M/ Z
* ~* n2 \' F5 }/ q3 B {
问题
4 g- z) W8 b; \) K$ O$ s$ D) G
+ i: z4 r" I1 a- Y" i+ W: |
, @2 d# z& i, l6 U2 n- w% O
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
/ d/ W( P# k' k" L2 G) u/ n
( F0 k! S+ `) T, b5 U
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
& f% g% ^* |5 H1 B& f; I: \/ m
1 f, Q+ e' h: f
本文
9 j$ q" u6 ~- A5 S* Z
) B% t5 S7 g4 _ _8 T; Y
9 d$ z5 Z; U; O- r# u
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
# q9 S. i# B1 A+ [# C* a3 M! ]
5 D" c) {4 g. {* h D! |+ L- X( ]! p3 P
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
8 x* X; V! G& ]$ J8 ]5 G2 i. x
3 @ n2 s _8 v1 o2 Y' j' F3 _
- g1 A& U$ E2 E0 e" y& B
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
! q7 _; R9 _# R0 s
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
; P q7 Q1 t1 c$ o! P
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
. m# j9 X6 F4 A# q. E
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
$ L6 J: A X) w. Q% D4 r$ g: q
% q* g7 u Y4 U6 R+ i2 x. M2 |
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
/ @5 `$ g2 m9 e% {% [
8 S% ]& k9 p g# x. J
++,
4 I3 k) E4 V% B" U
+-++,-+++,
w8 N1 ~- y0 F! Y+ e( G
+-+-++,+-+++,-++-++,-+-+++,
1 r0 ] \/ d* _6 m$ _
。
0 J$ K2 M4 ]6 z4 `/ l6 _, A) b
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
, d$ X' d6 `% g. s1 x
* U0 m* Y H* Z3 F! D/ i
4 O- n7 Z" a& X
5 D" S2 j# O; R# Y' e9 K
! H+ E2 f4 d1 k
( A& U) L, k5 F4 K
6 n8 Q w2 O6 W' ]7 n* z
5 }% O& K" ~5 x; ^ Q+ m
1 `* u: V/ F' M4 l4 b- s1 @, d
/ d6 C+ e5 Q! y0 I4 J
$ [7 [; e3 C* h
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
' R0 q# ] q% C1 ~1 u
# P; `5 k: ~+ A; ]2 t* c- I8 ^$ {
++,+-+,
: V/ z) ~( I! _6 J, M, X' L
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
% e! }& u) A$ L o2 ?
-+-+++,-+-++-+,
6 a% Y1 q1 y4 F( N2 b
. |! ~% w; X( e+ _4 m
, ,
* L2 ^ A9 i4 E( C5 y, R1 {
。
( Y9 d5 l& m: F4 x( W
* z/ ~6 [; J% O* w9 u
仿上之计算,可得此时甲赢的机率为
! J8 ?4 |7 @$ g/ T
E4 W! d- [( b( I& _
4 ^9 A* X5 Z! q' Q: c
6 s; {! U4 |# }
% t- U) S% S* D6 w* J
' M2 E' V8 @; L1 x& o* t
, O. `8 [) E+ j2 W
- [/ H v% V. {* N$ d# f/ Q P
3 f. W! h. M( K- f
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
4 j T: V9 k& R4 A5 Q
8 q+ S9 B& S8 S N0 }- K
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
3 `! ~7 P+ T( e- Y9 |/ {. t# H. R
% P0 r8 U8 ^% }; H- m2 U+ c" I
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
6 j& F% y1 A! Y' T0 N
+ j; R) O9 F2 l6 x1 c5 P( K: }
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
7 y: M7 `% F; ]8 [0 Y& K% B7 j$ j
+ w# K7 U" E" b: S) ?+ G: d
% Q% h' V+ R3 ?# s1 w
情况一:
1 ~9 e! v, k3 k% B) u
此时不论甲如何下注, 恒等于 c/(m+c)。
& c+ j ^8 s+ S5 H# O- a
8 y1 o2 ?3 h- c4 n6 g# s
情况二:
: i7 E, k; J8 e2 v8 g
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
# |8 E) T7 r q; l6 a! l
. U! a* r, r6 E, N. h$ f
情况三:
L n4 d5 j7 F. T2 ]$ I
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
2 i. _# J, S& G, M
9 _" ]/ H7 |, `1 P
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
( X+ o( G" x+ _, g& H4 W h
& P+ L, m9 r1 G" _5 L
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
& _7 V+ R0 s+ q+ n# Y4 e( ]
( S% V- n3 h) s n; {! d# |
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
6 Y6 y7 q2 {0 a/ P' }' R6 h% ~# l
1 s$ e2 W" z( `5 c
, p, n5 ?0 Y. Z/ i+ ]: [
情况一:
& J z- C4 H& z- v7 Y
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
6 N* p& O$ n# S6 r3 `8 F) G% B) `& ^3 |
3 V& r/ L. D, V) @# c5 _6 W7 p
) L' V5 h; O, z; S6 ~
+ s9 E) ?" u+ p
) D6 Y, S. n) L2 ?* ~9 u2 u
( j/ P7 ]2 i3 i1 [& R# p
" r- |1 m$ p, K9 Z; {+ X) [0 r
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
* p3 U$ N+ K! \7 b4 k/ g" @, Z
! O3 R% f0 \: M2 q) j) J
情况二:
& X W' Y5 z1 x9 Q' j* B
令 q=1-p。此时对 ν 我们有方程式
) l- Q2 S; U1 I% J/ W; l5 M( T
4 h6 g2 V3 _8 C6 z5 e
1 W- D4 U9 t) l* r3 G5 R. S
' |' N# n% P2 b$ x) Z. z2 {; |: }
2 x. L' i! n- v& H; g* N8 y, X
8 |2 s8 d! f6 T, F( P; f
+ I3 u9 ]2 i/ A( N0 S# N
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
+ I4 o( W7 y* Q# J5 c
利用p+q=1,上组方程式可改写为
z) }5 u2 y j
* S. h1 s4 m: k' u
. ]/ N& M2 K1 v
; s- `1 U# l: P
- Z+ G' c( R) z% y1 _
0 X3 Q& P. z! w1 d, ?+ D( s& s" n
. \' o9 X8 @' [! w
两边相加,并利用 、,得
5 A w& A- o0 H. E, r7 ]0 Q
/ i4 E9 N$ o7 P- e( m3 g. ~% _
/ @$ D# {/ f& f) k0 ^
& O# d: o9 \0 }
# L6 W, F% |4 p! t0 e8 \ b
$ w2 o t# N2 ~) }' E9 K
' C. v% W' q& x8 p3 ^4 ]+ h7 ~; M
若取前 c 项相加,则得
6 z( P) J+ D* ?* b+ u) e% ^
5 w4 v4 Y6 v+ I- `( k* |1 ~
# b o' S9 Z& Z7 N1 m# S
7 e/ Q6 y$ G: B6 _9 j" l1 v1 r/ S' g
7 u5 Q7 d5 U. l9 M" b
' r7 i9 Z7 v4 S. s4 ~
/ o, u# q$ W; M. H( M- M
情况三:
6 @8 _, C" y3 a. z$ D( Z$ x- I
仿二之解法,可求得
3 Z- y* r# k* c- p# o0 h0 \: [7 G' k
- Q2 x3 b5 f/ {0 `. r. ?: e
- W t F* i# M2 e
5 p5 I3 D3 \0 s+ j# C# ?7 R
# X( T/ v7 Z9 K
. n5 h1 J: R1 \4 I4 A; o4 {
! @ } p' B( z8 C
& @4 W0 Z& `/ J9 Y3 F. h9 T
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
. |/ u$ f0 a# q7 }# \1 r) ^* w
$ E' ]% c* v3 _4 a0 ^& I# a
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
: A7 o7 f; U& p' d
' {# d8 V8 `) h- ~3 F# K
5 B0 c" E0 @7 r$ ~5 F, k, v
定理:
( h% {! p1 g0 y8 d# C
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
* O4 B7 M0 H" T0 Q4 t; q
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
7 X4 h3 P8 n- T/ h7 r9 X1 R4 C
4 g7 { r% K4 s9 V$ X* t# Q: Y; x
现在我们就拿这定理来证明先前我们所下之结论。
. a" J% s# Z2 q- @ x1 o
0 B) b- v8 h; M) \
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
2 X( A- M$ U' ~
2 ]( F5 Q8 R3 V% A% ]5 `* ]; N
至于在情况二或三时,我们取 。此时若给定 Sn,则
: j2 j4 a9 T |! R/ Z: q, t
$ f! o$ Q: R, m: H a" j
, i. v2 s# y& O. x
1 r' I5 p C3 ]. Q
8 s) K3 ?0 Q4 W# y: C: o$ o* K
2 ^" `4 z" u) ]) N4 N4 n4 J4 b, S
4 I. W; W! m$ D* c
- Z, C; s0 y" t' y' [/ ~' ~1 ?
1 w5 @! C5 m2 w: @% J
其中 为所下注之金额。利用
& u3 Y$ g3 W$ y
' ^, }+ J `# K: Q% m3 X x1 ]" N
& Z- U" g m Z" K
- v. @/ y) t4 z5 N2 ]5 K5 k# o( Y
4 L4 y1 B% h. L) C+ M' e6 A
8 e8 h8 o5 |+ M5 D5 _
# |9 a, B6 N6 @8 v
' Z5 S: [( e/ Z; }2 l$ u
1 o- ?' X% I1 e2 U/ L( U( G, l* l
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
' c3 k0 C/ C2 @
3 b! |+ i' |) l
* C2 ?4 Q% t" @( ?( N( @, N# L E6 R
) K3 ^4 U6 E* e( j
' }' N2 l5 S8 c2 `( z
+ I k. f. T% m* J& J
$ f; u z* D0 O9 U; f
/ j8 {0 C" w+ }1 y1 D
- v( g5 ]! j/ n, X) I
因此可得在情况二, 时,
3 S9 L9 S. M2 e$ H
4 E _6 [. l8 ~2 u& ?4 ~
' T f X7 L- h. k* R3 Z9 c4 u. x& \# d1 }
5 o c* r# b( N! S/ X3 ~
' n7 S: |8 s+ v- Z' d7 P
1 M1 Q" ^; w3 D0 G; Q: O
% w1 z2 X3 {6 w6 Y. W$ t
" Q. v1 `% S% s o' h+ r
8 T5 L( n, j) r' z V, C4 g5 |
而在情况三, 时,
2 ?- W- m1 Z- p0 p
- Y7 C: F; _4 x4 @5 ^& O2 _6 X
: l: Y+ u, ~8 {/ E4 c Y j
1 E% e4 b4 J3 R* ?. d7 \0 y8 m
- j/ U) a. e$ A( [
0 ^+ ~ M( j2 @0 f) R/ t# z, ?: p
# v2 Y6 r' T+ [$ ]2 `
: \* \* ^" Z- f6 j m3 q5 }
; W6 C* X0 p6 K( [9 k
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
: U: ]$ h3 y! H3 f& K1 j
, a' O* k" X6 M O; @
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
2 w6 f. _, [4 K/ h" F0 r
) W0 a1 W& x; J* | I! h
附录
- o3 M. f n& P% m
& v3 r2 K/ O/ k
3 I% c# P- J2 @# G
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
! ]* @6 W) I# c3 v: }- z
1 A0 p( Q* x/ u1 Z" l8 D: `
! {& B. U* x) e
6 R# f) S8 w5 ^) q
$ {8 }, ^# O4 q
! g- @7 F' E$ j1 o4 A, S" `
8 U8 P) H) C, L' n- j
. ?1 e1 x8 w" T& P6 s6 E& c2 w' \
0 X4 d# A) s' ?9 M; S# O
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (https://tcelue.tv/)
Powered by Discuz! X3.1