\begingroup

我该如何直观地理解这样一个事实:如果我反复抛一枚公平硬币,

(1)序列 THTH 出现在 HTHH 之前,几率为 9:5,但

(2)这两个字符串分别出现所需的翻转次数预期分别是 20 和 18?

也就是说,在竞争中,THTH 会在 HTHH 之前出现;但在孤立的情况下,THTH 需要更长时间才能出现!

中给出,但没有真正解释,《数学研究所公报》 18
(1982),227-232。(1)的直觉大致是,在 T 出现后,我们立即看到 T
HTH将在HTH H 完成之前完成。(2)的直觉来自字符串的“自相似”程度:如果你得到 THTT,你将回到尝试形成字符串 THTH 的开始,而如果你得到 HTHT,你已经在 HTHH 的第二个字母,所以并不是所有的进展都丢失了。这由 Conway 的算法精确实现 – 有关详细信息,请参阅 Collings 的论文。)

也许如何调和这些观察结果是显而易见的,但我现在根本看不到。

\endgroup


最佳答案
3

\begingroup

或许可以考虑以下类似的“惊喜”。

随便选一个日期,比如“10 月 12 日”,然后在日历上查看。从该日期开始往前数天数。

  1. 预计到星期四的天数是

    170 + 1 + 2 + 6 = 3170+1+2+6=3

    \frac{1}{7}(0 + 1 + 2 + \ldots 6) = 3

    这里,如果 10 月 12 日恰好是星期四,我将其算作“零天”。

  2. 同样,预计到达星期五的天数是 3 天。

  3. 在遇到星期五之前遇到星期四的概率是6767\dfrac67

因此,我们有两个随机事件(之所以说是随机的,是因为我们随机选择了日期),它们的预期“时间”为 3,因此它们平均发生在与开始相等的“距离”,但一个事件发生在另一个事件之前6767\dfrac67的时间。

关键是“之前”只能告诉你一小部分数据 — 它并没有告诉你事件发生之前多久。

另一个例子是,当你考虑两个奇特的骰子时:其中一个(“稳固的骰子”)每个面都有“3”;另一个(“狂野的骰子”)有五个面是 1,第六个面是 13。“狂野的”和“稳固的”骰子的平均掷出值为 3,但如果将它们一起掷出,“稳固的”平均六次中有五次会击败“狂野的”。通过稍微向上或向下调整数字 13,你可以使任何一个的预期值更大,但不改变“六次中有五次”的获胜百分比。

简短摘要:“预期值”并不是一个像您希望的那样自然的概念,并且“发生于之前”没有考虑到“发生于多少之前”。这开启了出现明显悖论的可能性。

\endgroup

1

  • 2
    \begingroup
    出色的解释和示例!!
    \endgroup


    – 

\begingroup

在 John Hughes 的回答以及朋友的帮助下,我终于明白了这些想法。我将在这里直接回答我自己的问题。

THTH 首先出现的情况确实更为常见,但在这些世界中,HTHH 仅落后一点点(预期的滞后是888此处)。然而,在 HTHH 首先出现的世界中,THTH 会落后相当多(预期的滞后是202020这里)。这样,与 HTHH 相比,平均值偏向于 THTH 出现得较晚。

更准确地说,定义随机变量XY分别是 THTH 和 HTHH 出现所需的翻转次数。我们感兴趣的是了解前任>>\mathbf EX>\mathbf EY。现在这相当于

前任−E Y= EX= EXHTHH ) Pr ( HTHH ) E ( YTHTH ) Pr ( THTH ) ,==高血压普尔高血压超音速巡航普尔超音速巡航

\begin{align*}
&\mathbf EX-\mathbf EY=\mathbf E(X-Y)\\
&\quad=\mathbf E\bigl(X-Y\mid\text{HTHH}\bigr)\Pr(\text{HTHH})
-\mathbf E\bigl(Y-X\mid\text{THTH}\bigr)\Pr(\text{THTH}),\tag{$*$}
\end{align*}
在哪里
Pr HTHH 普尔高血压\Pr(\text{HTHH})表示 HTHH 在 THTH 出现之前出现的概率(对于THTH 普尔超音速巡航\Pr(\text{THTH}))事实证明,方程(*)变成

20 18 = 2 = 20 5148 9142018=2=205148914

20-18=2=20\cdot{5\over14}-8\cdot{9\over14}
当所有数字都被代入时;这解释了我们之前关于预期滞后的评论。

右边的第一个条件期望(*)——如果你在 HTHH 第一次出现后立即开始计数,它给出了获得 THTH 的预期翻转次数——等于前任\mathbf EX,因为 THTH 的前缀都不是 HTHH 的后缀(因此游戏被重置,就像从头开始一样)。第二个条件期望更棘手,因为 HTHH 的前缀 H 和 HTH 都是 THTH 的后缀;经过一番努力,可以证明

E ( yTHTH =k≥12k 122k 1+k≥12k + E2=109+19 8+3E超音速巡航=121221+12+22=109+198+3

\mathbf E\bigl(Y-X\mid\text{THTH}\bigr)=\sum_{k\ge1}{2k-1\over2^{2k-1}}+\sum_{k\ge1}{2k+\mathbf EY\over 2^{2k}}={10\over9}+{1\over 9}\bigl(8+3\mathbf EY\bigr).
代入(
*)并利用原始问题中的事实(1),我们得到

前任−E Y=514前任914109+19 8+3E=514914109+198+3

\mathbf EX-\mathbf EY={5\over14}\mathbf EX-{9\over14}\biggl({10\over9}+{1\over9}\bigl(8+3\mathbf EY\bigr)\biggr),
简化为

前任−E Y=29 EY−9 =299

\mathbf EX-\mathbf EY={2\over9}\bigl(\mathbf EY-9\bigr).

我们还要证明的是埃伊> 9>9\mathbf EY>9。但对于任何特定长度,所需的翻转次数k出现的字符串至少为222^k(我认为是引导),所以我们完成了。

提醒自己:这似乎很容易计算前任\mathbf EX埃伊\mathbf EY,以及使用或鞅方法将这种期望推广到任何固定字母表上的任意长度的字符串(参见 David Williams 的《鞅的概率》(1991)中的练习 10.6)。

\endgroup

2

  • 1
    \begingroup
    细节处理得很好!(我也喜欢最后一段!)
    \endgroup


    – 

  • 1
    \begingroup
    为了计算这种期望,您可能还想看看递归方法。
    \endgroup


    – 

\begingroup

也许这与另一个悖论有关,这个悖论甚至更简单(也许更直观):

我有两个女朋友,她们住在我家的对面。我对她们两个都一样喜欢,所以每天我都会随机地上路,乘坐最先到的公交车。每个方向每隔 10 分钟就有一班公交车。我本来希望可以同时见到两个女孩——但结果却发现我见到其中一个女孩的次数是另一个的四倍!

(这是记忆中的——我确信我在某个地方读过它,但快速搜索后没有找到它。)

乍一看这似乎是不可能的,但有一个合乎逻辑的解释:单向公交车会在整点、10 点、20 点等到达;而反向公交车会在 2 分钟、12 点等到达。这意味着在每个 10 分钟内,只有 2 分钟下一班公交车会朝第一个方向行驶,而其余 8 分钟下一班公交车会朝另一个方向行驶。所以我朝另一个方向行驶的可能性是其他方向的 4 倍。

与问题和其他答案一样,这里的重点是事件之间存在关联。在每个方向上,下一班公交车的预计时间是 5 分钟——但综合起来,两个方向的公交车并不独立,因此您不能只比较这些预期。

在其他例子中,相关性更难看出,但希望这能表明相关性如何扰乱你的思维。

\endgroup

1

  • \begingroup
    这个悖论故事出现在马丁·加德纳的书《啊哈!》(可能还有其他地方)中
    \endgroup


    –