在接下来的许多章节中,我们将涉及概率分布、平均值和标准差。因此,我们在此用几页篇幅讨论概率的一些基本概念,并展示如何计算一般平均量。
考虑某个实验,例如掷硬币或掷骰子,该实验有 $n$ 个可能的结果,每个结果的概率为 $p_j$,其中 $j = 1, 2, \dots, n$。如果该实验无限重复,我们直观上期望 $$ p_j = \lim_{N \to \infty} \frac{N_j}{N} \quad j = 1, 2, \dots, n \quad \text{(B.1)} $$ 其中 $N_j$ 是事件 $j$ 发生的次数,而 $N$ 是实验重复的总次数。因为 $0 \le N_j \le N$,所以 $p_j$ 必须满足条件 $$ 0 \le p_j \le 1 \quad \text{(B.2)} $$ 当 $p_j = 1$ 时,我们说事件 $j$ 是必然的;当 $p_j = 0$ 时,我们说它是不可能的。此外,因为 $$ \sum_{j=1}^n N_j = N $$ 我们得到归一化条件, $$ \sum_{j=1}^n p_j = 1 \quad \text{(B.3)} $$ 方程 B.3 意味着某个事件发生的概率是必然的。
假设现在将某个数值 $x_j$ 与结果 $j$ 相关联。那么我们将 $x$ 的平均值或均值定义为 $$ \langle x \rangle = \sum_{j=1}^n x_j p_j = \sum_{j=1}^n x_j p(x_j) \quad \text{(B.4)} $$ 其中,在最后一项中,我们使用了扩展表示法 $p(x_j)$,表示实现数值 $x_j$ 的概率。我们将用尖括号将量括起来表示其平均值。
假设我们得到以下数据:
x | p(x) |
---|---|
1 | 0.20 |
3 | 0.25 |
4 | 0.55 |
计算 x 的平均值。
解: 使用方程 B.4,我们有 $$ \langle x \rangle = (1)(0.20) + (3)(0.25) + (4)(0.55) = 0.20 + 0.75 + 2.20 = 3.15 $$
将概率分布(如 $p_j$)解释为单位质量沿 x 轴的离散分布是很有帮助的,其中 $p_j$ 是位于点 $x_j$ 的质量分数。这种解释如图 B.1 所示。根据这种解释,x 的平均值是该系统的质心。
图 B.1
离散概率频率函数或概率密度 $p(x)$。
另一个重要的量是 $$ \langle x^2 \rangle = \sum_{j=1}^n x_j^2 p_j \quad \text{(B.5)} $$ 量 $\langle x^2 \rangle$ 称为分布 ${p_j}$ 的二阶矩,类似于转动惯量。
计算例题 B-1 中给出的数据的二阶矩。
解: 使用方程 B.5,我们有 $$ \langle x^2 \rangle = (1)^2(0.20) + (3)^2(0.25) + (4)^2(0.55) = 1(0.20) + 9(0.25) + 16(0.55) = 0.20 + 2.25 + 8.80 = 11.25 $$
注意从例题 B-1 和 B-2 可以看出 $\langle x^2 \rangle \neq \langle x \rangle^2$。这种不等性是一个普遍结果,我们将在下面证明。
一个比 $\langle x^2 \rangle$ 在物理上更有意义的量是二阶中心矩,即方差,定义为 $$ \sigma_x^2 = \langle (x - \langle x \rangle)^2 \rangle = \sum_{j=1}^n (x_j - \langle x \rangle)^2 p_j \quad \text{(B.6)} $$ 如符号所示,我们将方程 B.6 中量的平方根记为 $\sigma_x$,这被称为标准差。从方程 B.6 中的求和可以看出,如果 $x_j$ 很可能偏离 $\langle x \rangle$,那么 $\sigma_x$ 将很大,因为在这种情况下,对于重要的 $p_j$ 值,$(x_j - \langle x \rangle)$ 以及 $(x_j - \langle x \rangle)^2$ 将会很大。另一方面,如果 $x_j$ 不太可能偏离 $\langle x \rangle$,或者如果 $x_j$ 聚集在 $\langle x \rangle$ 附近,那么 $\sigma_x$ 将会很小,因为在这种情况下,对于重要的 $p_j$ 值,$(x_j - \langle x \rangle)^2$ 将会很小。因此,我们看到方差或标准差都是衡量分布相对于其均值的分散程度的量度。
方程 B.6 表明 $\sigma^2$ 是正项的和,因此 $\sigma^2 \ge 0$。此外, $$ \sigma_x^2 = \sum_{j=1}^n (x_j - \langle x \rangle)^2 p_j = \sum_{j=1}^n (x_j^2 - 2\langle x \rangle x_j + \langle x \rangle^2) p_j $$ $$ = \sum_{j=1}^n x_j^2 p_j - 2\langle x \rangle \sum_{j=1}^n x_j p_j + \sum_{j=1}^n \langle x \rangle^2 p_j \quad \text{(B.7)} $$ 这里的第一个项就是 $\langle x^2 \rangle$ (参照方程 B.5)。为了计算第二项和第三项,我们需要认识到 $\langle x \rangle$($x_j$ 的平均值)只是一个常数,因此可以从求和中提出来,使得第二项留下 $\sum x_j p_j$ 的形式,第三项留下 $\sum p_j$ 的形式。求和 $\sum x_j p_j$ 根据定义是 $\langle x \rangle$,而求和 $\sum p_j$ 由于归一化(方程 B.3)等于一。将这些汇总起来,我们发现 $$ \sigma_x^2 = \langle x^2 \rangle - 2\langle x \rangle \langle x \rangle + \langle x \rangle^2 \sum_{j=1}^n p_j $$ $$ \sigma_x^2 = \langle x^2 \rangle - 2\langle x \rangle^2 + \langle x \rangle^2 (1) $$ $$ \sigma_x^2 = \langle x^2 \rangle - \langle x \rangle^2 \ge 0 \quad \text{(B.8)} $$ 因为 $\sigma_x^2 \ge 0$,我们看到 $\langle x^2 \rangle \ge \langle x \rangle^2$。考虑方程 B.6 表明,只有当 $x_j = \langle x \rangle$ 的概率为一时,$\sigma_x^2 = 0$ 或 $\langle x \rangle^2 = \langle x^2 \rangle$;这种情况并非真正的概率性事件,因为事件 $j$ 在每次试验中都会发生。
到目前为止,我们只考虑了离散分布,但连续分布在物理化学中也很重要。使用单位质量类比很方便。考虑将单位质量连续分布在 x 轴上,或 x 轴上的某个区间内。我们将线性质量密度 $p(x)$ 定义为 $dm = p(x)dx$,其中 $dm$ 是位于 $x$ 和 $x + dx$ 之间的质量分数。因此,通过类比,我们说某个量 $x$(例如箱中粒子的位置)位于 $x$ 和 $x + dx$ 之间的概率是 $$ \text{Prob}(x, x + dx) = p(x)dx \quad \text{(B.9)} $$ 并且 $$ \text{Prob}(a \le x \le b) = \int_a^b p(x)dx \quad \text{(B.10)} $$ 在质量类比中,Prob${a \le x \le b}$ 是位于区间 $a \le x \le b$ 内的质量分数。归一化条件是 $$ \int_{-\infty}^\infty p(x)dx = 1 \quad \text{(B.11)} $$ 参照方程 B.4 至 B.6,我们有以下定义 $$ \langle x \rangle = \int_{-\infty}^\infty x p(x)dx \quad \text{(B.12)} $$ 以及 $$ \langle x^2 \rangle = \int_{-\infty}^\infty x^2 p(x)dx \quad \text{(B.13)} $$ $$ \sigma_x^2 = \int_{-\infty}^\infty (x - \langle x \rangle)^2 p(x)dx \quad \text{(B.14)} $$
也许最简单的连续分布是所谓的均匀分布,其中 $$ p(x) = \begin{cases} A & a \le x \le b \ 0 & \text{其他} \end{cases} $$ 证明 $A$ 必须等于 $1/(b - a)$。计算此分布的 $\langle x \rangle$、$\langle x^2 \rangle$、$\sigma^2_x$ 和 $\sigma_x$。
解: 因为 $p(x)$ 必须归一化, $$ \int_a^b p(x)dx = 1 $$ 由于当 $a \le x \le b$ 时 $p(x) = A$,其他情况下为 $0$,积分范围是 $[a, b]$。 $$ \int_a^b A dx = A \int_a^b dx = A[x]_a^b = A(b - a) $$ 因此,$A(b - a) = 1$,这意味着 $A = \frac{1}{b-a}$。所以, $$ p(x) = \begin{cases} \frac{1}{b-a} & a \le x \le b \ 0 & \text{其他} \end{cases} $$
$x$ 的平均值由下式给出 $$ \langle x \rangle = \int_a^b x p(x)dx = \int_a^b x \frac{1}{b-a} dx = \frac{1}{b-a} \int_a^b x dx $$ $$ = \frac{1}{b-a} \left[ \frac{x^2}{2} \right]_a^b = \frac{b^2 - a^2}{2(b-a)} = \frac{(b-a)(b+a)}{2(b-a)} = \frac{b+a}{2} $$
而 $x$ 的二阶矩由下式给出 $$ \langle x^2 \rangle = \int_a^b x^2 p(x)dx = \int_a^b x^2 \frac{1}{b-a} dx = \frac{1}{b-a} \int_a^b x^2 dx $$ $$ = \frac{1}{b-a} \left[ \frac{x^3}{3} \right]_a^b = \frac{b^3 - a^3}{3(b-a)} = \frac{(b-a)(b^2 + ab + a^2)}{3(b-a)} = \frac{b^2 + ab + a^2}{3} $$
最后,方差由方程 B.8 给出,因此 $$ \sigma_x^2 = \langle x^2 \rangle - \langle x \rangle^2 = \frac{b^2 + ab + a^2}{3} - \left( \frac{b+a}{2} \right)^2 $$ $$ = \frac{b^2 + ab + a^2}{3} - \frac{b^2 + 2ab + a^2}{4} $$ $$ = \frac{4(b^2 + ab + a^2) - 3(b^2 + 2ab + a^2)}{12} = \frac{4b^2 + 4ab + 4a^2 - 3b^2 - 6ab - 3a^2}{12} $$ $$ = \frac{b^2 - 2ab + a^2}{12} = \frac{(b-a)^2}{12} $$
而标准差是 $$ \sigma_x = \sqrt{\frac{(b-a)^2}{12}} = \frac{|b-a|}{\sqrt{12}} $$ 假设 $b>a$,则 $\sigma_x = \frac{b-a}{\sqrt{12}}$。
最常见且最重要的连续概率分布是高斯分布,由 $p(x)dx = ce^{-x^2/2a^2} dx \quad -\infty < x < \infty$ 给出。求 $c$、$\langle x \rangle$、$\sigma_x^2$ 和 $\sigma_x$。
解: 常数 $c$ 由归一化确定: $$ \int_{-\infty}^\infty p(x)dx = 1 = c \int_{-\infty}^\infty e^{-x^2/2a^2} dx \quad \text{(B.15)} $$ 如果你查阅积分表(例如,The CRC Standard Mathematical Tables 或 The CRC Handbook of Chemistry and Physics, CRC Press),你不会找到上面的积分。但是,你会找到积分 $$ \int_0^\infty e^{-ax^2} dx = \left( \frac{\pi}{4\alpha} \right)^{1/2} \quad \text{(B.16)} $$ 你找不到积分限为 $(-\infty, \infty)$ 的积分的原因如图 B.2(a) 所示,其中绘制了 $e^{-\alpha x^2}$ 对 $x$ 的曲线。注意曲线关于纵轴对称,因此轴两侧的对应面积相等。具有数学性质 $f(x) = f(-x)$ 的函数称为偶函数。对于偶函数 $$ \int_{-A}^A f_{\text{even}}(x)dx = 2 \int_0^A f_{\text{even}}(x)dx \quad \text{(B.17)} $$ 如果我们认识到 $p(x) = ce^{-x^2/2a^2}$ 是一个偶函数并使用方程 B.16,那么我们发现 $$ c \int_{-\infty}^\infty e^{-x^2/2a^2} dx = 2c \int_0^\infty e^{-x^2/2a^2} dx $$ 令 $\alpha = 1/(2a^2)$。那么 $$ 2c \int_0^\infty e^{-x^2/2a^2} dx = 2c \left( \frac{\pi}{4(1/2a^2)} \right)^{1/2} = 2c \left( \frac{\pi}{2/a^2} \right)^{1/2} = 2c \left( \frac{\pi a^2}{2} \right)^{1/2} $$ 将其设为 1 进行归一化: $$ 2c \left( \frac{\pi a^2}{2} \right)^{1/2} = 1 $$ 求解 $c$: $$ c = \frac{1}{2} \left( \frac{2}{\pi a^2} \right)^{1/2} = \left( \frac{1}{4} \frac{2}{\pi a^2} \right)^{1/2} = \left( \frac{1}{2\pi a^2} \right)^{1/2} = (2\pi a^2)^{-1/2} $$ 或 $c = 1/(2\pi a^2)^{1/2}$。
图 B.2
(a) 函数 $f(x) = e^{-x^2}$ 是偶函数,$f(x) = f(-x)$。(b) 函数 $f(x) = xe^{-x^2}$ 是奇函数,$f(x) = -f(-x)$。
$x$ 的平均值由下式给出 $$ \langle x \rangle = \int_{-\infty}^\infty x p(x)dx = (2\pi a^2)^{-1/2} \int_{-\infty}^\infty x e^{-x^2/2a^2} dx \quad \text{(B.18)} $$ 方程 B.18 中的被积函数绘制在图 B.2(b) 中。注意此曲线关于纵轴反对称,并且纵轴一侧的面积抵消了另一侧的对应面积。具有数学性质 $f(x) = -f(-x)$ 的函数称为奇函数。对于奇函数, $$ \int_{-A}^A f_{\text{odd}}(x)dx = 0 \quad \text{(B.19)} $$ 函数 $x e^{-x^2/2a^2}$ 是一个奇函数,因此 $$ \langle x \rangle = (2\pi a^2)^{-1/2} \int_{-\infty}^\infty x e^{-x^2/2a^2} dx = 0 $$
$x$ 的二阶矩由下式给出 $$ \langle x^2 \rangle = (2\pi a^2)^{-1/2} \int_{-\infty}^\infty x^2 e^{-x^2/2a^2} dx $$ 在这种情况下,被积函数是偶函数,因为 $y(x) = x^2 e^{-x^2/2a^2} = y(-x)$。因此, $$ \langle x^2 \rangle = 2(2\pi a^2)^{-1/2} \int_0^\infty x^2 e^{-x^2/2a^2} dx $$ 积分 $$ \int_0^\infty x^2 e^{-\alpha x^2} dx = \frac{1}{4\alpha} \left( \frac{\pi}{\alpha} \right)^{1/2} \quad \text{(B.20)} $$ 可以在积分表中找到。使用 $\alpha = 1/(2a^2)$: $$ \langle x^2 \rangle = 2(2\pi a^2)^{-1/2} \left( \frac{1}{4(1/2a^2)} \left( \frac{\pi}{1/2a^2} \right)^{1/2} \right) $$ $$ = 2(2\pi a^2)^{-1/2} \left( \frac{a^2}{2} (2\pi a^2)^{1/2} \right) $$ $$ = 2 \frac{1}{(2\pi a^2)^{1/2}} \frac{a^2}{2} (2\pi a^2)^{1/2} = a^2 $$
因为 $\langle x \rangle = 0$,所以 $\sigma_x^2 = \langle x^2 \rangle - \langle x \rangle^2 = a^2 - 0^2 = a^2$,因此 $\sigma_x$ 由下式给出 $$ \sigma_x = a $$
正态分布的标准差是出现在指数中的参数。归一化高斯分布函数的标准表示法是 $$ p(x)dx = (2\pi \sigma_x^2)^{-1/2} e^{-x^2/2\sigma_x^2} dx \quad \text{(B.21)} $$
图 B.3
高斯分布 $p(x)$(方程 B.21)对应于三个 $\sigma_x$ 值的曲线图。虚线对应于 $\sigma_x = 2$,实线对应于 $\sigma_x = 1$,点划线对应于 $\sigma_x = 0.5$。
图 B.3 显示了不同 $\sigma_x$ 值对应的方程 B.21。注意,对于较小的 $\sigma_x$ 值,曲线变得更窄更高。高斯分布的一个更一般版本是 $$ p(x)dx = (2\pi \sigma_x^2)^{-1/2} e^{-(x-\langle x \rangle)^2/2\sigma_x^2} dx \quad \text{(B.22)} $$ 这个表达式看起来与图 B.3 中的曲线类似,只是曲线的中心位于 $x = \langle x \rangle$ 而不是 $x = 0$。高斯分布是所有科学中最重要和常用的概率分布之一。
B-1. 考虑一个粒子被限制在一个一维线段 0 到 $a$ 上。我们将在下一章中学到,粒子被发现在 $x$ 和 $x + dx$ 之间的概率由下式给出 $$ p(x)dx = \frac{2}{a} \sin^2\left(\frac{n\pi x}{a}\right) dx $$ 其中 $n = 1, 2, 3, \dots$。首先证明 $p(x)$ 已归一化。现在计算粒子沿线段的平均位置。你需要的积分为 (The CRC Handbook of Chemistry and Physics 或 The CRC Standard Mathematical Tables, CRC Press) $$ \int \sin^2(ax)dx = \frac{x}{2} - \frac{\sin(2ax)}{4a} $$ 和 $$ \int x \sin^2(ax)dx = \frac{x^2}{4} - \frac{x \sin(2ax)}{4a} - \frac{\cos(2ax)}{8a^2} $$
B-2. 计算与习题 B-1 中给出的概率分布相关的方差。必要的积分为 (CRC tables) $$ \int x^2 \sin^2(ax)dx = \frac{x^3}{6} - \left(\frac{x^2}{4a} - \frac{1}{8a^3}\right) \sin(2ax) - \frac{x \cos(2ax)}{4a^2} $$
B-3. 使用习题 B-1 中给出的概率分布,计算粒子在 0 和 $a/2$ 之间找到的概率。必要的积分在习题 B-1 中给出。
B-4. 明确证明 $$ \int_{-\infty}^\infty e^{-ax^2} dx = 2 \int_0^\infty e^{-ax^2} dx $$ 通过将从 $-\infty$ 到 $\infty$ 的积分分解为从 $-\infty$ 到 0 和从 0 到 $\infty$ 的两个积分。现在在第一个积分中令 $z = -x$,在第二个积分中令 $z = x$ 来证明上述关系。
B-5. 使用习题 B-4 中的步骤,明确证明 $$ \int_{-\infty}^\infty x e^{-ax^2} dx = 0 $$
B-6. 我们将在第 25 章中学到,气体中的分子以各种速度运动,并且分子速度介于 $v$ 和 $v + dv$ 之间的概率由下式给出 $$ p(v)dv = 4\pi \left(\frac{m}{2\pi k_B T}\right)^{3/2} v^2 e^{-mv^2/2k_B T} dv \quad 0 \le v < \infty $$ 其中 $m$ 是粒子的质量,$k_B$ 是玻尔兹曼常数(摩尔气体常数 $R$ 除以阿伏伽德罗常数),$T$ 是开尔文温度。分子速度的概率分布称为麦克斯韦-玻尔兹曼分布。首先证明 $p(v)$ 已归一化,然后确定平均速度与温度的关系。必要的积分为 (CRC tables) $$ \int_0^\infty x^{2n} e^{-ax^2} dx = \frac{1 \cdot 3 \cdot 5 \dots (2n-1)}{2^{n+1} a^n} \left(\frac{\pi}{a}\right)^{1/2} \quad n \ge 1 $$ 和 $$ \int_0^\infty x^{2n+1} e^{-ax^2} dx = \frac{n!}{2a^{n+1}} $$ 其中 $n!$ 是 $n$ 的阶乘,或 $n! = n(n-1)(n-2)\dots(1)$。
B-7. 使用习题 B-6 中的麦克斯韦-玻尔兹曼分布,确定气相分子平均动能与温度的关系。必要的积分在习题 B-6 中给出。
埃尔温·薛定谔
埃尔温·薛定谔于 1887 年 8 月 12 日出生于奥地利维也纳,并于 1961 年在此逝世。他于 1910 年在维也纳大学获得理论物理学博士学位。随后,他在德国担任了多个职位,并于 1927 年应马克斯·普朗克的请求,接替普朗克在柏林大学的职位。1933 年,薛定谔因反对希特勒和纳粹政策而离开柏林,并最终于 1936 年移居奥地利格拉茨大学。在德国入侵奥地利后,他于 1936 年被强制解除教授职务。随后,他移居爱尔兰都柏林大学学院,在那里为他创建了高等研究所。他在那里居住了 17 年,然后退休回到他的故乡奥地利。薛定谔于 1933 年与保罗·狄拉克共同获得了诺贝尔物理学奖,以表彰他们“发现了原子理论的新生产性形式”。薛定谔拒绝接受波动力程的概率性解释,这导致与马克斯·玻恩产生了严重分歧,但尽管他们在科学上有分歧,却仍然保持着亲密的友谊。薛定谔更喜欢独自工作,因此不像量子力学的其他几位开发者那样形成了学派。他的有影响力的著作《生命是什么?》促使许多物理学家对生物学产生了兴趣。他相当不羁的个人生活,沃尔特·摩尔在他的著作《薛定谔》(剑桥大学出版社, 1989)中进行了引人入胜的记述。