Question

修复尺寸 $d$ d。写 $S^{d - 1}$ S^{d-1}超球面的表面 $R^{d}$ \mathbb{R}^d，即所有 $x = (x_{1}, \dots, x_{d}) \in R^{d}$ x = (x_1, \ldots, x_d) \in \mathbb{R}^d使得 $| x |^{2} = x_{1}^{2} + \dots + x_{d}^{2} = 1$ |x|^2 = x_1^2 + \cdots + x_d^2 = 1。我想发表一篇文章来彻底结束关于以下内容的讨论：

人们在“均匀采样”时最常见的意思是 $S^{d - 1}$ S^{d-1}，尤其是在“应用”环境中（也就是说，我认为人们谈论这个主题是因为他们确实需要编码并生成观察结果以用于某些算法）？
假设我们可以生成标准均匀分布。与问题 1 一致，有哪些最简单、数学上合理的方法可以做到这一点？

这个问题已经被广泛讨论过。例如：

甚至维基百科也有一个关于它的小部分：。

我遇到的问题是，问题 2 似乎确实有很多解决方案，但大多数解决方案之前都没有对问题 1 进行任何讨论（而且解决方案通常也不是很符合数学原理）。即使是已发表的论文似乎也没有很清楚地说明这个问题。

我认为，有限测度空间的均匀分布 $(X, F_{X}, ν)$ (X, F_X, \nu)在哪里 $ν (X) > 0$ \nu(X) > 0并且每个单例都是可测的，应该是概率测度 $P$ P密度 $f$ f关于 $ν$ \nu是恒定的。例如，无争议的 $d = 1$ d=1案件满足 $X = {1, - 1}$ X = \{1,-1\}， $ν$ \nu等于计数尺度，并且 $f (x) \equiv \frac{1}{2}$ f(x) \equiv \frac{1}{2}对于每一个 $x$ x. 区间上的均匀分布有 $f$ f恒定等于长度的倒数 $ν$ \nu是勒贝格测度。（尽管有时，当空间 $σ$ \sigma-有限像 $X = R$ X = \mathbb{R}和 $ν$ \nu等于勒贝格测度，有些情况下我们称 $f \equiv 1$ f\equiv 1均匀分布。我想这不适用于这个问题。如果 $ν (X) = 0$ \nu(X)=0，均匀分布应该保持未定义状态。）

因此，问题应该在于 $ν$ \nu什么时候 $X = S^{d - 1}$ X = S^{d-1}。最受欢迎的选择似乎仍然是表面测量（根据 Folland 分析定理 2.49 定义）。毕竟，这是在极坐标中始终使用的测量 $R^{d}$ \mathbb{R}^d。在这种情况下：

ν （ 年代 d - 1) = 2 π d 2 Γ （ d 2 ）

\begin{equation*}
\nu(S^{d-1}) = \frac{2 \pi^{\frac{d}{2}}}{\Gamma(\frac{d}{2})}
\end{equation*}

均匀分布将是：

F （ x ） \equiv Γ （ d 2 ） 2 π d 2

\begin{equation*}
f(x) \equiv \frac{\Gamma(\frac{d}{2})}{2 \pi^{\frac{d}{2}}}
\end{equation*}

这一切听起来都很合理和常规（如果不是这样，请指出）。然而，几个最流行的解决方案似乎没有使用它。从现在开始假设 $d ⩾ 2$ d \geqslant 2。我给出了一些我最感兴趣的解决方案，无论它们是对的还是错的：

使用极坐标。

X 1 X 2 X d - 1 X d = 余弦 （ φ 1 ） ， = 罪 （ φ 1 ） 余弦 （ φ 2 ） ， ⋮ = 罪 （ φ 1) \dots 罪 （ φ d - 2 ） 余弦 （ φ d - 1 ） ， = 罪 （ φ 1) \dots 罪 （ φ d - 2 ） 罪 （ φ d - 1 ） ，

\begin{align*}
x_1 &= \cos(\phi_1)\,,\\
x_2 &= \sin(\phi_1)\cos(\phi_2)\,,\\
&\quad\quad\vdots\\
x_{d-1} &= \sin(\phi_1)\cdots\sin(\phi_{d-2})\cos(\phi_{d-1})\,,\\
x_d&=\sin(\phi_1)\cdots\sin(\phi_{d-2})\sin(\phi_{d-1})\,,\\
\end{align*}

这里 $ϕ_{d - 1} \in [0, 2 π)$ \phi_{d-1} \in [0,2\pi)其余的都在 $[0, π]$ [0, \pi]。产生 $ϕ_{d - 1}$ \phi_{d-1}从 $Uniform [0, 2 π)$ \text{Uniform}[0,2\pi)其余来自 $Uniform [0, π]$ \text{Uniform}[0,\pi]全部独立，并使用上面的公式得到一个样本 $x$ x。人们似乎批评这一点 $d ⩾ 3$ d \geqslant 3仅限（例如）。如果我们使用表面测量，这似乎是一种好方法？

与解决方案 1 相同，但按照第一个参考中的答案进行操作。我不确定该方法来自哪里。

从表面来看，人们可能会得到我刚刚写到的解决方案 1 或 2，尽管我很难补充细节。但如果问题已经用 1 或 2 解决了，为什么还要这么多方法和讨论？

产生 $Y_{1}, \dots, Y_{d}$ Y_1, \ldots, Y_d独立同分布 $N (0, 1)$ N(0,1)，并将每个 $i$ i：

X 我 = 是 我 是 2 1 + \dots + 是 2 d - - - - - - - - - - - - \sqrt

\begin{equation*}
X_i = \frac{Y_i}{\sqrt{Y_1^2 + \cdots + Y_d^2}}
\end{equation*}

然后 $X = (X_{1}, \dots, X_{d})$ X = (X_1, \ldots, X_d)将统一抽样 $S^{d - 1}$ S^{d-1}。对称性似乎是直观的，但我不知道如何证明它，或者它是否与表面测度定义兼容。

我对其他方法就更加迷茫了。

我认为您在问题 1 中提出的“均匀性”概念的一种基础方法是使用。另请参阅。 — 
我不会将坐标称为 1极坐标，除非在二维空间中，例如在三维空间中，它们通常被称为球坐标 —

Answer 1

均匀分布将是：

$F （ x ） \equiv Γ （ d 2 ） 2 π d 2$
\begin{equation*}
f(x) \equiv \frac{\Gamma(\frac{d}{2})}{2 \pi^{\frac{d}{2}}}
\end{equation*}
这一切听起来合理而又常规

您尚未定义分布。这是什么意思？您正在尝试定义概率密度函数。但这些必须根据度量进行积分。什么度量？

这是答案： $S^{d - 1}$ S^{d-1}具有唯一的概率测度，该测度在群的作用下不变 $O (d)$ O(d)旋转和反射；这个测量称为密切相关 $O (d)$ O(d)。

有限集上的均匀分布 $X$ X具有类似的不变性：即，它是在所有双射下不变的唯一概率测度 $X \to X$ X \to X。

（编辑：我以为我有一个关于球面测量独特性的直接可信论据，但我认为它实际上并不有效。）

现在，由于元组的分布 $(Y_{1}, \dots Y_{d})$ (Y_1, \dots Y_d)独立同分布 $N (0, 1)$ N(0, 1)高斯分布是正交不变的（这是由于它们的协方差矩阵是正交不变的，并且高斯分布的任何线性变换也是高斯的），因此，对这个分布进行归一化，使其落在单位球面上，必须产生一个正交不变的概率测度 $S^{d - 1}$ S^{d-1}，根据唯一性，它一定是球面测量。

相比之下，我看不出有任何理由期望极坐标产生正交对称的测量。

Answer 2

给定任何 $d$ d维表面 $S \subset R^{n}$ S \subset \mathbb{R}^n（或者甚至是任何黎曼流形 $S$ S），有一个表面测量 $μ$ \mu在 $S$ S，在局部坐标中定义为 $μ (d x) = \sqrt{g (x)} d x$ \mu(dx) = \sqrt{g(x)}\,dx，在哪里 $g (x) = det G (x)$ g(x) = \det G(x)是度量张量的行列式 $G (x)$ G(x)更准确地说，假设 $ϕ : U \to V$ \phi : U \to V是带有 $O$ O打开 $R^{d}$ \mathbb{R}^d和 $U$ U打开 $S$ S。如果 $A \subset U$ A \subset U，然后

$μ （ A ） = \int 哦 1 A (φ (x)) G （ X ） - - - - \sqrt d X 。$
\mu(A) = \int_{O}1_A(\phi(x))\sqrt{g(x)}\,dx.
例如，“表面积” $4 π$ 4\pi的 $S^{2}$ S^2用微积分计算是 $μ (S^{2})$ \mu(S^2). 统一措施 $ν$ \nu在 $S$ S只是标准化 $μ$ \mu概率测度，即 $ν (A) = \frac{1}{μ (S)} μ (A)$ \nu(A) = \frac{1}{\mu(S)}\mu(A)。我没有很好的参考资料，但有一个参考资料是

Answer 3

你的第一个方法没有给出超球面的正确均匀采样。我的意思是，如果你有一个通用函数 $f$ f在球面上定义：

\int F d μ \neq ⟨f ​ （ X ） ⟩

\int fd\mu \neq \langle f(x)\rangle

和 $μ$ \mu您想要抽样的统一度量。相反，您需要添加以下因子：

\int F d μ = ⟨ f （ X 1 ， \dots ， ​ ​ X d - 1 ） 罪 d - 2 φ 1 罪 d - 3 φ 2 \dots 罪孽 ​ ​ φ d - 2 ⟩

\int fd\mu = \langle f(x_1,…,x_{d-1})\sin^{d-2}\phi_1\sin^{d-3}\phi_2…\sin\phi_{d-2}\rangle

您可以检查常数的情况， $f = 1$ f=1：

\int F d μ = Γ ( d / 2 ） 2 π d / 2 ⟨ F （ X 1 ， \dots ， ​ ​ X d - 1 ） ⟩ = 2 π d - 1

\int fd\mu = \frac{\Gamma(d/2)}{2\pi^{d/2}}\\
\langle f(x_1,…,x_{d-1})\rangle = 2\pi^{d-1}

你已经可以在 3D 中构建直觉了。正确的做法是：

d μ = 正弦 θd ​ θd ​ φ d μ \neq d θd ​ φ

d\mu = \sin\theta d\theta d\phi \\
d\mu \neq d\theta d\phi

后者是较简单的措施。

一般来说，给定坐标 $u_{1}, . . ., u_{d - 1}$ u_1,…,u_{d-1}您的表面与相应的基向量：

埃 钾 = \partial X \partial 你 钾

e_k = \frac{\partial x}{\partial u_k}

那么面积测量就是：

d μ = | det （ 埃 1 ， \dots ， ​ ​ 埃 d - 1 ， n ） | d 你 1 \dots d ​ ​ 你 d - 1

d\mu = |\det(e_1,…,e_{d-1},n)|du_1…du_{d-1}

和 $n$ n单位法向量。从采样的角度来看，这意味着：

\int F d μ \neq ⟨f ​ （ x ） | det （ 埃 1 ， \dots ， ​ ​ 埃 d - 1, n) | ⟩

\int fd\mu \neq \langle f(x)|\det(e_1,…,e_{d-1},n)|\rangle

和 $x (u_{1}, . . . u_{d - 1})$ x(u_1,…u_{d-1})由表面的参数化和 $u_{1}, . . ., u_{d - 1}$ u_1,…,u_{d-1}根据其域上的勒贝格测度进行均匀采样 $U \subset R^{d - 1}$ U\subset\mathbb R^{d-1}。

这是外在方法，你也可以使用内在方法，比如，如果你只给出黎曼流形的度量。对于球面、双曲平面等对称表面，外在方法是多余的，但可以保持对称性，更方便实际计算。

Answer 4

关于定义

这是一个很自然的问题，因为“均匀”一词有多重含义。例如，在考虑一组 n 个点、一个线段或一个有界表面时，均匀性的性质是不同的。在这三种情况下，基本思想是相同的：存在某种“自然”的测量方式（分别计数、测量长度和测量面积），并且您希望概率分布与该测量成比例。例如，从各自的间隔均匀地对纬度和经度进行采样在球面上并不均匀，因为即使存在“参数”，这种分布也不会与面积测量线性对齐。

因此，归根结底，一切都归结为定义自然度量是什么，而这个问题的答案来自两个部分。首先，欧几里得度量绝对是自然度量。其次，豪的概念让你可以在任意度量空间上定义基于度量的度量。对于空心球的情况，豪斯多夫维度是一个整数（ $d - 1$ d-1），在这种情况下，该措施与 $d - 1$ d-1勒贝格测度，即如果 $d - 1 = 0$ d-1=0，测量长度，如果 $d - 1 = 1$ d-1=1， ETC。

关于算法

有许多算法可以生成完全相同的分布。人们所说的“从球体均匀采样”是指使用任何现有的等效方法生成样本。我写了一篇，解释了基于高斯分布的方法，但它还展示了另一种可能更自然的方法：
从超球面内部的空心体积中均匀地选取一个点并将其投影到表面。要均匀地对球体内的点进行采样，您可以从更大的超立方体中反复采样，直到获得落入内部的样本。这种方法也等同于其他方法，但当您更改为其他不太自然的 p 范数时，它与其他方法不同并且更合理（令人惊讶）。

实分析 – 对超球面上均匀分布的定义及其采样问题的困惑

最佳答案
4

实分析 – 对超球面上均匀分布的定义及其采样问题的困惑

最佳答案 4

最佳答案
4