修复尺寸ddd。 写年代d− 1年代d−1S^{d-1}超球面的表面RdRd\mathbb{R}^d,即所有x = (X1,… ,Xd) ∈RdX=(X1,…,Xd)∈Rdx = (x_1, \ldots, x_d) \in \mathbb{R}^d使得|十|2=X21+ ⋯ +X2d= 1|X|2=X12+⋯+Xd2=1|x|^2 = x_1^2 + \cdots + x_d^2 = 1。我想发表一篇文章来彻底结束关于以下内容的讨论:
- 人们在“均匀采样”时最常见的意思是年代d− 1年代d−1S^{d-1},尤其是在“应用”环境中(也就是说,我认为人们谈论这个主题是因为他们确实需要编码并生成观察结果以用于某些算法)?
- 假设我们可以生成标准均匀分布。与问题 1 一致,有哪些最简单、数学上合理的方法可以做到这一点?
这个问题已经被广泛讨论过。例如:
- 甚至维基百科也有一个关于它的小部分:。
我遇到的问题是,问题 2 似乎确实有很多解决方案,但大多数解决方案之前都没有对问题 1 进行任何讨论(而且解决方案通常也不是很符合数学原理)。即使是已发表的论文似乎也没有很清楚地说明这个问题。
我认为,有限测度空间的均匀分布(X,FX, ν)(X,FX,ν)(X, F_X, \nu)在哪里ν(X)> 0ν(X)>0\nu(X) > 0并且每个单例都是可测的,应该是概率测度磷磷P密度FFf关于νν\nu是恒定的。例如,无争议的d= 1d=1d=1案件满足X= { 1 , − 1 }X={1,−1}X = \{1,-1\},νν\nu等于计数尺度,并且F(x )≡12F(X)≡12f(x) \equiv \frac{1}{2}对于每一个XXx. 区间上的均匀分布有FFf恒定等于长度的倒数νν\nu是勒贝格测度。(尽管有时,当空间σσ\sigma-有限像X= RX=RX = \mathbb{R}和νν\nu等于勒贝格测度,有些情况下我们称F≡ 1F≡1f\equiv 1均匀分布。我想这不适用于这个问题。如果ν(X)= 0ν(X)=0\nu(X)=0,均匀分布应该保持未定义状态。)
因此,问题应该在于νν\nu什么时候X=年代d− 1X=年代d−1X = S^{d-1}。最受欢迎的选择似乎仍然是表面测量(根据 Folland 分析定理 2.49 定义)。毕竟,这是在极坐标中始终使用的测量RdRd\mathbb{R}^d。 在这种情况下:
\begin{equation*}
\nu(S^{d-1}) = \frac{2 \pi^{\frac{d}{2}}}{\Gamma(\frac{d}{2})}
\end{equation*}
均匀分布将是:
\begin{equation*}
f(x) \equiv \frac{\Gamma(\frac{d}{2})}{2 \pi^{\frac{d}{2}}}
\end{equation*}
这一切听起来都很合理和常规(如果不是这样,请指出)。然而,几个最流行的解决方案似乎没有使用它。从现在开始假设d⩾ 2d⩾2d \geqslant 2。我给出了一些我最感兴趣的解决方案,无论它们是对的还是错的:
- 使用极坐标。
\begin{align*}
x_1 &= \cos(\phi_1)\,,\\
x_2 &= \sin(\phi_1)\cos(\phi_2)\,,\\
&\quad\quad\vdots\\
x_{d-1} &= \sin(\phi_1)\cdots\sin(\phi_{d-2})\cos(\phi_{d-1})\,,\\
x_d&=\sin(\phi_1)\cdots\sin(\phi_{d-2})\sin(\phi_{d-1})\,,\\
\end{align*}
这里φd− 1∈ [ 0,2π)φd−1∈[0,2π)\phi_{d-1} \in [0,2\pi)其余的都在[ 0 , π][0,π][0, \pi]。 产生φd− 1φd−1\phi_{d-1}从均匀[ 0 , 2 π)制服[0,2π)\text{Uniform}[0,2\pi)其余来自均匀[ 0 , π]制服[0,π]\text{Uniform}[0,\pi]全部独立,并使用上面的公式得到一个样本XXx。人们似乎批评这一点d⩾ 3d⩾3d \geqslant 3仅限(例如)。如果我们使用表面测量,这似乎是一种好方法?
- 与解决方案 1 相同,但按照第一个参考中的答案进行操作。我不确定该方法来自哪里。
从表面来看,人们可能会得到我刚刚写到的解决方案 1 或 2,尽管我很难补充细节。但如果问题已经用 1 或 2 解决了,为什么还要这么多方法和讨论?
- 产生是1,… ,是d是1,…,是dY_1, \ldots, Y_d独立同分布否(0,1 )否(0,1)N(0,1),并将每个我我i:
\begin{equation*}
X_i = \frac{Y_i}{\sqrt{Y_1^2 + \cdots + Y_d^2}}
\end{equation*}
然后X= (X1,… ,Xd)X=(X1,…,Xd)X = (X_1, \ldots, X_d)将统一抽样年代d− 1年代d−1S^{d-1}。对称性似乎是直观的,但我不知道如何证明它,或者它是否与表面测度定义兼容。
我对其他方法就更加迷茫了。
\endgroup
2
最佳答案
4
均匀分布将是:
F(x )≡Γ (d2)2πd2F(X)≡Γ(d2)2πd2\begin{equation*}
f(x) \equiv \frac{\Gamma(\frac{d}{2})}{2 \pi^{\frac{d}{2}}}
\end{equation*}
这一切听起来合理而又常规
您尚未定义分布。这是什么意思?您正在尝试定义概率密度函数。但这些必须根据度量进行积分。什么度量?
这是答案:年代d− 1年代d−1S^{d-1}具有唯一的概率测度,该测度在群的作用下不变氧()哦(d)O(d)旋转和反射;这个测量称为密切相关氧()哦(d)O(d)。
有限集上的均匀分布XXX具有类似的不变性:即,它是在所有双射下不变的唯一概率测度X→十X→XX \to X。
(编辑:我以为我有一个关于球面测量独特性的直接可信论据,但我认为它实际上并不有效。)
现在,由于元组的分布(是1,…是d)(是1,…是d)(Y_1, \dots Y_d)独立同分布否(0,1 )否(0,1)N(0, 1)高斯分布是正交不变的(这是由于它们的协方差矩阵是正交不变的,并且高斯分布的任何线性变换也是高斯的),因此,对这个分布进行归一化,使其落在单位球面上,必须产生一个正交不变的概率测度年代d− 1年代d−1S^{d-1},根据唯一性,它一定是球面测量。
相比之下,我看不出有任何理由期望极坐标产生正交对称的测量。
\endgroup
|
- 给定任何ddd维表面年代⊂Rn年代⊂RnS \subset \mathbb{R}^n(或者甚至是任何黎曼流形年代年代S),有一个表面测量μμ\mu在年代年代S,在局部坐标中定义为μ ( dx ) =G(X )−−−−√dXμ(dX)=G(X)dX\mu(dx) = \sqrt{g(x)}\,dx, 在哪里G(x )=确定G (x )G(X)=确定G(X)g(x) = \det G(x)是度量张量的行列式G (x )G(X)G(x)更准确地说,假设φ : U→五φ:乌→五\phi : U \to V是带有哦哦O打开RdRd\mathbb{R}^d和乌乌U打开年代年代S。 如果A⊂UA⊂乌A \subset U, 然后
μ (A )=∫哦1A( φ ( x ) )G(X )−−−−√dX 。μ(A)=∫哦1A(φ(X))G(X)dX。\mu(A) = \int_{O}1_A(\phi(x))\sqrt{g(x)}\,dx.
例如,“表面积”4 π4π4\pi的年代2年代2S^2用微积分计算是μ (年代2)μ(年代2)\mu(S^2). 统一措施νν\nu在年代年代S只是标准化μμ\mu概率测度,即ν(A )=1μ ( S)μ (一个)ν(A)=1μ(年代)μ(A)\nu(A) = \frac{1}{\mu(S)}\mu(A)。我没有很好的参考资料,但有一个参考资料是
\endgroup
|
你的第一个方法没有给出超球面的正确均匀采样。我的意思是,如果你有一个通用函数FFf在球面上定义:
\int fd\mu \neq \langle f(x)\rangle
和μμ\mu您想要抽样的统一度量。相反,您需要添加以下因子:
\int fd\mu = \langle f(x_1,…,x_{d-1})\sin^{d-2}\phi_1\sin^{d-3}\phi_2…\sin\phi_{d-2}\rangle
您可以检查常数的情况,F= 1F=1f=1:
\int fd\mu = \frac{\Gamma(d/2)}{2\pi^{d/2}}\\
\langle f(x_1,…,x_{d-1})\rangle = 2\pi^{d-1}
你已经可以在 3D 中构建直觉了。正确的做法是:
d\mu = \sin\theta d\theta d\phi \\
d\mu \neq d\theta d\phi
后者是较简单的措施。
一般来说,给定坐标你1,… ,你d− 1你1,。。。,你d−1u_1,…,u_{d-1}您的表面与相应的基向量:
e_k = \frac{\partial x}{\partial u_k}
那么面积测量就是:
d\mu = |\det(e_1,…,e_{d-1},n)|du_1…du_{d-1}
和nnn单位法向量。从采样的角度来看,这意味着:
\int fd\mu \neq \langle f(x)|\det(e_1,…,e_{d-1},n)|\rangle
和X (你1,…你d− 1)X(你1,。。。你d−1)x(u_1,…u_{d-1})由表面的参数化和你1,… ,你d− 1你1,。。。,你d−1u_1,…,u_{d-1}根据其域上的勒贝格测度进行均匀采样乌⊂Rd− 1乌⊂Rd−1U\subset\mathbb R^{d-1}。
这是外在方法,你也可以使用内在方法,比如,如果你只给出黎曼流形的度量。对于球面、双曲平面等对称表面,外在方法是多余的,但可以保持对称性,更方便实际计算。
\endgroup
|
关于定义
这是一个很自然的问题,因为“均匀”一词有多重含义。例如,在考虑一组 n 个点、一个线段或一个有界表面时,均匀性的性质是不同的。在这三种情况下,基本思想是相同的:存在某种“自然”的测量方式(分别计数、测量长度和测量面积),并且您希望概率分布与该测量成比例。例如,从各自的间隔均匀地对纬度和经度进行采样在球面上并不均匀,因为即使存在“参数”,这种分布也不会与面积测量线性对齐。
因此,归根结底,一切都归结为定义自然度量是什么,而这个问题的答案来自两个部分。首先,欧几里得度量绝对是自然度量。其次,豪的概念让你可以在任意度量空间上定义基于度量的度量。对于空心球的情况,豪斯多夫维度是一个整数(d− 1d−1d-1),在这种情况下,该措施与d− 1d−1d-1勒贝格测度,即如果d− 1 = 0d−1=0d-1=0,测量长度,如果d− 1 = 1d−1=1d-1=1, ETC。
关于算法
有许多算法可以生成完全相同的分布。人们所说的“从球体均匀采样”是指使用任何现有的等效方法生成样本。我写了一篇,解释了基于高斯分布的方法,但它还展示了另一种可能更自然的方法:
从超球面内部的空心体积中均匀地选取一个点并将其投影到表面。要均匀地对球体内的点进行采样,您可以从更大的超立方体中反复采样,直到获得落入内部的样本。这种方法也等同于其他方法,但当您更改为其他不太自然的 p 范数时,它与其他方法不同并且更合理(令人惊讶)。
\endgroup
|
我认为您在问题 1 中提出的“均匀性”概念的一种基础方法是使用。另请参阅。
\endgroup
–
我不会将坐标称为 1极坐标,除非在二维空间中,例如在三维空间中,它们通常被称为球坐标
\endgroup
–
|