这可能是一个新手问题,但“为什么” 1 个标准差是这个数字?据我所知,1 SD 处的导数是 ±1(是吗?)但这有什么关系?您不能将 1 SD 定义为导数为 e 或 π 或其他“有趣”常数的点吗?此外,1 SD 覆盖约 68% – 同样,68% 有什么特殊之处吗?为什么不是 2/3 或 50% 或 80%(因为 80-20 经验法则)?
\endgroup
1
最佳答案
2
标准差
- 是方差的平方根,
- 与数据有相同的单位,是分布尺度的度量
这就是考虑该统计数据的原因。
它具有一些附加属性(例如,分布的一部分不超过期望的一个标准差,并且分布的一部分不小于期望的一个标准差;111标准差高于或低于预期是正常密度曲线的拐点,但它们对方差和尺度关系的这一要点来说是辅助性的。
\endgroup
|
我不完全理解你所说的关于导数的内容,但我认为这对理解标准差并没有什么帮助。部分问题在于,我认为你混淆了一般标准差的概念和正态曲线的标准差。
这是最基本的思考方式。任何统计分布,无论其形状如何(钟形、扁平、双峰等),都有一个平均值。标准差表示其他值与该平均值的“接近程度”,即“平均而言”。要计算标准差,您基本上要找到每个点到平均值的距离,然后取这些距离的平均值(实际上是取这些距离的平方的平均值,然后取该平均值的平方根)。因此,如果您的标准差为 2.5,则意味着(或多或少)每个点与平均值之间的平均距离为 2.5。因此,标准差为 1 仅表示平均值在平均值的 1 个点以内。
这就是一般的标准偏差。现在,正态(高斯)曲线是一种非常特殊的钟形分布,它(除其他外)描述了随机误差偏离真实值的方式(其公式中确实有数字“e”和“pi”,但在这种情况下并不特别相关),因此它可以告诉我们从随机样本中得出的估计值应该有多少误差。正因为如此,我们对这种分布了解很多,而且我们碰巧知道的一件事是,如果你将其标准化,使平均值为 0,标准差为 1,我们就可以计算出介于任意两组值之间的观测值的百分比。所以我们知道约 68% 的观测值介于 -1 和 1 个标准差之间,或者约 95% 的观测值介于 -1.96 和 1.96 个标准差之间(1.96 非常接近 2)。这些数字本身并没有什么特别之处,但因为我们知道它们,所以我们可以用它们来计算通用标准,以决定一个发现是否“真实”,而不是仅仅由于随机误差。
\endgroup
|
你说的“1 SD 处的导数是 +- 1”是什么意思?什么的导数?如果你指的是密度图,那么是什么分布?正态分布?不同的分布在 1 SD 处的导数与平均值会有所不同。
\endgroup
–
|