如何解释逻辑回归模型中变量的优势比,即“比率”,即介于 0 和 1 之间的值?在这种情况下单位是什么?
例如,假设我正在对篮球投篮数据进行建模,如果球员投中,我的响应变量等于 1,如果投失,则等于 0。此外,我还有一个解释变量,即球队到那时为止的投篮准确率,这个变量的范围是 0 到 1。那么,我该如何解释这个变量的系数的几率比呢?因为我不能说它会增加 1 个单位,因为变量不能超过大于 1 的值。请问有什么关于如何解释这个的提示吗?
\endgroup
最佳答案
3
另一种方法是改变单位。这通常对解释有用,而且大多数改变不会影响结果的含义。
在这里,您可以将“比率”(0 到 1)更改为“百分比”(0 到 100)。然后“一个单位”就很容易理解了。在您的特定情况下,独立变量不仅具有 0 和 1 的绝对限制,而且除了比赛初期外,还有一些实际限制。当然,对于职业或高水平大学篮球来说,球队投篮命中率的变化范围要小得多。我认为这增加了使用 % 的适当性。
最后一个原因是,射门准确率通常以百分比来表示,因此,球迷对这个单位更加熟悉。
\endgroup
1
-
2\begingroup
感谢您的贡献。不错的方法。我会尝试一下。
\endgroup
–
|
这里有两个问题。首先,暂时忘掉几率比,在任何回归模型中,系数(或几率比、发病风险比或其他)总是告诉你,当它所附加的独立变量增加“1”时,因变量“会发生什么”。现在,正如您所注意到的,有时“增加 1”对于特定的因变量来说并不是一个现实的情况,尽管在您的例子中,它至少在数学上是有意义的:它意味着从 0 的速率变为 1 的速率。但模型并不关心这两种情况。由您来决定“一个单位的增加”在实际意义上的“效果”。在这里,由于从 0 到 1 是投篮率可以增加的最大理论量,因此系数或几率比为您提供了关系大小的“上限”。这也是二元/虚拟独立变量(如“球员在第一轮被选中”)的系数的工作方式。 “增加 1” 意味着“从 0 增加到 1”(“第一轮被选中或未选中”)。
我刚才所说的一切也适用于比值比——它们告诉你独立变量增加一个单位的“效果”,不管这意味着什么。然而,比值比,所以你应该知道,比值比并没有告诉你投篮命中概率如何变化:比值比为 1.25 并不意味着投篮命中的预期概率增加了 25%。它告诉你投篮命中的概率如何增加了 25%。所以在你试图解释比值比之前,一定要理解这种区别。
\endgroup
1
-
\begingroup
感谢您的贡献。在这种情况下,我可以通过添加 0.1 个单位来解释它吗?而不是以整个单位来思考?这样,我就可以解释这种增加对成功与不成功的几率的影响。
\endgroup
–
|
当处理逻辑回归模型中的变量(即介于 0 和 1 之间的值)时,由于变量的性质,对比值比的解释可能会有所不同。以下是如何解释此类变量的比值比。
示例上下文
假设你正在对篮球投篮数据进行建模并且具有:
- 响应变量:如果球员投篮成功则为 1,如果投篮失败则为 0。
- 解释变量:该球队到目前为止的投篮命中率(范围从 0 到 1)。
解释比值比
-
理解系数:
- 逻辑回归模型中解释变量的系数表示与解释变量的一个单位变化相关的优势比的自然对数。
- 在您的例子中,“一个单位”是指解释变量的变化量为 1。但是,由于变量是速率,范围从 0 到 1,因此一个单位的变化并不现实(因为您无法一步就将速率从 0 变为 1)。
-
解释优势比:
- 要解释利率变量变化的影响,您应该考虑变量的实际增量变化。例如,不要考虑增加一个单位,而应该考虑较小的增量,例如 0.1 个单位。
- 如果解释变量的系数为 0.5,那么球队投篮命中率每增加一个单位的几率就是
exp(0.5) ≈ 1.65
。这意味着投篮命中率每增加一个单位,投篮命中的几率就会增加大约 65%。
-
对于增量变化:
- 如果您想要解释较小的变化,例如增加 0.1 个单位,则应该计算该特定变化的优势比。
- 如果解释变量的系数为
β
,则每增加 0.1 个单位,您可以计算出几率比为exp(β × 0.1)
。这可以让您更实际地了解变量的影响。
\endgroup
1
-
\begingroup
谢谢你的贡献!我会考虑的。
\endgroup
–
|
|