频率学派 vs 贝叶斯学派

TB 8 月 14, 2024 765 0

无论是书本还是网站上，有很多关于频率学派和贝叶斯学派的比较。我个人是从信息使用的角度来理解它们之间的差异。所有统计方法都要基于数据信息进行分析，所以在比较频率学派和贝叶斯学派之间我们先对数据信息进行分类。

数据信息可以分为三类：总体信息、样本信息和先验信息。

总体信息指的是总体分布或者总体分布所属分布族给我们的信息；
样本信息指总体抽取的样本提供给我们的信息；
先验信息指抽样之前有关统计问题的一些信息，一般来说先验信息主要来源于经验和历史资料。

举一个例子，假设一个随机变量 $X \sim N(\mu,\sigma^2)$ (总体分布，总体信息)，从中抽取 100 个样本数据 (样本信息)，假如我们知道这个随机变量表示的是突变位点对某个性状的效应值(基因组中大部分突变的效应值为0)，那么 $\mu$ 很有可能为0(先验信息).

先验信息是非常重要的，比如说在女士品茶那个例子中，没有品茶能力只能靠猜，准确率为 0.5，这个就是一个先验信息。

差异1：基于总体信息、样本信息和先验信息进行统计推断被称为贝叶斯统计学。它与经典统计学的主要差异在于是否利用先验信息。

差异2：贝叶斯学派的最基本的观点是：任一未知量 $\theta$ 都可看作一个随机变量，应用一个概率分布去描述对 $\theta$ 的未知状况；而统计学派假设未知量 $\theta$ 为一个固定的值。比如上面的正态分布例子，贝叶斯学派可能把 $\mu$ 看作服从某个分布的随机变量，而统计学派仅认为它是一个确定但未知的值。

这里的内容都是书上的，我只是负责精简提炼了一下，我觉得知乎上的这篇文章写的很好：贝叶斯学派与频率学派有何不同？- 东哥起飞的回答 - 知乎 https://www.zhihu.com/question/20587681/answer/1924709695

下面有一个评论很有意思：

一个例子

我的理解是：随机是什么？可能是一个确定的总体由于抽样误差等随机误差引起的；也可能这个总体本身就是变化的，再加上随机误差。

贝叶斯学派相当于考虑了两层，总体变化+随机误差；

统计学派只考虑了随机误差；

频率学派 vs 贝叶斯学派

标签

发表评论

取消回复

标签

相关推荐

发表评论

取消回复