频率学派 vs 贝叶斯学派

无论是书本还是网站上,有很多关于频率学派和贝叶斯学派的比较。我个人是从信息使用的角度来理解它们之间的差异。所有统计方法都要基于数据信息进行分析,所以在比较频率学派和贝叶斯学派之间我们先对数据信息进行分类。

数据信息可以分为三类:总体信息样本信息先验信息

  1. 总体信息指的是总体分布或者总体分布所属分布族给我们的信息;
  2. 样本信息指总体抽取的样本提供给我们的信息;
  3. 先验信息指抽样之前有关统计问题的一些信息,一般来说先验信息主要来源于经验和历史资料。

举一个例子,假设一个随机变量 $X \sim N(\mu,\sigma^2)$ (总体分布,总体信息),从中抽取 100 个样本数据 (样本信息),假如我们知道这个随机变量表示的是突变位点对某个性状的效应值(基因组中大部分突变的效应值为0),那么 $\mu$ 很有可能为0(先验信息).

先验信息是非常重要的,比如说在女士品茶那个例子中,没有品茶能力只能靠猜,准确率为 0.5,这个就是一个先验信息。

差异1: 基于总体信息、样本信息和先验信息进行统计推断被称为贝叶斯统计学。它与经典统计学的主要差异在于是否利用先验信息。

差异2:贝叶斯学派的最基本的观点是:任一未知量 $\theta$ 都可看作一个随机变量,应用一个概率分布去描述对 $\theta$ 的未知状况;而统计学派假设未知量 $\theta$ 为一个固定的值。比如上面的正态分布例子,贝叶斯学派可能把 $\mu$ 看作服从某个分布的随机变量,而统计学派仅认为它是一个确定但未知的值。

这里的内容都是书上的,我只是负责精简提炼了一下,我觉得知乎上的这篇文章写的很好:贝叶斯学派与频率学派有何不同?- 东哥起飞的回答 - 知乎 https://www.zhihu.com/question/20587681/answer/1924709695

下面有一个评论很有意思:

一个例子

我的理解是:随机是什么?可能是一个确定的总体由于抽样误差等随机误差引起的;也可能这个总体本身就是变化的,再加上随机误差。

贝叶斯学派相当于考虑了两层,总体变化+随机误差;

统计学派只考虑了随机误差;

标签

发表评论