前言辛普森悖论(Simpson's Paradox)是英国统计学家E.H.Simpson于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可一旦合并考虑,却可能导致相反的结论。例子一个大学有商学院和法学院两个学院,这两个学院都抱怨:男生的录取率比女生录取率高!现在学校做统计:学院女生申请女生录取女生录取率男生申请男生录取男生录取率合计申请合计录取合计录取率商学院1...
贝叶斯定理是统计学中非常重要的一个定理,以贝叶斯定理为基础的统计学派在统计学世界里占据着重要的地位,和概率学派从事件的随机性出发不同,贝叶斯统计学更多地是从观察者的角度出发,事件的随机性不过是观察者掌握信息不完备所造成的,观察者所掌握的信息多寡将影响观察者对于事件的认知。推导条件概率:$$ P\left( A\mid B \right) =\frac{P\left( A\cap B \rig...
基本概念高斯分布也叫正态分布。若随机变量x服从一个数学期望为$\mu$,标准方差为$\sigma ^2$的高斯分布,记为:$$ X\thicksim N\left( \mu ,\sigma ^2 \right) $$其概率密度函数为$$ f\left( x \right) =\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{\left( x-\mu \right)...
方差在统计学中,方差是用来度量单个随机变量的离散程度。越小则说明数据越接近。$$ \sigma _x^2=\frac{1}{n-1}\sum_{i=1}^n{\left( x_i-\bar{x} \right) ^2} $$其中,$n$表示样本量,符号$\bar{x}$表示观测样本的均值.协方差协方差则一般用来刻画两个随机变量的相关程度。$$ cov \left( x,y \right) =...