Likehood Funciton
似然函数
定义
记已知的样本集为:
联合概率密度函数$p(D | \theta)$称为相对于$\left\{x_{1}, x_{2}, \cdots, x_{N}\right\}$的θ的似然函数:
如果$\hat{\theta}$是使似然函数$l(\theta)$最大的$\theta$值,则$\hat{\theta}$应该是“最可能”的参数值,那么$\hat{\theta}$就是$l(\theta)$的极大似然估计量。
它是样本集的函数,记作:
$\hat{\theta}\left(x_{1}, x_{2}, \cdots, x_{N}\right)$称作极大似然函数估计值
求解极大似然函数
求使得出现该组样本的概率最大的$\theta$值:
实际中为了便于分析,定义了对数似然函数:
带入就有:
1.未知参数只有一个($\theta$为标量)
在似然函数满足连续、可微的正则条件下,极大似然估计量是下面微分方程的解:
或者等价于
1.未知参数有多个($\theta$为向量)
则θ可表示为具有S个分量的未知向量:
记梯度算子:
若似然函数满足连续可导的条件,则最大似然估计量就是如下方程的解:
极大似然估计的例子
例1:设样本服从正态分布$N\left(\mu, \sigma^{2}\right)$
似然函数为:
取对数
求导,得方程组:
联合解得:
所以,似然方程有唯一解$\left(\mu^{}, \sigma^{ 2}\right)$
例2:设样本服从均匀分布[a, b]
X的概率密度函数:
对样本$D=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$,有似然函数
很显然,L(a,b)作为a和b的二元函数是不连续的,这时不能用导数来求解。而必须从极大似然估计的定义出发,求L(a,b)的最大值。
为使L(a,b)达到最大,b-a应该尽可能地小,但b又不能小于$\max \left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$。类似地a不能大过$\min \left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$。因此,a和b的极大似然估计:
总结
求最大似然估计量$\hat{\theta}$的步骤:
- 写出似然函数
- 对似然函数取对数,并整理
- 求导数
- 解似然方程