似然函数

Likehood Funciton

似然函数

定义

记已知的样本集为:

联合概率密度函数$p(D | \theta)$称为相对于$\left\{x_{1}, x_{2}, \cdots, x_{N}\right\}$的θ的似然函数:

如果$\hat{\theta}$是使似然函数$l(\theta)$最大的$\theta$值,则$\hat{\theta}$应该是“最可能”的参数值,那么$\hat{\theta}$就是$l(\theta)$的极大似然估计量。

它是样本集的函数,记作:

$\hat{\theta}\left(x_{1}, x_{2}, \cdots, x_{N}\right)$称作极大似然函数估计值

求解极大似然函数

求使得出现该组样本的概率最大的$\theta$值:

实际中为了便于分析,定义了对数似然函数:

带入就有:

1.未知参数只有一个($\theta$为标量)

在似然函数满足连续、可微的正则条件下,极大似然估计量是下面微分方程的解:

或者等价于

1.未知参数有多个($\theta$为向量)

则θ可表示为具有S个分量的未知向量:

记梯度算子:

若似然函数满足连续可导的条件,则最大似然估计量就是如下方程的解:

极大似然估计的例子

例1:设样本服从正态分布$N\left(\mu, \sigma^{2}\right)$

似然函数为:

取对数

求导,得方程组:

联合解得:

所以,似然方程有唯一解$\left(\mu^{}, \sigma^{ 2}\right)$

例2:设样本服从均匀分布[a, b]

X的概率密度函数:

对样本$D=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$,有似然函数

很显然,L(a,b)作为a和b的二元函数是不连续的,这时不能用导数来求解。而必须从极大似然估计的定义出发,求L(a,b)的最大值
为使L(a,b)达到最大,b-a应该尽可能地小,但b又不能小于$\max \left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$。类似地a不能大过$\min \left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$。因此,a和b的极大似然估计:

总结

求最大似然估计量$\hat{\theta}$的步骤:

  1. 写出似然函数
  2. 对似然函数取对数,并整理
  3. 求导数
  4. 解似然方程
0%