菠菜网

烟台开发区论坛:估计、偏差和方差

时间:6个月前   阅读:55

sunbet 申[官网(下载)

<欢迎进入>sunbet 申[官网(下载)!Sunbet 申博提供申博开户(sunbet开户)、SunbetAPP(下载)、Sunbet客户端(下载)、Sunbet<代理合作等业务>。

,
  • 「本文首发自」公众号[:RAIS

“前言”

“本系列文章为” 《Deep Learning》 读书笔记,‘可以参看原书一起阅读’,效果更佳。

<估计>

【统计的】目的“是”为了推断,大量的统计“是”为了更好的推断,这就“是”一种<估计>,【一种根据现有信息对可能性的一种猜】测。

  • 点<估计>:点<估计>指的“是”用样本数据<估计>总体的参数,<估计>的结果“是”一个点的数值,因此叫做点<估计>。「这个定义非常宽泛」,\(\hat{\theta}_m=g(x_1, x_2, ..., x_m)\),其中几乎对 g 没有什么限制,只“是”说比较好的 g 会接近真实的 θ。
  • 函数<估计>:《“是”一种映射》关系,如 \(y=f(x)+ϵ\),其中 ϵ <“是”从> x 中预测不出来的,我们不关心,我们关心的“是”函数<估计> f,函数<估计>“是”一种从输入到输出的映射关系。

偏差

<估计>的偏差定义为:\(bias(\hat{\theta}_m)=E(\hat{\theta_m})-\theta\),〖这很好理解〗,<估计>与实际值之间的距离就“是”偏差,如果偏差为 0,{{则}}\(\hat{\theta}\)“是”\(\theta\)的无偏<估计>,如果在 m 〖趋近于〗无穷大时,偏差趋近于 0,{{则}}\(\hat{\theta}\)“是”\(\theta\)“的渐进无偏”。

方差

上面我们用<估计>量的期望来计算偏差,我们还可以用<估计>量的方差度量<估计>的变化程度,“我们希望期望这两个值都较小”。

对于高斯分布来说,【我们有】:

  • 样本均值 \(\hatμ_m=\frac{1}{m}\sum_{i=1}^mx^{(i)}\) “是”高斯均值参数 μ 的无偏<估计>;
  • 样本方差 \(\hatσ_m^2=\frac{1}{m}\sum_{i=1}^m(x^{(i)}-\hatμ_m)^2\) “是” \(σ^2\) 的有偏<估计>;
  • 无偏样本方差 \(\hatσ_m^2=\frac{1}{m-1}\sum_{i=1}^m(x^{(i)}-\hatμ_m)^2\) “是” \(σ^2\) 的无偏<估计>;

无偏样本方差显然“是”比较不错的,但“是”并不总“是”最好的,有时候某一些有偏<估计>也“是”很好的。比如在机器学习中,均值标准差就非常有用:

\[SE(\hatμ_m)=\sqrt{Var[\frac{1}{m}\sum_{i=1}^mx^{(i)}]}=\frac{σ}{\sqrt{m}} \]

或者写成

\[σ_{\overline X}=\sqrt{Var(\overline X)}=\sqrt{\frac{1}{m}Var(X)}=\frac{σ}{\sqrt{m}} \]

均方误差(MSE)

\[MSE=E[(\hatθ_m-θ)^2]=Bias(\hatθ_m)^2+Var(\hatθ_m) \]

「鱼和熊掌」不可得兼,偏差和方差度量着<估计>量的两个不同误差来源,‘偏差度量着偏离真’实函数或参数的误差,方差度量着数据上任意特定采样可能导致的<估计>期望的偏差,两个<估计>, 一个偏差大[,(一个方差大),怎么〖选择〗?〖选择〗 MSE 《较小的》,〖因为〗 MSE “是”用来度量泛化误差的。偏差和方差之和就“是”均方误差:

总结

本篇主要介绍了<估计>、偏差和方差,可以用来正式的刻画过拟合。

  • 「本文首发自」公众号[:RAIS

上一篇:台州星空棋牌下载:[斯坦福大学2014机器学习教程笔记]第四章-正规方程

下一篇:教育热点问题:故事:被陌生小孩当众叫妈我险发火,看到他爸我内心渐渐狂喜(下)

网友评论