\parinterval 在隐马尔可夫模型中隐藏着这样的假设:某隐藏状态的概率仅由上一个隐藏状态决定。这个假设也会带来一些问题。举一个例子:在某个隐马尔可夫模型中,隐藏状态集合为{A、B、C、D},可见状态集合为{T、F},待预测的可见序列为T F F T。其中隐藏状态A可能的后继隐藏状态集合为{A、B},隐藏状态B可能的后继隐藏状态集合为{A、B、C、D},于是有:
\parinterval 其中,$\funp{P}(y|x)$表示由状态$x$转移到状态$y$的概率。由于式\ref{eq:3.3-6}中的分式数量少于式\ref{eq:3.3-7},这就导致在统计中获得的$\funp{P}({\rm A}|{\rm A})$、$\funp{P}({\rm A}|{\rm B})$的值很可能会比$\funp{P}({\rm A}|{\rm B})$、$\funp{P}({\rm B}|{\rm B})$、$\funp{P}({\rm C}|{\rm B})$、$\funp{P}({\rm D}|{\rm B})$要大。如图\ref{fig:3.3-5}所示,假设初始隐藏状态是A,图中线上的概率值是对应的转移概率与发射概率的乘积,比如图中隐藏状态A开始,下一个隐藏状态是A且可见状态是F的概率是0.45,下一个隐藏状态是B且可见状态是F的概率是0.55。图中可以看出,由于有较大的值,当可见状态序列为T F F T时,隐马尔可夫计算出的最有可能的隐藏状态序列为A A A A。但是如果对训练集进行统计可能会发现,当可见序列为T F F T 时,对应的隐藏状态是A A A A的概率可能是比较大的,但也可能是比较小的。这个例子中出现预测偏差的主要原因是:由于比其他状态转移概率要大得多,隐藏状态的预测一直停留在状态A。
\parinterval 图\ref{fig:3.3-5}展示了一个具体的例子。有一个可见状态序列T F F T,假设初始隐藏状态是A,图中线上的概率值是对应的转移概率与发射概率的乘积,比如图中隐藏状态A开始,下一个隐藏状态是A 且可见状态是F 的概率是0.45,下一个隐藏状态是B 且可见状态是F的概率是0.55。图中可以看出,由于有较大的值,当可见状态序列为T F F T时,隐马尔可夫计算出的最有可能的隐藏状态序列为A A A A。但是如果对训练集进行统计可能会发现,当可见序列为T F F T 时,对应的隐藏状态是A A A A的概率可能是比较大的,但也可能是比较小的。这个例子中出现预测偏差的主要原因是:由于比其他状态转移概率要大得多,隐藏状态的预测一直停留在状态A。