‘壹’ 概率图模型(1)——马尔可夫链
马尔可夫链:过程在 时刻所处状态条件与过程在时刻 之前所出的状态无关。(在已经知道“现在”的条件下,其“将来”与“过去”无关)
数学表达为:
Bob和Alice是一对好朋友,Bob的心情与天气有关,如果天气很好为 sunny,记为S ,Bob一般是处于 happy,记为H 状态的,如果天气是 rain,记为R ,Bob的心情一般是处于 grumpy,记为G 状态的。 Alice呢,是一个很细心很会观察的女孩,收集了14天以来 天气情基培谈况 ,以及Bob15天的 心情 。
统计图中状态转换对应的数量:
统计图中状态转换对应的数量:
绘制了下面这张图。
图3-1中的几个概率值称为 transition probabilities
图3-2中的几个概率值称为 emission probabilities
在[图2. Bob心情与天气对应关系]中,晴天有十天,雨天有五天,在Bob没有任何信息提示的情况下,晴天所占比例为 ,雨天所占比例为 。所以第一问题的答案为有 的可能性是晴天, 的可能性是雨天。
其实这是一个贝叶斯问题:
已知
, ,
, ,
, ,
,
求 与 的搏碰概率。
连续三天,共有 中可能:
以第3种情况为例:
这样分别计算8中情况,取概率最大的
考虑了六天,那么总共有 种可能性,每增加一天,考虑的可能性是呈指数上升的,在这里,需要借助 动态规划 的思想。
Alice根据Bob心情预测天气的例子就是问题3——预测问题。
通过一道简单例题说明:
分为以下几个步骤:
在 时刻,红球的概率为
在 时刻,3个盒子转移到不同盒子的概率以及生成白球的概率如下表所示。
完整过程如下:
代表,在 时刻,在盒子1是红球的中尺条件的情况下,观测序列是:白,红2(第二颗红球)的概率。
在 时刻
在 时刻
每一个盒子的概率和的意义为:该盒子是白球的条件下,观测序列为[红球]的概率
给定模型参数 和观测 ,在时刻 处于状态 的概率记为:
在学习算法中,分为 监督学习 和 非监督学习 。
当训练集中包括了 观测序列 和 状态序列 时,可采用监督学习的方法对参数值进行估计。
本文第3节“隐马尔科夫的科学推导” 之“3.1 基本概念” 中“隐马尔可夫模型的形式定义”下方的Bob心情与天气的例子。
当训练集仅包括 观测序列 ,目标是学习估计马尔科夫的参数(状态转移矩阵,观测概率矩阵以及初始概率)
此时,将观测序列看做是观测数据 ,状态序列看做是隐变量 借助 EM模型 即可求解。
具体例子见本文2.3节:Viterbi 算法
‘贰’ 马尔可夫链的原理简介
马尔可夫链(Markov Chain),描述了一种状态序列,其每个状态值取决于前面有限个状态。马尔可夫链是具有马尔可夫性质的随机变量的一个数列。这些变量的咐槐咐范围,即它们所有可能取值的集合,被称为“状明扮态衡纯空间”,而的值则是在时间n的状态。如果对于过去状态的条件概率分布仅是的一个函数,则
这里x为过程中的某个状态。上面这个恒等式可以被看作是马尔可夫性质。