Probabilistic Graphical Model
Contents
概率图模型(probabilistic graphical model, PGM),是一种学习任务的框架描述,它将学习任务归结为计算变量的概率分布。
1. 概率图基础
按照概率图中变量关系的不同,概率图模型可以大致分为两类:
- 贝叶斯网络:有向图模型,使用有向无环图表达关系(通常,变量间存在显式的因果关系)
- 马尔科夫网络:无向图模型,使用无图表达关系(通常,变量间存有关系,但是难以显式表达)
- 同时存有有向边和无向边的模型,如条件随机场(conditional random field)和链图(chain graph),单独看做一类局部有向模型。
贝叶斯网络
- 可以分为静态贝叶斯网络和动态贝叶斯网络。相比于静态贝叶斯网络,动态(dynamic)贝叶斯网络主要用于时序数据建模(如语音识别、自然语言处理、轨迹数据挖掘等)。其中,一种结构最简单的动态贝叶斯网络就是隐马尔可夫模型(hidden markov model, HMM)。一般来说,贝叶斯网络中每一个结点都对应于一个先验概率分布或者条件概率分布,因此整体的联合分布可以直接分解为所有单个结点所对应的分布的乘积。
马尔可夫网
- 由于变量之间没有明确的因果关系,它的联合概率分布通常会表达为一系列势函数(potential function)的乘积。通常情况下,这些乘积的积分并不等于1,因此,还要对其进行归一化才能形成一个有效的概率分布——这一点往往在实际应用中给参数估计造成非常大的困难。
按照表示的抽象级别不同,概率图模型可以分为:
- 基于随机变量的概率图模型,如贝叶斯网、马尔可夫网、条件随机场和链图等
- 基于模板的概率图模型.这类模型根据应用场景不同又可分为两种:
- 暂态模型,包括动态贝叶斯网(Dynamic Bayesian Network, DBN)和状态观测模型,其中状态观测模型又包括线性动态系统(Linear Dynamic System, LDS)如卡尔曼滤波器,还有隐马尔可夫模型(Hidden Markov Model, HMM);
- 对象关系领域的概率图模型,包括盘模型(Plate Model,PM)、概率关系模型(Probabilistic Relational Model,