用户: HoshinoKoji/认知计算建模/对变化世界状态的推断

1概率图模型

在此前的章节中, 我们主要讨论了两个随机变量的关系及其条件概率的转换. 在贝叶斯理论的框架下, 我们会根据变量的含义将 的其中一个称为似然概率, 另一个称为后验概率, 而它们可以经由贝叶斯公式互相转换. 基于生成模型假设的假设, 我们能够表达出世界状态 和观测 的关系 及其分布 , 于是得以避开联合分布的直接计算, 来间接得到我们的目标.

本质上, 先验、似然、后验的所有信息, 都蕴含在联合分布 之中. 但不独立的变量会构成复杂的联合分布, 为了讨论更多变量之间的关系, 我们需要用可接受的方式提出假设, 保证联合分布有更简单的形式, 其中的每个单元都易于理解, 而且可以显式表达. 这与贝叶斯公式的内涵是一致的.

对于变量间的条件关系, 概率图模型可以提供直观的呈现方式, 以下图为例:其含义实际上是:

而又注意到: 我们就可以得到上述概率图的一种直观理解, 即 共同为 提供的信息与 提供的信息是一样的, 换言之 只依赖于 .

推论 1.1 (对中间变量的边缘化). 基于上述关系, 假设 为连续型变量, 可以由联合分布的边缘化得到 : 为离散型变量, 则只需将积分号改为求和号: 本章节的后续推导中, 我们可能还会反复使用这一结论.

在后续建模中, 我们会使用概率图模型处理更复杂的情况.

2对连续变化的推断

在感觉和运动等过程中, 我们都需要依据感觉输入, 推断外部状态的连续变化, 而连续变化可以为贝叶斯推断模型提供重要的假设. 为简化定义和计算, 我们假设世界状态随时间变化且离散的, 每一时刻的状态只依赖于前一时刻状态: 其中 时刻的世界状态. 基于 1 对概率图模型的描述, 上图刻画的联合分布即我们称形如 的生成模型为状态转移模型 (state transition model).

类似于 1 的推导过程, 同理我们可以得到我们称具有该性质的随机过程为马尔可夫过程 (Markov process).

至此, 我们已经定义了世界状态转移的生成模型. 但在知觉建模中, 为了推断世界状态, 我们还要考虑世界状态所生成的观测: 其中 时刻的观测, 只依赖于 时刻的世界状态, 是推断世界状态的依据.

在具体问题中, 我们只需要确定所有箭头 (生成模型) 就能构建完整的联合分布, 进而完成后验推断. 在原书中, 作者设置了一个较为简单的情景: 被试的观测对象是物体的运动, 其运动速率均值不变但有正态噪声, 世界状态的离散化有相同时间间隔. 这确定了位置的状态转移概率: (2.1)

假设被试对位置的观测也具有正态分布形式, 这确定了状态到观测的生成模型: (2.2)

最后, 我们还需要设定初始状态的先验. 这是引入新观测, 完成新推断的基础: (2.3)

设定好生成模型的所有细节后, 我们可以得到图中所有变量的联合分布, 并构建贝叶斯推断的后验分布. 在这一情境中, 观察者关心的是当前时刻的世界状态 , 而可得的观测是 , 因此目标为 .

时, 的计算过程并不复杂, 因为概率图已经简化为从上图出发不难得到,

然而, 如果对于任意的 都采用类似的方法展开目标, 计算将会变得极其困难. 无论是从计算的简便性出发, 还是从被试的实际推断过程出发, 我们都希望采用一种递归的方式完成计算: 被试只需保持前一时刻的后验分布 , 并基于生成模型将最终目标表达为前一时刻的后验分布的某种变换. 直觉上, 这也与贝叶斯建模的证据整合过程相符.

为此, 我们需要简化原始的概率图, 只将每一时刻保持的变量纳入新的概率模型. 记 , 我们断言, 以下概率图可以由原始概率图导出:

命题 2.1 (概率图的可简化性). 简化概率图可由原始概率图导出, 即:

证明. 这里只列出大致证明思路. 列出联合分布后, 我们总是可以通过边缘化 (积分或求和) 删除一个末端结点, 得到一个简化的联合分布. (未完待续)

在简化概率图下, 我们最终可以写出新的后验分布:

上述分布的表达式包括了上一时刻的后验分布和已知的生成模型, 于是实现了我们的主要目标. 要计算分布的具体形式, 则只需代入 (2.1)(2.2)(2.3) 的假设.