👋欢迎来到黄铜扳手图书馆

随机过程(四):Markov过程

一种无后效性的随机过程

Markov过程

  有一类随机过程,它具备所谓的“无后效性”(Markov性),即,要确定过程将来的状态,知道它此刻的情况就足够了,并不需要对它以往的情况的认识,这类过程称为Markov过程。本文将介绍Markov过程中最简单的两种类型:离散时间Markov链(简称马氏链)及连续时间的Markov链。

基本概念

Markov链的定义

Markov链

  定义1(Markov链):给定随机过程 $\set{X_n,n=0,1,2,\cdots}$ ,若它只取有限或可列个值 $E_0,E_1,E_2,\cdots$ (我们以 $\set{0,1,2,\cdots}$ 来标记 $E_0,E_1,E_2$ 并称他们是过程的状态,$\set{0,1,2\cdots}$ 或者其子集记为 $S$ ,称为过程的状态空间)。若对 $\set{X_n,n=0,1,2,\cdots}$ (一般就认为它的状态是非负整数)和任意的 $n\ge0$ 及状态 $i,j,i_0,i_1\cdots,i_{n-1}$ ,有

$$\begin{aligned} &P\set{X_{n+1}=j|X_0=i_0,X_1=i_1,X_2=i_2,\cdots,X_{n-1}=i_{n-1},X_n=i}\\[5pt] =&P\set{X_{n+1}=j|X_n=i} \tag{1}\end{aligned}$$

  则称随机过程 $\set{X_n,n=0,1,2,\cdots}$ 为Markov链

Markov性

(1)刻画了Markov链的特性,故称为Markov性

转移概率

转移概率的定义

  定义2(一步转移概率):称(1)中的条件概率 $P\set{X_{n+1}=j|X_n=i}$ 为Markov链 $\set{X_n\left(n=0,1,2,\cdots\right)}$ 的一步转移概率,简称转移概率
  一般情况下,转移概率与状态 $i,j$ 和时刻 $n$ 有关。

时齐Markov链

  定义3(时齐):当Markov链的转移概率只与状态 $i,j$ 有关,而与 $n$ 无关时,称Markov链为时齐的,并记 $p_{ij}=P\set{X_{n+1}=j|X_n=i}\left(n \ge 0\right)$ ;否则,就称之为非时齐的。
  本文只讨论时齐Markov链并将其简称为Markov链。

有限链和无限链

  定义4(有限链和无限链):当Markov链的状态为有限时,成为有限链,否则成为无限链。但无论状态有限还是无限,我们都可以将 $p_{ij}\left(i,j\in S\right)$ 排成一个矩阵的形式,令

$$\begin{aligned} \bm{P}=\left(p_{ij}\right)= \begin{pmatrix} p_{00} & p_{01} & p_{02} & p_{03} & \cdots \\[5pt] p_{10} & p_{11} & p_{12} & p_{13} & \cdots \\[5pt] p_{20} & p_{21} & p_{22} & p_{23} & \cdots \\[5pt] p_{30} & p_{31} & p_{32} & p_{33} & \cdots \\[5pt] \vdots & \vdots & \vdots & \vdots & \ddots \\[5pt] \end{pmatrix} \tag{2}\end{aligned}$$

  则称 $\bm{P}$ 为转移概率矩阵,一般称为转移矩阵。容易看出 $p_{ij}\left(i,j\in S\right)$ 有性质

$$\begin{aligned} p_{ij} \ge 0, i,j\in S \tag{3}\end{aligned}$$ $$\begin{aligned} \sum_{j \in S}{p_{ij}} = 1, \forall i \in S \tag{4}\end{aligned}$$

n步转移概率与C-K方程

n步转移概率

  定义5(n步转移概率):称条件概率

$$\begin{aligned} p_{ij}^{\left(n\right)}=P\set{X_{m+n}=j|X_m=i}\quad i,j\in S,m \ge 0, n \ge 1 \tag{5}\end{aligned}$$

  为Markov链的n步转移概率,相应地称 $\bm{P}^{\left(n\right)}=\left(p_{ij}^{\left(n\right)}\right)$ 为n步转移矩阵
  当 $n=1$ 时,$p_{ij}^{\left(1\right)}=p_{ij}$ ,$\bm{P}^{\left(1\right)}=\bm{P}$ 。此外规定

$$\begin{aligned} p_{ij}^{\left(0\right)}= \begin{cases} 0, \quad i \ne j\\[5pt] 1, \quad i=j \end{cases} \tag{6}\end{aligned}$$

  显然,n步转移概率 $p_{ij}^{\left(n\right)}$ 指的就是系统从状态 $i$ 经过 $n$ 步后转移到了 $j$ 的概率,它对中间的 $n-1$ 步转移经过的状态无要求。下面的定理给出了 $p_{ij}^{\left(n\right)}$ 和 $p_{ij}$ 的关系。

C-K方程

  定理1(Charpman-Kolmogorov方程(C-K方程)):对一切 $n,m \ge 0$ ,$i,j \in S$ 有

$$\begin{aligned} p_{ij}^{\left(m+n\right)}=\sum_{k \in S}{p_{ik}^{\left(m\right)}}p_{kj}^{\left(n\right)} \tag{7}\end{aligned}$$ $$\begin{aligned} \bm{P}^{\left(n\right)}=\bm{P} \cdot \bm{P}^{\left(n-1\right)} = \bm{P} \cdot \bm{P} \cdot \bm{P}^{\left(n-2\right)} = \cdots = \bm{P}^n \tag{8}\end{aligned}$$

 〔证明(C-K方程)〕由全概率公式可得

$$\begin{aligned} p_{ij}^{\left(m+n\right)}&=P\set{X_{m+n}=j|X_0=i}\\[5pt] &=\frac{P\set{X_{m+n}=j,X_0=i}}{P\set{X_0=i}}\\[10pt] &=\sum_{k \in S}{\frac{P\set{X_{m+n}=j,X_m=k,X_0=i}}{P\set{X_0=i}}}\text{(全概率公式)}\\ &=\sum_{k \in S}{\frac{P\set{X_{m+n}=j,X_m=k,X_0=i}}{P\set{X_m=k,X_0=i}}\frac{P\set{X_m=k,X_0=i}}{P\set{X_0=i}}}\\ &=\sum_{k \in S}{P\set{X_{m+n}=j|X_m=k,X_0=i}}P\set{X_m=k|X_0=i}\\ &=\sum_{k \in S}{p_{kj}^{\left(n\right)}p_{ik}^{\left(m\right)}}\\ &=\sum_{k \in S}{p_{ik}^{\left(m\right)}p_{kj}^{\left(n\right)}} \tag{9}\end{aligned}$$

  由矩阵乘法易得(8)(7)的矩阵形式。

  命题1:对任意 $n_1,n_2,n_3,\cdots,n_m\left(n_i\ge0\right)$ 和 $k_1,k_2,k_3,\cdots,k_m\left(k_j \in S\right)$ ,有

$$\begin{aligned} p_{ij}^{\left(n_1+n_2+n_3+\cdots+n_m\right)}\ge p_{ik_1}^{\left(n_1\right)}p_{k_1k_2}^{\left(n_2\right)}p_{k_2k_3}^{\left(n_3\right)}\cdots p_{k_{m-1}j}^{\left(n_m\right)} \tag{10}\end{aligned}$$

证毕

 〔证明(命题1)〕由C-K方程概率的非负性可得

$$\begin{aligned} p_{ij}^{\left(n_1+n_2+n_3+\cdots+n_m\right)}=&\sum_{k \in S}p_{ik}^{\left(n_1\right)}p_{kj}^{\left(n_2+n_3+\cdots+n_m\right)}\\[5pt] \ge&p_{ik_1}^{\left(n_1\right)}p_{k_1j}^{\left(n_2+n_3+\cdots+n_m\right)}\\[5pt] \ge&\sum_{k \in S}p_{ik_1}^{\left(n_1\right)}p_{k_1k}^{\left(n_2\right)}p_{kj}^{\left(n_3+\cdots+n_m\right)}\\ \ge&p_{ik_1}^{\left(n_1\right)}p_{k_1k_2}^{\left(n_2\right)}p_{k_2j}^{\left(n_3+\cdots+n_m\right)}\\ \vdots\\ \ge&p_{ik_1}^{\left(n_1\right)}p_{k_1k_2}^{\left(n_2\right)}p_{k_2k_3}^{\left(n_3\right)}\cdots p_{k_{m-1}j}^{\left(n_m\right)} \tag{11}\end{aligned}$$

证毕

状态的分类及性质

可达、互通、类、可约

  定义6(可达与互通):称状态 $i$ 可达状态 $j\left(i,j \in S\right)$ ,若存在 $n \ge 0$ 使得 $p_{ij}^{\left(n\right)} \ge 0$ ,记为 $i \rightarrow j$ 。若同时有状态 $j \rightarrow i$ ,则称 $i$ 与 $j$ 互通,记为 $i \leftrightarrow j$ 。

  定理2:互通是一种等价关系,即满足:
  (1) 自反性: $i \leftrightarrow i$ 。
  (2) 对称性: $i \leftrightarrow j$ ,则 $j \leftrightarrow i$ 。
  (3) 传递性: $i \leftrightarrow j$ , $j \leftrightarrow k$ ,则 $i \leftrightarrow k$ 。

 〔证明(定理2)〕从互通的定义可知(1)(2)是显然的,只证(3)。由互通定义可知,需证 $i \rightarrow k$ 且 $k \rightarrow i$ 。首先,由 $i \rightarrow j$ ,$j \rightarrow k$ 可知存在 $m$ ,$n$ 使得 $p_{ij}^{\left(m\right)}>0$ ,$p_{jk}^{\left(n\right)}>0$ 。再由命题1可知 $p_{ik}^{\left(m+n\right)}\ge {p_{ij}^{\left(m\right)}p_{jk}^{\left(n\right)}}>0$ ,故 $i \rightarrow k$ 。反过来同样有 $k \rightarrow i$ ,即证 $i \leftrightarrow k$ 。

证毕

  定义7(类):我们把任何两个相通状态归为一个,由上述定理可知,同在一类的状态应该都是互通的,并且任何一个状态不能同时属于两个不同的类。

  定义8(可约):若Markov链只存在一个类,就称它是不可约的。否则称为可约的

周期

  定义9(周期):若集合 $\set{n|n \ge 1,p_{ii}^{\left(n\right)} \ge 0}$ 非空,则称它的最大公约数 $d=d\left(i\right)$ 为状态 $i$ 的周期。若 $d \ge 1$ ,则称 $i$ 是周期的;若 $d=1$ ,则称 $i$ 是非周期的。并特别规定上述集合为空集时,称 $i$ 的周期为无穷大。 。

  定理3:若状态 $i,j$ 同属一类,则 $d\left(i\right)=d\left(j\right)$ 。

 〔证明(定理3)〕由的定义可知 $i \leftrightarrow j$ ,即存在 $m,n$ 使 $p_{ij}^{\left(m\right)}>0,p_{ji}^{\left(n\right)}>0$ 。则由命题1知 $p_{ii}^{\left(m+n\right)}\ge p_{ij}^{\left(m\right)}p_{ji}^{\left(n\right)}>0$ ,同时对所有使得 $p_{jj}^{\left(s\right)} > 0$ 的 $s$ ,有

$$\begin{aligned} p_{ii}^{\left(m+s+n\right)} \ge p_{ij}^{\left(m\right)}p_{jj}^{\left(s\right)}p_{ji}^{\left(n\right)}>0 \tag{12}\end{aligned}$$

  由周期的定义可知,由于 $p_{ii}^{\left(m+n\right)}>0$ 且 $p_{ii}^{\left(m+s+n\right)}>0$ ,$d\left(i\right)$ 必然同时整除 $n+m$ 和 $n+m+s$ ,因此,它也必然整除 $s$ (见整除的基本性质)。同时我们还需注意我们已经假设了 $p_{jj}^{\left(s\right)} > 0$ ,因此 $d\left(j\right)$ 必定也整除 $s$ 。注意 $s$ 的任意性,不妨直接令 $s=d\left(j\right)$ ,由此可得 $d\left(i\right)$ 整除 $d\left(j\right)$ 。我们把上述证明的 $i$ 和 $j$ 交换一下,就也能得到 $d\left(j\right)$ 整除 $d\left(i\right)$ ,于是 $d\left(i\right)=d\left(j\right)$ (见 整除的基本性质)。

证毕

常返

首达概率、常返与非常返(瞬过)

  定义10(首达概率):对于任何状态 $i,j$ ,以 $f_{ij}^{\left(n\right)}$ 记从i出发经n步后首次到达 $j$ 的概率(首达概率),则有

$$\begin{aligned} f_{ij}^{\left(n\right)}= \begin{cases} 0 \quad n=0 \\[5pt] P\set{X_n=j,X_k \ne j\left(k=1,2,\cdots ,n-1\right)| X_0=i} \quad n \ge 1 \end{cases} \tag{13}\end{aligned}$$

  定义11(常返):令 $f_{ij}=\displaystyle\sum_{n=1}^{\infin}{f_{ij}^{\left(n\right)}}$ ,若 $f_{jj}=1$ ,则称状态 $j$ 为常返状态,若 $f_{jj}<1$ ,称 $j$ 为非常返状态瞬过状态
   $f_{ij}$ 的含义可由如下得出:由集合 $A_n$ 的定义 $A_n=\set{X_n=j,X_k \ne j, k=1,2,\cdots n-1 | X_0=i}$ 可知 $n$ 不同的时候 $A_n$ 不相交。而 $\displaystyle\bigcup_{n=1}^{\infin}{A_n}$ 表示的事件正是总有一个 $n$ 使得过程经 $n$ 步后可从 $i$ 到达 $j$ ,那么由不相交事件概率的可加性可得:

$$\begin{aligned} P\left(\bigcup_{n=1}^{\infin}{A_n}\right)=\sum_{n=1}^{\infin}{P\left(A_n\right)}=\sum_{n=1}^{\infin}f_{ij}^{\left(n\right)}=f_{ij} \tag{14}\end{aligned}$$

  因此 $f_{ij}$ 表示从 $i$ 出发,有限步内可以到达 $j$ 的概率。当 $i$ 为常返状态时,以概率 $1$ 从 $i$ 出发,在有限步过程将重新返回 $i$ ,而当 $i$ 为非常返状态时,若也以概率 $1$ 从 $i$ 出发,则以概率 $1-f_{ii}$ 不再回到 $i$ (即从 $i$ 滑过)。
  对于常返态 $i$ ,定义

$$\begin{aligned} \mu_i=\sum_{n=1}^{\infin}{nf_{ii}^{\left(n\right)}} \tag{15}\end{aligned}$$

  表示由 $i$ 出发再返回到 $i$ 所需的平均步数(时间)。

正常返、零常返、遍历、吸收

  定义12(正常返、零常返、遍历、吸收):对于常返态 $i$ ,若 $\mu_i<+\infin$ ,则称 $i$ 为正常返态;若 $\mu_i=+\infin$ ,则称 $i$ 为零常返态。特别地,若 $i$ 正常返且是非周期的,则称之为遍历状态。若 $i$ 是遍历状态,且 $f_{ii}^{\left(1\right)}=1$ ,则称 $i$ 为吸收状态。此时显然 $\mu_i=1$ 。

若干性质证明

常返的极限判定

  定理4:状态 $i$ 为常返状态当且仅当 $\displaystyle\sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}=+\infin$ 。状态 $i$ 为非常返状态时

$$\begin{aligned} \sum_{n=0}^{\left(\infin\right)}{p_{ii}^{\left(n\right)}}=\frac{1}{1-f_{ii}} \tag{16}\end{aligned}$$

  因而此时有 $\lim\limits_{n \rightarrow \infin}p_{ii}^{\left(n\right)}=0$ 。

  为了证明定理4,我们需要先证明命题2引理1

  命题2:对任意状态 $i,j$ ,有

$$\begin{aligned} f_{ij}^{\left(l+1\right)}=\sum_{k \ne j,\thinspace k \in S}{f_{ik}^{\left(1\right)}f_{kj}^{\left(l\right)}} \tag{17}\end{aligned}$$

 〔证明(命题2)〕由首达概率的定义、Markov链的定义、时齐的定义和全概率公式可得

$$\begin{aligned} f_{ij}^{\left(l+1\right)}=&P\set{X_{l+1}=j,X_m \ne j\left(m=1,2,\cdots ,l\right) | X_0=i}\quad \text{(首达概率)}\\[5pt] =&\sum_{k \ne j,\thinspace k \in S}{P\set{X_{l+1}=j,X_m \ne j\left(m=2,\cdots ,l\right),X_1=k | X_0=i}}\text{(全概率公式)}\\ =&\sum_{k \ne j,\thinspace k \in S}{\frac{P\set{X_{l+1}=j,X_m \ne j\left(m=2,\cdots ,l\right),X_1=k,X_0=i}}{P\set{X_0=i}}}\\ =&\sum_{k \ne j,\thinspace k \in S}{\frac{P\set{X_1=k,X_0=i}}{P\set{X_0=i}}\frac{P\set{X_{l+1}=j,X_m \ne j\left(m=2,\cdots ,l\right),X_1=k,X_0=i}}{P\set{X_1=k,X_0=i}}}\\ =&\sum_{k \ne j,\thinspace k \in S}{P\set{X_1=k|X_0=i}P\set{X_{l+1}=j,X_m \ne j\left(m=2,\cdots ,l\right)|X_1=k,X_0=i}}\\ =&\sum_{k \ne j,\thinspace k \in S}{P\set{X_1=k|X_0=i}P\set{X_{l+1}=j,X_m \ne j\left(m=2,\cdots ,l\right)|X_1=k}}\text{(Markov链)}\\ =&\sum_{k \ne j,\thinspace k \in S}{P\set{X_1=k|X_0=i}P\set{X_l=j,X_m \ne j \left(m=1,\cdots ,l-1\right)|X_0=k}}\text{(时齐)}\\ =&\sum_{k \ne j,\thinspace k \in S}{f_{ik}^{\left(1\right)}f_{kj}^{\left(l\right)}} \tag{18}\end{aligned}$$

证毕

  引理1:对任意状态 $i,j$ 及 $1 \le n < \infin$ ,有

$$\begin{aligned} p_{ij}^{\left(n\right)}=\sum_{l=1}^{n}{f_{ij}^{\left(l\right)}p_{jj}^{\left(n-l\right)}} \tag{19}\end{aligned}$$

 〔证明(引理1)〕用归纳法。对 $n=1$ ,由 $p_{ij}^{\left(1\right)}=f_{ij}^{\left(1\right)}$ ,易证上式成立。
  假设对 $n-1$ ,已有 $p_{ij}^{\left(n-1\right)}=\displaystyle\sum_{l=1}^{n-1}{f_{ij}^{\left(l\right)}p_{jj}^{\left(n-1-l\right)}}$ 成立。
  当取 $n$ 时,利用C-K方程、归纳假设和命题2,可以推导出

$$\begin{aligned} p_{ij}^{\left(n\right)}&=\sum_{k \in S}{p_{ik}^{\left(1\right)}p_{kj}^{\left(n-1\right)}} \qquad \text{(C-K方程)}\\ &=p_{ij}^{\left(1\right)}p_{jj}^{\left(n-1\right)}+\sum_{k \ne j,\thinspace k \in S}{p_{ik}^{\left(1\right)}p_{kj}^{\left(n-1\right)}}\\ &=f_{ij}^{\left(1\right)}p_{jj}^{\left(n-1\right)}+\sum_{k \ne j,\thinspace k \in S}{f_{ik}^{\left(1\right)}p_{kj}^{\left(n-1\right)}} \text{(归纳法n=1时的情况)}\\ &=f_{ij}^{\left(1\right)}p_{jj}^{\left(n-1\right)}+\sum_{k \ne j,\thinspace k \in S}f_{ik}^{\left(1\right)}\left(\sum_{l=1}^{n-1}{f_{kj}^{\left(l\right)}p_{jj}^{\left(n-1-l\right)}}\right) \text{(归纳假设n-1时的情况)}\\ &=f_{ij}^{\left(1\right)}p_{jj}^{\left(n-1\right)}+\sum_{l=1}^{n-1}{\left(\sum_{k \ne j,\thinspace k \in S}{f_{ik}^{\left(1\right)}f_{kj}^{\left(l\right)}}\right)p_{jj}^{\left(n-1-l\right)}}\\ &=f_{ij}^{\left(1\right)}p_{jj}^{\left(n-1\right)}+\sum_{l=1}^{n-1}{f_{ij}^{\left(l+1\right)}p_{jj}^{\left(n-1-l\right)}} \quad \text{(命题2)}\\ &=f_{ij}^{\left(1\right)}p_{jj}^{\left(n-1\right)}+\sum_{l=2}^{n}{f_{ij}^{\left(l\right)}p_{jj}^{\left(n-l\right)}}\\ &=\sum_{l=1}^{n}{f_{ij}^{\left(l\right)}p_{jj}^{\left(n-l\right)}}\\ \tag{20}\end{aligned}$$

证毕

  现在,我们可以用引理1证明定理4

 〔证明(定理4)〕

$$\begin{aligned} \sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}=&\:p_{ii}^{\left(0\right)}+\sum_{n=1}^{\infin}{p_{ii}^{\left(n\right)}}\\ =&\:1+\sum_{n=1}^{\infin}\left(\sum_{l=1}^{n}{f_{ii}^{\left(l\right)}p_{ii}^{\left(n-l\right)}}\right)\\ =&\:1+\sum_{l=1}^{\infin}\sum_{n=l}^{\infin}{f_{ii}^{\left(l\right)}p_{ii}^{\left(n-l\right)}}\\ =&\:1+\sum_{l=1}^{\infin}\sum_{m=0}^{\infin}{f_{ii}^{\left(l\right)}p_{ii}^{\left(m\right)}}\\ =&\:1+\left(\sum_{l=1}^{\infin}{f_{ii}^{\left(l\right)}}\right)\left(\sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}\right)\\ =&\:1+f_{ii}\left(\sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}\right) \tag{21}\end{aligned}$$

  左右有相同项 $\displaystyle\sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}$ ,则解该等式得

$$\begin{aligned} \sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}=\frac{1}{1-f_{ii}} \tag{22}\end{aligned}$$

  因此

$$\begin{aligned} \sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}\text{收敛}\iff f_{ii}<1\text{;} \sum_{n=0}^{\infin}{p_{ii}^{\left(n\right)}}=\infin \iff f_{ii}=1 \tag{23}\end{aligned}$$

证毕

常返互通则必达

  引理2:若 $i \leftrightarrow j$ 且 $i$ 为常返态,则 $f_{ji}=1$ 。

 〔证明(引理2)〕用反证法。假设 $f_{ji}<1$ ,则从 $j$ 出发不一定能在有限步内到达 $i$ ,但是由于 $i \rightarrow j$ ,则从 $i$ 出发一定能在有限步到达 $j$ 。这意味着从 $i$ 出发如果经过 $j$ ,将不一定能在有限步之内再回到 $i$ ,这与 $i$ 的常返性相矛盾,假设不成立。因此 $f_{ij}=1$ 。

证毕

常返是一个类性质

  定理5:常返性是一个类性质。即若 $i \leftrightarrow j$ 则 $i,j$ 同为常返状态或非常返状态,且当 $i,j$ 同为常返状态时,它们同为正常返态或零常返态。

 〔证明(定理5)〕先证明若 $i \leftrightarrow j$ 则 $i,j$ 同为常返状态或非常返状态。
  由 $i \leftrightarrow j$ 知。存在 $n, m$ 使得 $p_{ij}^{\left(n\right)}>0,p_{ji}^{\left(m\right)}>0$ ,由命题1易得

$$\begin{aligned} p_{ii}^{\left(n+m+l\right)} \ge p_{ij}^{\left(n\right)}p_{jj}^{\left(l\right)}p_{ji}^{\left(m\right)}\\[5pt] p_{jj}^{\left(n+m+l\right)} \ge p_{ji}^{\left(n\right)}p_{ii}^{\left(l\right)}p_{ij}^{\left(m\right)} \tag{24}\end{aligned}$$

  两边求和得到

$$\begin{aligned} \sum_{l=0}^{\infin}{p_{ii}^{\left(n+m+l\right)}} \ge \sum_{l=0}^{\infin}{p_{ij}^{\left(n\right)}p_{jj}^{\left(l\right)}p_{ji}^{\left(m\right)}}\\[5pt] \sum_{l=0}^{\infin}{p_{jj}^{\left(n+m+l\right)}} \ge \sum_{l=0}^{\infin}{p_{ji}^{\left(n\right)}p_{ii}^{\left(l\right)}p_{ij}^{\left(m\right)}} \tag{25}\end{aligned}$$

  考虑到 $\displaystyle\sum_{l=0}^{n+m-1}{p_{ii}^{\left(l\right)}}$ 和 $\displaystyle\sum_{l=0}^{n+m-1}{p_{jj}^{\left(l\right)}}$ 都是有限的,那么可以把上式写成这样:

$$\begin{aligned} \sum_{l=0}^{\infin}{p_{ii}^{\left(l\right)}} - \sum_{l=0}^{n+m-1}{p_{ii}^{\left(l\right)}} \ge p_{ij}^{\left(n\right)}p_{ji}^{\left(m\right)}\sum_{l=0}^{\infin}{p_{jj}^{\left(l\right)}}\\[5pt] \sum_{l=0}^{\infin}{p_{jj}^{\left(l\right)}} - \sum_{l=0}^{n+m-1}{p_{jj}^{\left(l\right)}} \ge p_{ji}^{\left(n\right)}p_{ij}^{\left(m\right)}\sum_{l=0}^{\infin}{p_{ii}^{\left(l\right)}} \tag{26}\end{aligned}$$

  因此我们可以直观的看出 $\displaystyle\sum_{l=0}^{\infin}{p_{ii}^{\left(l\right)}}$ 和 $\displaystyle\sum_{l=0}^{\infin}{p_{jj}^{\left(l\right)}}$ 当中任意一个为无穷时,另一个必然也为无穷;任意一个为有限时,另一个必然也为有限。因此 $i,j$ 同为常返状态或非常返状态。故常返性是一个类性质,类中任意成员满足,则其他成员也必定满足;反之若类中任一成员不满足,则其他成员也不满足。
  其次还能证明当 $i,j$ 同为常返状态时,它们同为正常返态或零常返态。该证明需要用到下文的推论1
  假设 $i$ 为零常返状态且 $i \leftrightarrow j$ 。由推论1可知 $\lim\limits_{m \rightarrow \infin}p_{ii}^{\left(m\right)}=0$ 。由于 $i \leftrightarrow j$ ,存在 $n,l$ 使得 $p_{ij}^{\left(n\right)}>0,p_{ji}^{\left(l\right)}>0$ 。同时由命题1可得 $p_{ii}^{\left(n+m+l\right)} \ge p_{ij}^{\left(n\right)}p_{jj}^{\left(m\right)}p_{ji}^{\left(l\right)}\ge0$ 。令 $m \rightarrow \infin$ ,由夹挤准则可知 $\lim\limits_{m \rightarrow \infin}p_{jj}^{\left(m\right)}=0$ ,故由推论1,状态 $j$ 也是零常返状态。

证毕

状态空间分解定理

  定理6(状态空间分解定理):任意Markov链的状态空间 $S$ ,可唯一分解为有限个或可列个互不相交的子集 $D,C_1,C_2,\cdots$ 之和,使得
  (1) 每一个 $C_n$ 是常返状态组成的不可约闭集,$D$ 由全体非常返状态组成。
  (2) $C_n$ 中的状态同类,或者全是正常返态,或者全是零常返态。它们有相同的周期且 $f_{ij}=1\left(i,j \in C_n\right)$ 。
  (3) 自 $C_n$ 中的状态出发不能到达 $D$ 中状态。

 〔证明(状态空间分解定理)〕设 $C$ 为全体常返状态组成的集合,则 $D=S-C$ 为非常返状态的全体组成的集合。注意到定义在 $C$ 上的互通是一种等价关系,由等价关系与集合的划分可知,$C$ 可以按互通关系划分为 $C_1 \bigcup C_2 \bigcup \dots$ ,其中每一个 $C_n$ 是由同一类常返状态组成的不可约的闭集。因此 $S=D \bigcup C_1 \bigcup C_2 \bigcup \dots$ 。定理假设和(1)证毕。
  由定理5可知 $C_n$ 中的状态都是同类型的(正常返或零常返),由定理3可知 $C_n$ 中的状态都有相同的周期,由引理2可知 $C_n$ 中的状态都满足 $f_{ij}=1\left(i,j \in C_n\right)$ 。(2) 证毕。
  对于(3) ,可用反证法证明。假设 $C_n$ 中的状态 $i$ 可以到达 $D$ 中的状态 $j$ ,由于 $i$ 是常返的,状态在到达 $j$ 后必定还会再返回 $i$ ,而后再由假设,状态还可能继续回到 $j$ 。因此,状态从 $j$ 出发后再次返回 $j$ 的情况是可能出现的,这与 $j$ 是非常返态相矛盾,因此假设不成立。故 $C_n$ 中的状态 $i$ 不可到达 $D$ 中的状态 $j$ 。  (3) 证毕。至此,状态空间分解定理

证毕

不可约Markov链的转移

  定理7:周期为 $d$ 的不可约Markov链,其状态空间 $S$ 可唯一地分解为 $d$ 个互不相交的子集之和,即

$$\begin{aligned} S=\bigcup_{r=0}^{d-1}{S_r},\quad S_r \bigcap S_s=\varnothing,\quad r \ne S \tag{27}\end{aligned}$$

  且使得自 $S_r$ 任意状态出发,经 $1$ 步转移必进入 $S_{r+1}$ 中(其中 $S_d=S_0$ )。

 〔证明(定理7)〕先给出子集 $S_r$ 的定义:
  任意取状态 $i$ ,对每一个 $r=0,1,\cdots,d-1$ ,定义集合

$$\begin{aligned} S_r=\set{j|存在n \ge 0使得p_{ij}^{\left(nd+r\right)}>0} \tag{28}\end{aligned}$$

  因为 $S$ 不可约,故 $S$ 中从 $i$ 出发一定可以遍历每一个状态,而 $nd+r\left(r=0,1,\cdots,n-1\right)$ 可以遍历从 $i$ 出发后的每一个时间,因此所有 $S_r$ 的并集一定为 $S$ ,即 $\displaystyle\bigcup_{r=0}^{d-1}{S_r}=S$ 。
  接下来证明 $S_r$ 不相交。用反证法,假设存在 $S_r,S_s$ 和状态 $j$ 满足 $j \in S_r \bigcap S_s$ 。由 $S_r$ 的定义知存在 $n,m$ 使得 $p_{ij}^{\left(nd+r\right)}>0,p_{ij}^{\left(md+s\right)}>0$ 。又因为 $i \leftrightarrow j$ ,故存在 $h$ 使得 $p_{ji}^{\left(h\right)}>0$ ,于是由命题1可得:

$$\begin{aligned} p_{ii}^{\left(nd+r+h\right)} \ge p_{ij}^{\left(nd+r\right)}p_{ji}^{\left(h\right)}>0\\[5pt] p_{ii}^{\left(md+s+h\right)} \ge p_{ij}^{\left(md+s\right)}p_{ji}^{\left(h\right)}>0 \tag{29}\end{aligned}$$

  由周期的定义可知 $nd+r+h$ 和 $md+s+h$ 都可以被 $d$ 整除。省去前面的 $n$ 和 $m$ 可得 $r+h$ 和 $s+h$ 都可被 $d$ 整除。从而其差 $\left(r+h\right)-\left(s+h\right)=r-s$ 都能被 $d$ 整除(见整除的基本性质)。但是 $0 \le r \le d-1,0 \le s \le d-1$ ,故 $0 \le r-s \le d-1$ ,因此 $r-s$ 只能为 $0$ ,也就是 $r=s$ 。故 $S_r=S_s$ ,假设不成立,故 $S_r$ 不相交。
  接下来证明自 $S_r$ 任意状态出发,经 $1$ 步转移必进入 $S_{r+1}$ 中(其中 $S_d=S_0$ )。等价于证明对任意 $j \in S_r$ ,有 $\displaystyle\sum_{k \in S_{r+1}}{p_{jk}^{\left(1\right)}}=1$ 。事实上,由 (28)可知 $p_{ij}^{\left(nd+r\right)}>0$ ,同样可知对 $k \notin S_{r+1}$ 必有 $p_{ik}^{\left(nd+r+1\right)}=0$ 。因此由命题1可推导:

$$\begin{aligned} 0=p_{ik}^{\left(nd+r+1\right)} \ge p_{ij}^{\left(nd+r\right)}p_{jk}^{\left(1\right)}>0 \tag{30}\end{aligned}$$

  从而 $p_{jk}^{\left(1\right)}=0$ 。于是

$$\begin{aligned} 1\:=\sum_{k \in S}{p_{jk}}=\sum_{k \in S_{r+1}}{p_{jk}^{\left(1\right)}} + \sum_{k \notin S_{r+1}}{p_{jk}^{\left(1\right)}}=\sum_{k \in S_{r+1}}{p_{jk}^{\left(1\right)}} \tag{31}\end{aligned}$$

  最后证明分解的唯一性。等价于与证明 $\set{S_k}$ 与初始的 $i$ 无关。也就是,对于任意的 $i,i^\prime$ 生成的分解 $\set{S_k},\set{S_k^\prime}$ 必相等。
  首先,证明对于 $\set{S_k}$ 中的任意 ${S_r}$ ,存在 ${S_s^\prime}$ 与其状态完全相等。首先证对所有 $j \in S_r$ ,$j$ 都只能属于 $\set{S_k^\prime}$ 中某个固定的集合。假设 $i^{\prime}$ 满足 $i^\prime \in S_s$ 。由于自 $S_k$ 任意状态出发经 $1$ 步转移必进入 $S_{k+1}$ 中,所以当 $s \le r$ 时,从 $i^{\prime}$ 到达 $j$ 只可能通过如下过程之一:

$$\begin{aligned} \begin{cases} S_s \rightarrow S_{s+1} \rightarrow \cdots \rightarrow S_r\\ S_s \rightarrow S_{s+1} \rightarrow \cdots \rightarrow S_r\rightarrow S_{r+1} \rightarrow \cdots \rightarrow S_{d-1} \rightarrow S_0 \rightarrow S_1 \rightarrow \cdots \rightarrow S_r\\ S_s \rightarrow S_{s+1} \rightarrow \cdots \rightarrow S_r\rightarrow \overbrace{S_{r+1} \rightarrow \cdots \rightarrow S_{d-1} \rightarrow S_0 \rightarrow S_1 \rightarrow \cdots \rightarrow S_r}^{重复2次}\\ \quad \vdots \end{cases} \tag{32}\end{aligned}$$

  也就是从 $i^{\prime}$ 出发只能在 $r-s,r-s+d,r-s+2d,\dots$ 步上到达 $j$ 。我们发现这刚好与 $S_{r-s}^{\prime}$ 的定义是一致的。因此 $j \in S_{r-s}^{\prime}$ 。反过来讨论任意 $j^\prime \in S_{r-s}^{\prime}$ 。从 $i$ 转移到 $i^\prime$ 需要 $s$ 步,而从 $i^\prime$ 转移到 $j^\prime$ 需要 $r-s$ 步,因此从 $i$ 转移到 $j^\prime$ 需要 $r$ 步,故 $j^\prime \in S_r$ 。故 $S_r$ 与 $S_{r-s}^\prime$ 完全对等。
  另外当 $s > r$ 时,由类似的方法可以证明从 $i^{\prime}$ 出发,只能在 $d-\left(s-r\right),2d-\left(s-r\right),\dots$ 步到达 $j$ ,因此 $j \in S_{d-\left(s-r\right)}^{\prime}$ 。类似的也可证明 $S_r$ 与 $S_{d-\left(s-r\right)}^{\prime}$ 完全对等。综上,有

$$\begin{aligned} \begin{cases} S_r与S_{r-s}^{\prime}完全对等,若r \ge s \\[5pt] S_r与S_{d-\left(s-r\right)}^{\prime}完全对等,若r < s \end{cases} \tag{33}\end{aligned}$$

  易证此时 $\set{S_k},\set{S_k^\prime}$ 一一对应。故分解是唯一的。

证毕

极限定理与不变分布

极限定理及其衍生定理

极限定理

  定理8(极限定理):若状态 $j$ 是周期为 $d$ 的常返状态,则

$$\begin{aligned} \lim\limits_{n \rightarrow \infin}p_{jj}^{\left(nd\right)}=\frac{d}{\mu_j} \tag{34}\end{aligned}$$

 〔证明(极限定理)〕对 $n \ge 0$ ,令:

$$\begin{aligned} r_n=\sum_{v=n+1}^{\infin}{f_v} \tag{35}\end{aligned}$$

  其中 $f_v=f_{jj}^{\left(v\right)}$ 。于是

$$\begin{aligned} \sum_{n=0}^{\infin}{r_n}=&\sum_{n=0}^{\infin}\sum_{v=n+1}^{\infin}{f_v}\\ =&\left(f_1+f_2+f_3+\cdots\right)+\left(f_2+f_3+\cdots\right)+\left(f_3+\cdots\right)+\cdots\\[5pt] =&1\cdot f_1 + 2 \cdot f_2 + 3 \cdot f_3 + \cdots\\ =&\sum_{n=1}^{\infin}{nf_n}=\mu_j \tag{36}\end{aligned}$$

  由 $r_n$ 定义可知 $f_n=r_{v-1}-r_v$ ,代入引理1并记 $p_v=p_{jj}^{\left(v\right)}$ 可得

$$\begin{aligned} p_n=p_{jj}^{\left(n\right)}=\sum_{l=1}^{n}{f_{jj}^{\left(l\right)}p_{jj}^{\left(n-l\right)}}=-\sum_{v=1}^{n}{\left(r_v-r_{v-1}\right)p_{n-v}} \tag{37}\end{aligned}$$

  注意 $j$ 是常返状态,故 $r_0=1$ 。则上式可以写成

$$\begin{aligned} \sum_{v=0}^{n}{r_vp_{n-v}}=\sum_{v=0}^{n-1}r_vp_{n-1-v} \tag{38}\end{aligned}$$

  上面这个式子表示了一个很明显的结论: $\displaystyle\sum_{v=0}^{n}{r_vp_{n-v}}$ 的值与 $n$ 无关。因此:

$$\begin{aligned} \sum_{v=0}^{n}{r_vp_{n-v}}=r_0p_0=1,\quad n \ge 0 \tag{39}\end{aligned}$$

  设

$$\begin{aligned} \lambda=\limsup\limits_{n \rightarrow \infin}p_{nd} \tag{40}\end{aligned}$$

  根据上极限的定义可知,必然存在 $\set{n}$ 的子列 $\set{n_m},n_m \rightarrow \infin$ 使得

$$\begin{aligned} \lambda=\lim\limits_{m \rightarrow \infin}{p_{n_md}}=\limsup\limits_{m \rightarrow \infin}{p_{n_md}}=\liminf\limits_{m \rightarrow \infin}{p_{n_md}} \tag{41}\end{aligned}$$

  任取 $s$ 使得 $f_s>0$ ,由引理1下极限的性质可得

$$\begin{aligned} \lambda=&\liminf\limits_{m \rightarrow \infin}p_{n_md}=\liminf\limits_{m \rightarrow \infin}p_{jj}^{\left(n_md\right)}=\liminf\limits_{m \rightarrow \infin}\sum_{v=1}^{n_md}f_{jj}^{\left(v\right)}p_{jj}^{\left(n_md-v\right)}\\ =&\liminf\limits_{m \rightarrow \infin}\sum_{v=1}^{n_md}f_{v}p_{n_md-v}=\liminf\limits_{m \rightarrow \infin}\left(f_sp_{n_md-s}+\sum_{v=1,v \ne s}^{n_md}f_{v}p_{n_md-v}\right)\\ \le&\liminf\limits_{m \rightarrow \infin}f_sp_{n_md-s}+\liminf\limits_{m \rightarrow \infin}\sum_{v=1,v \ne s}^{n_md}f_{v}p_{n_md-v}\quad\text{(}\liminf\limits_{n \rightarrow \infin}\left(a_n+b_n\right)\le\liminf\limits_{n \rightarrow \infin}a_n+\liminf\limits_{n \rightarrow \infin}b_n\text{)} \tag{42}\end{aligned}$$

  由概率的非负性上下极限的性质和可推导出

$$\begin{aligned} \liminf\limits_{m \rightarrow \infin}\sum_{v=1,v \ne s}^{n_md}f_{v}p_{n_md-v}\le&\sum_{v=1,v \ne s}^{n_md}\liminf\limits_{m \rightarrow \infin}f_{v}p_{n_md-v}\quad\text{(}\liminf\limits_{n \rightarrow \infin}\left(a_n+b_n\right)\le\liminf\limits_{n \rightarrow \infin}a_n+\liminf\limits_{n \rightarrow \infin}b_n\text{)}\\ \le&\sum_{v=1,v \ne s}^{\infin}\liminf\limits_{m \rightarrow \infin}f_{v}p_{n_md-v}\quad\text{(概率的非负性)}\\ \le&\sum_{v=1,v \ne s}^{\infin}\liminf\limits_{m \rightarrow \infin}f_{v}\limsup\limits_{m \rightarrow \infin}p_{n_md-v}\quad\text{(}\liminf\limits_{n \rightarrow \infin}a_nb_n\le\liminf\limits_{n \rightarrow \infin}a_n\limsup\limits_{n \rightarrow \infin}b_n\text{)}\\ =&\sum_{v=1,v \ne s}^{\infin}f_{v}\limsup\limits_{m \rightarrow \infin}p_{n_md-v}\\ \tag{43}\end{aligned}$$

  注意当 $v$ 不是 $d$ 的倍数时 $p_{n_md-v}=0$ ,此时 $\limsup\limits_{m \rightarrow \infin}p_{n_md-v} \le \limsup\limits_{m \rightarrow \infin}p_{n_md}$ ;若 $v$ 是 $d$ 的倍数,由上极限的性质可知仍有 $\limsup\limits_{m \rightarrow \infin}p_{n_md-v} \le \limsup\limits_{m \rightarrow \infin}p_{n_md}$ 。故接上式

$$\begin{aligned} \liminf\limits_{m \rightarrow \infin}\sum_{v=1,v \ne s}^{n_md}f_{v}p_{n_md-v}=\sum_{v=1,v \ne s}^{\infin}f_{v}\limsup\limits_{m \rightarrow \infin}p_{n_md-v}\le\left(\sum_{v=1,v \ne s}^{\infin}f_{v}\right)\limsup\limits_{m \rightarrow \infin}p_{n_md} \tag{44}\end{aligned}$$

  注意状态 $j$ 是常返的,所以 $\displaystyle\sum_{v=1}^{\infin}f_{v}=1$ ,也就是 $\displaystyle\sum_{v=1,v \ne s}^{\infin}f_{v}=1-f_s$ 。而将(41)代入(44)后再将(44)代回(42)

$$\begin{aligned} \lambda\le f_s\liminf\limits_{m \rightarrow \infin}p_{n_md-s}+\left(1-f_s\right)\lambda \tag{45}\end{aligned}$$

  即

$$\begin{aligned} \liminf\limits_{m \rightarrow \infin}p_{n_md-s}\ge\lambda \tag{46}\end{aligned}$$

  由周期的定义和 $f_s>0$ 知 $d$ 必整除 $s$ 。因此 $\limsup\limits_{m \rightarrow \infin}p_{n_md-s}=\limsup\limits_{m \rightarrow \infin}p_{n_md}=\lambda$ 。但是由上下极限的定义可知 $\limsup\limits_{m \rightarrow \infin}p_{n_md-s}\ge\liminf\limits_{m \rightarrow \infin}p_{n_md-s}$ ,即 $\lambda=\limsup\limits_{m \rightarrow \infin}p_{n_md-s}\ge\liminf\limits_{m \rightarrow \infin}p_{n_md-s}\ge\lambda$ 。故由夹挤准则可知 $\limsup\limits_{m \rightarrow \infin}p_{n_md-s}=\liminf\limits_{m \rightarrow \infin}p_{n_md-s}=\lim\limits_{m \rightarrow \infin}p_{n_md-s}=\lambda$ 。又由(41)可得:

$$\begin{aligned} \lambda=\lim\limits_{m \rightarrow \infin}p_{n_md}=\lim\limits_{m \rightarrow \infin}p_{n_md-s}=\lim\limits_{m \rightarrow \infin}p_{n_md-2s}=\cdots \tag{47}\end{aligned}$$

  任取 $l$ 个正整数 $c_i$ 和满足 $f_{d_i}>0$ 的 $l$ 个正整数 $d_i,i=1,2,\cdots,l$ 。由(47)可知有

$$\begin{aligned} \lim\limits_{m \rightarrow \infin}p_{n_md-c_id_i}=\lambda \tag{48}\end{aligned}$$

  注意由周期的定义,$d$ 一定可以整除 $d_i$ 。假设 $d_i=k_id$ ,$k_i$ 为正整数,则上式又可以写为

$$\begin{aligned} \lim\limits_{m \rightarrow \infin}p_{\left(n_m-c_ik_i\right)d}=\lambda \tag{49}\end{aligned}$$

  可以定义一个正整数 $n_m^\prime=n_m-c_ik_i$ 。则上式可以写成

$$\begin{aligned} \lim\limits_{m \rightarrow \infin}p_{n_m^\prime d}=\lambda \tag{50}\end{aligned}$$

  我们发现上式和(41)形式完全一样,因此再次重复从(41)(48)的推导又可以得到

$$\begin{aligned} \lambda=\lim\limits_{m \rightarrow \infin}p_{n_m^\prime d}=\lim\limits_{m \rightarrow \infin}p_{n_m^\prime d-s^\prime}=\lim\limits_{m \rightarrow \infin}p_{n_m^\prime d-2s^\prime}=\cdots \tag{51}\end{aligned}$$

  也就是

$$\begin{aligned} \lim\limits_{m \rightarrow \infin}p_{n_m^\prime d-c_{i^\prime}d_{i^\prime}}=\lambda \tag{52}\end{aligned}$$

  因此,不同的 $c_id_i$ 可以叠加而不影响结论。故对 $u=\displaystyle\sum_{i=1}^{l}c_id_i$ 也满足

$$\begin{aligned} \lim\limits_{m \rightarrow \infin}p_{n_md-u}=\lambda \tag{53}\end{aligned}$$

  由周期的定义知,存在满足 $f_{d_i}>0$ 的 $d_i,i=1,2,\cdots,l$ 使得 $d_1,d_2,\cdots,d_l$ 的最大公因子也是 $d$ 。于是,当 $k$ 大于某个正整数 $k_0$ 时,必有正整数 $c_i$ ,使得

$$\begin{aligned} kd=\sum_{i=1}^{l}c_id_i \tag{54}\end{aligned}$$

  上述结论见Frobenius问题(实际上 $k_0$ 就是数论中著名的Frobenius数,该数在 $l\ge3$ 时无一般表示式,但是可以证明 $k_0\le \displaystyle\sum_{i=2}^{l}\frac{d_i\cdot gcd\left(d_1,d_2,\dots,d_{i-1}\right)}{d \cdot gcd\left(d_1,d_2,\dots,d_i\right)} - \displaystyle\sum_{i=1}^{l}\frac{d_i}{d}$ )。于是,对每一个 $k\ge k_0$ 有

$$\begin{aligned} \lim\limits_{n \rightarrow \infin}p_{\left(n_m-k\right)d}=\lambda \tag{55}\end{aligned}$$

  在(39)中令 $n=\left(n_m-k_0\right)d$ , 并注意到 $v$ 不是 $d$ 的整数倍时 $p_v=0$ ,故可把 $v$ 替换为 $vd$ ,则得

$$\begin{aligned} \sum_{v=0}^{n_m-k_0}r_{vd}p_{\left(n_m-k_0-v\right)d}=1 \tag{56}\end{aligned}$$

  令 $m \rightarrow \infin$ 可得

$$\begin{aligned} \lambda=\frac{1}{\displaystyle\sum_{v=0}^{\infin}r_{vd}} \tag{57}\end{aligned}$$

  因为当 $v$ 不是 $d$ 的整数倍时,$f_v=0$ ,由(35)可得

$$\begin{aligned} r_{vd} = r_{vd+1} = \cdots = r_{vd+d-1} = \frac{1}{d}\sum_{j=vd}^{vd+d-1}r_j \tag{58}\end{aligned}$$

  从而由(36)

$$\begin{aligned} \sum_{v=0}^{\infin}r_{vd}=\frac{1}{d}\sum_{v=0}^{\infin}\sum_{j=vd}^{vd+d-1}r_j=\frac{1}{d}\sum_{v=0}^{\infin}r_v=\frac{\mu_j}{d} \tag{59}\end{aligned}$$

  代入(57)可得

$$\begin{aligned} \lambda = \frac{d}{\mu_j} \tag{60}\end{aligned}$$

  把(40)换成 $\lambda=\liminf\limits_{n \rightarrow \infin}p_{nd}$ ,下面的推导过程完全相同,仍可以得到 $\lambda = \displaystyle\frac{d}{\mu_j}$ 。因此,由极限的性质可知

$$\begin{aligned} \lim\limits_{n \rightarrow \infin}p_{nd}=\frac{d}{\mu_j} \tag{61}\end{aligned}$$

  由此,极限定理证毕。

证毕

  推论1:设 $i$ 为常返状态,则

$$\begin{aligned} i\text{为零常返状态}\iff\lim\limits_{n \rightarrow \infin}p_{ii}^{\left(n\right)}=0 \tag{62}\end{aligned}$$

 〔证明(推论1)〕若 $i$ 为零常返状态,则 $\mu_i \rightarrow \infin$ ,从而由极限定理知 $\lim\limits_{n \rightarrow \infin}p_{ii}^{\left(nd\right)}=0$ 。而当 $m$ 不等于 $d$ 的整数倍时,$p_{ii}^{\left(m\right)}=0$ ,故 $\lim\limits_{n \rightarrow \infin}p_{ii}^{\left(n\right)}=0$ 。反之,若 $\lim\limits_{n \rightarrow \infin}p_{ii}^{\left(n\right)}=0$ ,假如 $i$ 为正常返状态,则由极限定理知 $\lim\limits_{n \rightarrow \infin}p_{ii}^{\left(nd\right)}>0$ ,由极限的性质知这与 $\lim\limits_{n \rightarrow \infin}p_{ii}^{\left(n\right)}=0$ 矛盾,因此 $i$ 为零常返状态。

证毕

再论非常返与零常返

  定理9:若 $j$ 为非常返状态或零常返状态,则对 $\forall i \in S$

$$\begin{aligned} \lim\limits_{n \rightarrow \infin}p_{ij}^{\left(n\right)}=0 \tag{63}\end{aligned}$$

 〔证明(定理9)〕由引理1

$$\begin{aligned} p_{ij}^{\left(n\right)}=\sum_{l=1}^{n}f_{ij}^{\left(l\right)}p_{jj}^{\left(n-l\right)} \tag{64}\end{aligned}$$

  对 $ N < n $ ,由概率小于 $1$ 可知 $f_{ij}^{\left(l\right)}<1$ ,因此上式可写成

$$\begin{aligned} \sum_{l=1}^{n}f_{ij}^{\left(l\right)}p_{jj}^{\left(n-l\right)}\le \sum_{l=1}^{N}f_{ij}^{\left(l\right)}p_{jj}^{\left(n-l\right)}+\sum_{l=N+1}^{n}f_{ij}^{\left(l\right)} \tag{65}\end{aligned}$$

  先固定 $N$ ,令 $n \rightarrow \infin$ 。由极限定理知 $p_{jj}^{\left(n\right)} \rightarrow 0$ ,故上式右端第一项为 $0$ 。再令 $N \rightarrow \infin$ ,上式右端第二项因 $\displaystyle\sum_{l=1}^{n}f_{ij}^{\left(l\right)}<1$ 而趋于 $0$ ,故

$$\begin{aligned} \lim\limits_{n \rightarrow \infin}p_{ij}^{\left(n\right)}=0 \tag{66}\end{aligned}$$

  定理得证。

证毕

  推论2:有限状态的Markov链,不可能全为非常返状态,也不可能有零常返状态,从而不可约的有限Markov链是正常返的。

 〔证明(推论2)〕设状态空间 $S=\set{1,2,\cdots,N}$ ,若全部 $N$ 个状态都是非常返,则任取其中两个状态 $i,j$ ,若 $i \rightarrow j $ ,有 $p_{ij}^{\left(n\right)}\rightarrow 0$ (定理9);若 $i \nrightarrow j$ ,则对 $\forall n$ ,$p_{ij}^{\left(n\right)}=0$ 。不管是哪种情况,$\displaystyle\sum_{j=0}^{N}p_{ij}^{\left(n\right)}\to 0$ ,但是 $\displaystyle\sum_{j=0}^{N}p_{ij}^{\left(n\right)}=1$ (与(4)类似),矛盾。因此有限状态的Markov链,不可能全为非常返状态。
  若 $S$ 中有零常返状态,设为 $i$ ,令 $C=\set{j | i \rightarrow j}$ ,则有 $\displaystyle\sum_{j \in C}p_{ij}^{\left(n\right)}=1$ 且 $j \rightarrow i$ ( $j \nrightarrow i$ 与 $i$ 的常返性相矛盾,类似引理2的证明)。故 $i \leftrightarrow j$ ,从而 $j$ 也为零常返状态(定理5)。则 $\lim\limits_{n \to \infin}p_{ij}^{\left(n\right)}=0$ (定理9),从而 $\displaystyle\sum_{j \in C}^{}p_{ij}^{\left(n\right)}\to 0$ 。但是由 $j$ 的定义知 $\displaystyle\sum_{j \in C}^{}p_{ij}^{\left(n\right)}=1$ ,矛盾。因此有限状态的Markov链不可能有零常返状态。

证毕

  推论3:若Markov链有一个零常返状态,则必有无限个零常返状态。

 〔证明(推论3)〕假设Markov链有一个零常返状态。由状态空间分解定理可知这个零常返状态必然存在于某个不可约类中,又有定理5可知这个类必然全都是零常返状态。由推论2可知该不可约类不可能是有限状态的。因此,该Markov链必然有无限个零常返状态。

证毕

再论正常返

  定理10:若 $j$ 为正常返状态且周期为 $d$ ,则对 $\forall i$ 及 $0 \le r \le d-1$ ,有

$$\begin{aligned} \lim\limits_{n \to \infin}p_{ij}^{\left(nd+r\right)}=f_{ij}\left(r\right)\space\frac{d}{\mu_j} \tag{67}\end{aligned}$$

  其中 $f_{ij}\left(r\right)$ 为:

$$\begin{aligned} f_{ij}\left(r\right)=\sum_{m=0}^{\infin}f_{ij}^{\left(md+r\right)},\quad 0 \le r \le d-1 \tag{68}\end{aligned}$$

 〔证明(定理10)〕当 $n \ne kd$ 时,$p_{jj}^{\left(n\right)}=0$ 。因此由引理1可得

$$\begin{aligned} p_{ij}^{\left(nd+r\right)}=&\sum_{k=0}^{\left(nd+r\right)}f_{ij}^{\left(k\right)}p_{jj}^{\left(nd+r-k\right)}\quad\text{(引理1)}\\ =&\sum_{m=0}^{n}f_{ij}^{\left(md+r\right)}p_{jj}^{\left(n-m\right)d}\text{(}换元k=md+r,其余的k的项值都为0\text{)} \tag{69}\end{aligned}$$

  于是由 $0 \le p_{jj}^{\left(n-m\right)d} \le 1$ (概率的性质),对 $1 \le N < n$ 有

$$\begin{aligned} \sum_{m=0}^{N}f_{ij}^{\left(md+r\right)}p_{jj}^{\left(n-m\right)d}\le p_{ij}^{\left(nd+r\right)}\le \sum_{m=0}^{N}f_{ij}^{\left(md+r\right)}p_{jj}^{\left(n-m\right)d}+\sum_{N+1}^{n}f_{ij}^{\left(md+r\right)} \tag{70}\end{aligned}$$

  类似于定理9的推导,先令 $n \to \infin$ ,再令 $N \to \infin$ ,由极限定理

$$\begin{aligned} f_{ij}\left(r\right)\space\frac{d}{\mu_j}\le p_{ij}^{\left(nd+r\right)} \le f_{ij}\left(r\right)\space\frac{d}{\mu_j} \tag{71}\end{aligned}$$

  由夹挤准则可得定理10得证。

证毕

  推论4:设有不可约的、正常返的、周期为 $d$ 的Markov链(即每个状态都是正常返的),其状态空间为 $S$ ,则对任何状态 $i \leftrightarrow j\left(i,j \in S\right)$ ,有

$$\begin{aligned} \lim\limits_{n \to \infin}p_{ij}^{\left(nd\right)}= \begin{cases} \space\displaystyle\frac{d}{\mu_j}\quad&若\space i \space 与\space j \space 同属于子集\space S\\[10pt] \space 0\quad&其他 \end{cases} \tag{72}\end{aligned}$$

  其中 $S=\displaystyle\bigcup_{i=0}^{d-1}S_s$ 即为定理7所给出的 $S_s$ 。特别的,当 $d=1$ 时,$\forall i,j \in S$ 有

$$\begin{aligned} \lim\limits_{n \to \infin}p_{ij}^{\left(n\right)}=\frac{1}{\mu_j} \tag{73}\end{aligned}$$

 〔证明(推论4)〕在定理10中取 $r=0$ 得

$$\begin{aligned} \lim\limits_{n \to \infin}p_{ij}^{\left(nd\right)}=f_{ij}\left(0\right)\space\frac{d}{\mu_j} \tag{74}\end{aligned}$$

  其中 $f_{ij}\left(0\right)=\displaystyle\sum_{m=0}^{\infin}f_{ij}^{\left(md\right)}$ 。若 $i$ 与 $j$ 不在同一个 $S_s$ 中,则由定理7可知所有的 $f_{ij}^{\left(md\right)}=0$ 。若 $i,j$ 在同一个 $S_s$ 中,注意当 $n$ 不为 $d$ 的倍数的时候 $p_{ij}^{\left(n\right)}=0$ ,因此 $f_{ij}^{\left(n\right)}=0$ (见常返)。此时有

$$\begin{aligned} f_{ij}\left(0\right)=\sum_{m=0}^{\infin}f_{ij}^{\left(md\right)}=\sum_{m=0}^{\infin}f_{ij}^{\left(m\right)}=f_{ij}=1 \tag{75}\end{aligned}$$

  综上,推论4得证。

证毕

n步转移概率的期望

  定理11:对于任意状态 $i,j \in S$ ,有

$$\begin{aligned} \lim\limits_{n \to \infin}\frac{1}{n}\sum_{k=1}^{n}p_{ij}^{\left(k\right)}= \begin{cases} \space 0 \quad j\space 为非常返状态或零常返状态\\[10pt] \space \displaystyle\frac{f_{ij}}{\mu_{j}} \quad j \space 为正常返状态 \end{cases} \tag{76}\end{aligned}$$

  为了证明定理11,我们需要先证明引理3

  引理3:设有非负数列 $\set{a_n}$ 的 $d$ 个子列 $\set{a_{kd+s}}\left(s=0,1,2,\cdots,d-1\right)$ ,如果对每一个 $d$ ,存在极限 $\lim\limits_{k \to \infin}a_{kd+s}=b_s$ ,则有:

$$\begin{aligned} \lim_{n \to \infin}\frac{1}{n}\sum_{k=1}^{n}a_k=\frac{1}{d}\sum_{s=0}^{d-1}b_s \tag{77}\end{aligned}$$

 〔证明(引理3)〕设 $n=md+r\left(0 \le r < d-1\right)$ ,数列的前 $n$ 项和 $\displaystyle\sum_{k=1}^{n}a_k$ 可以写为:

$$\begin{aligned} \sum_{k=1}^{n}a_k=\sum_{t=1}^{d-1}a_{t}+\sum_{s=0}^{d-1}\sum_{k=1}^{m-1}a_{kd+s}+\sum_{t=0}^{r}a_{md+t} \tag{78}\end{aligned}$$

  等式两端除以 $m$ 并令 $m \to \infin$ 。右端第一项和第三项都为有限值,因此极限为 $0$ 。讨论右端第二项,由Stolz定理可推导得:

$$\begin{aligned} \lim\limits_{m \to \infin}\frac{\displaystyle\sum_{k=1}^{m-1}a_{kd+s}}{m}=\lim\limits_{m \to \infin}\frac{\displaystyle\sum_{k=1}^{m-1}a_{kd+s}-\displaystyle\sum_{k=1}^{m-2}a_{kd+s}}{m-\left(m-1\right)}=\lim\limits_{m \to \infin}a_{\left(m-1\right)d+s}=b_s \tag{79}\end{aligned}$$

  因此

$$\begin{aligned} \lim\limits_{m \to \infin}\frac{1}{m}\sum_{k=1}^{n}a_k=\sum_{s=0}^{d-1}b_s \tag{80}\end{aligned}$$

  最后再令 $n \to \infin$ ,得

$$\begin{aligned} \lim_{n \to \infin}\frac{1}{n}\sum_{k=1}^{n}a_k=\lim_{m \to \infin}\frac{m}{md+r}\cdot\lim_{m \to \infin}\frac{1}{m}\sum_{k=1}^{n}a_k=\frac{1}{d}\sum_{s=0}^{d-1}b_s \tag{81}\end{aligned}$$

证毕

  现在,我们可以证明定理11

 〔证明(定理11)〕若 $j$ 为非常返状态或零常返状态,由定理9可知 $\lim\limits_{n \to \infin}p_{ij}^{\left(n\right)}=0$ 。因此 $\lim\limits_{n \to \infin}\displaystyle\frac{1}{n}\displaystyle\sum_{k=1}^{n}p_{ij}^{\left(k\right)}=0$ 。若 $j$ 为正常返状态且有周期 $d$ ,则令引理3中的 $a_{kd+s}=p_{ij}^{\left(kd+s\right)}$ ,然后利用定理10得到 $b_s=f_{ij}\left(s\right)\displaystyle\space\frac{d}{\mu_j}$ 。从而得

$$\begin{aligned} \lim\limits_{n \to \infin}\frac{1}{n}\sum_{k=1}^{n}p_{ij}^{\left(k\right)}=\frac{1}{d}\sum_{s=0}^{d-1}f_{ij}\left(s\right)\space\frac{d}{\mu_j}=\frac{1}{\mu_j}\sum_{s=0}^{d-1}f_{ij}\left(s\right)=f_{ij} \tag{82}\end{aligned}$$

证毕

  推论5:如果 $\set{X_n}$ 是不可约的、常返的Markov链(即每个状态都是常返的),则对任意状态 $i,j \in S$ ,有

$$\begin{aligned} \lim\limits_{n \to \infin}\frac{1}{n}\sum_{k=1}^{n}p_{ij}^{\left(k\right)}=\frac{1}{\mu_j} \tag{83}\end{aligned}$$

 〔证明(推论5)〕由引理2可知 $f_{ij}=1$ ,又由推论2可知 $i,j$ 都是正常返的。因此直接代入定理11可证得该推论。

证毕

不变分布与极限分布

不变分布

  定义13(不变分布):对于Markov链,概率分布 $\set{\pi_j,j \in S}$ 称为不变的,若

$$\begin{aligned} \pi_j=\sum_{i \in S}\pi_ip_{ij} \tag{84}\end{aligned}$$

  可见,若Markov链的初始分布 $P\set{X_0=j}=p_j$ 是不变分布,则 $X_1$ 的分布将是

$$\begin{aligned} P\set{X_1=j}=&\sum_{i \in S}P\set{X_1=j|X_0=i}P\set{X_0=i}\\ =&\sum_{i \in S}p_{ij}p_i=p_j \tag{85}\end{aligned}$$

  这与 $X_0$ 的分布是相同的。依此类推,$X_n\left(n=0,1,2,\cdots\right)$ 将有相同的分布,这也是称 $\set{p_i\left(i \in S\right)}$ 为不变分布的原因。

极限分布

  定义14(极限分布):称Markov链是遍历的,如果所有状态相通且均是周期为 $1$ 的正常返状态,对遍历的Markov链,极限

$$\begin{aligned} \lim\limits_{n \to \infin}p_{ij}^{\left(n\right)}=\pi_j\quad j \in S \tag{86}\end{aligned}$$

  称为Markov链的极限分布。由推论4知 $\pi_j$ 存在且 $\pi_j=\displaystyle\frac{1}{\mu_j}$ 。

  定理12:对于不可约非周期的Markov链:
  (1) 若它是遍历的,则 $\pi_j=\lim\limits_{n \to \infin}p_{ij}^{\left(n\right)}>0$ 是不变分布且是唯一的不变分布(遍历定理)。
  (2) 若状态都是瞬过的或全为零常返的,则不变分布不存在。

 〔证明(定理12)〕(1)对遍历的Markov链,由推论4可知 $\lim\limits_{n \to \infin}p_{ij}^{\left(n\right)}$ 存在,记为 $\pi_j$ 。首先证 $\set{\pi_j,j \in S}$ 是不变分布。由Fatou引理C-K方程可得(因为级数是Riemann-Stieljes积分的特例, 也可以看成关于点测度的Lebesgue积分, 所以Fatou引理和下文出现的Lebesgue控制收敛定理仍成立)。

$$\begin{aligned} \pi_j=\lim\limits_{n \to \infin}p_{ij}^{\left(n+1\right)}=\lim\limits_{n \to \infin}\sum_{k \in S}p_{ik}^{\left(n\right)}p_{kj}\ge\sum_{k \in S}\lim\limits_{n \to \infin}p_{ik}^{\left(n\right)}p_{kj}=\sum_{k \in S}\pi_kp_{kj} \tag{87}\end{aligned}$$

  两边对 $j$ 求和,由概率归一性

$$\begin{aligned} \sum_{j \in S}\pi_j\ge\sum_{j \in S}\sum_{k \in S}\pi_kp_{kj}=\sum_{k \in S}\pi_k\left(\sum_{j \in S}p_{kj}\right)=\sum_{k \in S}\pi_k \tag{88}\end{aligned}$$

  因此,上式的大于等于号必须取等,否则将产生矛盾。因此:

$$\begin{aligned} \pi_j=\sum_{k \in S}\pi_kp_{kj} \tag{89}\end{aligned}$$

  从而 $\set{\pi_j,j \in S}$ 是不变分布。再来证 $\set{\pi_j,j \in S}$ 是唯一的不变分布。由上式和C-K方程可得

$$\begin{aligned} \pi_j=\sum_{k \in S}\pi_kp_{kj}=\sum_{k \in S}\sum_{l \in S}\pi_lp_{lk}p_{kj}=\sum_{l \in S}\pi_lp_{lj}^{\left(2\right)}=\cdots=\sum_{k \in S}\pi_kp_{kj}^{\left(n\right)} \tag{90}\end{aligned}$$

  对 $\displaystyle\sum_{j \in S}p_{ij}^{\left(n\right)}=1$ 两边取 $n \to \infin$ 并由Fatou引理可得

$$\begin{aligned} 1=\lim\limits_{n \to \infin}\sum_{j \in S}p_{ij}^{\left(n\right)}\ge\sum_{j \in S}\lim\limits_{n \to \infin}p_{ij}^{\left(n\right)}=\sum_{j \in S}\pi_j \tag{91}\end{aligned}$$

  因此 $\displaystyle\sum_{j \in S}\pi_j\le 1$ 有限。将(90)左右两边取 $n \to \infin$ 并由Lebesgue控制收敛定理可得

$$\begin{aligned} \pi_j=\lim\limits_{n \to \infin}\sum_{k \in S}\pi_kp_{kj}^{\left(n\right)}=\sum_{k \in S}\lim\limits_{n \to \infin}\pi_kp_{kj}^{\left(n\right)}=\pi_j\left(\sum_{k \in S}\pi_k\right) \tag{92}\end{aligned}$$

  因此 $\displaystyle\sum_{k \in S}\pi_k=1$ 。假设另外还有一个平衡分布 $\set{\tilde\pi_j,j \in S}$ ,则有

$$\begin{aligned} \tilde\pi_j=\pi_j\left(\sum_{k \in S}\tilde\pi_k\right)=\pi_j \tag{93}\end{aligned}$$

  因此 $\tilde\pi_j=\pi_j$ 。故分布唯一。接下来证(2)。假设存在一个不变分布 $\set{\pi_j,j \in S}$ ,则由(1)中证明可知 $\pi_j=\displaystyle\sum_{k \in S}\pi_kp_{kj}^{\left(n\right)}\left(n=1,2,\dots\right)$ 。令 $n \to \infin$ ,由定理9可知 $p_{kj}^{\left(n\right)} \to 0$ ,则任意 $ \pi_j = 0$ ,然而这是不可能的。于是对非常返或零常返Markov链不存在不变分布。

证毕

连续时间Markov链

基本定义和性质

连续时间Markov链的定义

  定义15(连续时间Markov链):过程 $\set{X\left(t\right),t\ge0}$ 的状态空间 $S$ 为离散空间,为方便书写,设 $S$ 为 $\set{0,1,2,\cdots}$ 或其子集。若对一切 $s,t\ge0$ 及 $i,j \in S$ 有

$$\begin{aligned} &P\set{X\left(t+s\right)=j|X\left(s\right)=i,X\left(u\right)=x\left(u\right),0\le u < s}\\[5pt] =&P\set{X\left(t+s\right)=j|X\left(s\right)=i} \tag{94}\end{aligned}$$

  成立,则称 $\set{X\left(t\right),t \ge 0}$ 是一个连续时间Markov链
  条件概率 $P\set{X\left(t+s\right)=j|X\left(s\right)=i}$ 记作 $p_{ij}\left(s,t\right)$ 表示过程在时刻 $s$ 处处于状态 $i$ ,经过 $t$ 时间后转移到 $j$ 的转移概率,并称 $\bm{P}\left(s,t\right)=\left(p_{ij}\left(s,t\right)\right)$ 为相应的转移概率矩阵

时齐连续时间Markov链

  定义16(时齐性):称连续时间Markov链是时齐的,若 $p_{ij}\left(s,t\right)$ 与 $s$ 无关。简记 $p_{ij}\left(s,t\right)=p_{ij}\left(t\right)$ ,相应的记 $\bm{P}\left(t\right)=\left(p_{ij}\left(t\right)\right)$ 。本文只讨论时齐的连续时间Markov链,并简称为连续时间Markov链。

  定理13:设 $\set{X\left(t\right),t\ge 0}$ 是连续时间Markov链,假定在时刻0过程刚刚到达 $i$ ,以 $\tau_i$ 记过程离开 $i$ 之前在 $i$ 停留的时间,则 $\tau_i$ 服从指数分布。

 〔证明(定理13)〕只需证明 $\tau_i$ 是无记忆性的,即证明对 $s,t \ge 0$ 有(见指数分布

$$\begin{aligned} P\set{\tau_i>s+t|\tau_i>s}=P\set{\tau_i>t} \tag{95}\end{aligned}$$

  将上式写开并由连续时间Markov链时齐性可得

$$\begin{aligned} &P\set{\tau_i>s+t|\tau_i>s}\\[5pt] =&P\set{X\left(u\right)=i\space \left(0 < u \le s\right),X\left(v\right)=i\space \left(s < v \le s+t\right)|X\left(u\right)=i\space \left(0 < u \le s\right)}\\[5pt] =&P\set{X\left(v\right)=i\space \left(s < v \le s+t\right)|X\left(s\right)=i}\quad\text{(连续时间Markov链的定义)}\\[5pt] =&P\set{X\left(v\right)=i\space \left(0 < v \le t\right)|X\left(0\right)=i}\quad\text{(时齐性)}\\[5pt] =&P\set{\tau_i>t} \tag{96}\end{aligned}$$

证毕

正则连续时间Markov链

  定义17(正则性):称一个连续时间Markov链是正则的,若以概率1在任意有限长的时间内转移的次数是有限的。从而可得连续性条件

$$\begin{aligned} \lim\limits_{t \to 0}p_{ij}\left(t\right)=\delta_{ij}= \begin{cases} 1,\quad i=j\\[5pt] 0,\quad i \ne j \end{cases} \tag{97}\end{aligned}$$

  本文讨论的连续时间Markov链都是正则的。

  :“成立”和“以概率1成立”是有很大区别的。在概率论中,“以概率1成立”意味着某个事件在无限多次试验中几乎肯定会发生,但并不意味着它在每一次试验中都会发生。换句话说,存在极小的可能性(尽管这个可能性可能非常小,接近于0)该事件不会发生。见以概率1收敛

转移概率和Kolmogorov微分方程

转移概率的性质

  定理14:时齐连续时间Markov链的转移概率 $p_{ij}\left(t\right)$ 满足:
  (1) $p_{ij}\left(t\right)\ge 0$
  (2) $\displaystyle\sum_{j \in S}p_{ij}\left(t\right)=1$
  (3) $p_{ij}\left(t+s\right)=\displaystyle\sum_{k \in S}p_{ik}\left(t\right)p_{kj}\left(s\right)$ (连续时间Markov链的C-K方程

 〔证明(定理14)〕(1)和(2)由 $p_{ij}\left(t\right)$ 的定义易知。下面证明  (3) 。由连续时间Markov链时齐性可得

$$\begin{aligned} p_{ij}\left(t+s\right)=&P\set{X\left(t+s\right)=j|X\left(0\right)=i}\\[5pt] =&\sum_{k \in S}P\set{X\left(t+s\right)=j,X\left(t\right)=k|X\left(0\right)=i}\\[5pt] =&\sum_{k \in S}\frac{P\set{X\left(t+s\right)=j,X\left(t\right)=k,X\left(0\right)=i}}{P\set{X\left(0\right)=i}}\\[5pt] =&\sum_{k \in S}\frac{P\set{X\left(t+s\right)=j,X\left(t\right)=k,X\left(0\right)=i}}{P\set{X\left(t\right)=k,X\left(0\right)=i}}\frac{P\set{X\left(t\right)=k,X\left(0\right)=i}}{P\set{X\left(0\right)=i}}\\[5pt] =&\sum_{k \in S}P\set{X\left(t+s\right)=j|X\left(t\right)=k,X\left(0\right)=i}P\set{X\left(t\right)=k|X\left(0\right)=i}\\[5pt] =&\sum_{k \in S}P\set{X\left(t+s\right)=j|X\left(t\right)=k}p_{ik}\left(t\right)\quad\text{(连续时间Markov链)}\\[5pt] =&\sum_{k \in S}p_{kj}\left(s\right)p_{ik}\left(t\right)=\sum_{k \in S}p_{ik}\left(t\right)p_{kj}\left(s\right)\quad\text{(时齐性)} \tag{98}\end{aligned}$$

证毕

转移概率具有一致连续性

  定理15:对固定的 $i,j \in S=\set{0,1,2,\cdots}$ ,$p_{ij}\left(t\right)$ 是 $t$ 的一致连续函数(见一致连续性)。

 〔证明(定理15)〕设 $h>0$ ,则

$$\begin{aligned} p_{ij}\left(t+h\right)-p_{ij}\left(t\right)=&\sum_{k \in S}p_{ik}\left(h\right)p_{kj}\left(t\right)-p_{ij}\left(t\right)\\ =&p_{ii}\left(h\right)p_{ij}\left(t\right)-p_{ij}\left(t\right)+\sum_{k \ne i, k \in S}p_{ik}\left(h\right)p_{kj}\left(t\right)\\ =&-\left(1-p_{ii}\left(h\right)\right)p_{ij}\left(t\right)+\sum_{k \ne i, k \in S}p_{ik}\left(h\right)p_{kj}\left(t\right) \tag{99}\end{aligned}$$

  从而得到

$$\begin{aligned} p_{ij}\left(t+h\right)-p_{ij}\left(t\right)\ge&-\left(1-p_{ii}\left(h\right)\right)p_{ij}\left(t\right)\\ \ge&-\left(1-p_{ii}\left(h\right)\right)\\ \tag{100}\end{aligned}$$

  和

$$\begin{aligned} p_{ij}\left(t+h\right)-p_{ij}\left(t\right)\le&\sum_{k \ne i, k \in S}p_{ik}\left(h\right)p_{kj}\left(t\right)\\ \le&\sum_{k \ne i, k \in S}p_{ik}\left(h\right)=1-p_{ii}\left(h\right)\\ \tag{101}\end{aligned}$$

  因此得到

$$\begin{aligned} |p_{ij}\left(t+h\right)-p_{ij}\left(t\right)|\le 1-p_{ii}\left(h\right) \tag{102}\end{aligned}$$

  对 $h<0$ 也可以得到类似的结果。注意由正则性可知 $\displaystyle\lim\limits_{h \to 0}p_{ii}\left(h\right)=1$ 。因此 $\forall \varepsilon > 0$ ,$\exist \delta > 0$ 满足 $h < \delta$ 时恒有 $1-p_{ii}\left(h\right)<\varepsilon$ ,即 $|p_{ij}\left(t+h\right)-p_{ij}\left(t\right)|<\varepsilon$ 。因此,$p_{ij}\left(t\right)$ 一致连续(见一致连续性)。

证毕

转移速率
  定理16

$$\begin{aligned} \lim\limits_{t \to 0}\frac{1-p_{ii}\left(t\right)}{t}=q_{ii}\le+\infin \tag{103}\end{aligned}$$ $$\begin{aligned} \lim\limits_{t \to 0}\frac{p_{ij}\left(t\right)}{t}=q_{ij}<+\infin ,\quad i \ne j \tag{104}\end{aligned}$$

  称 $q_{ij}$ 为从状态 $i$ 转移到状态 $j$ 的转移速率

 〔证明(定理16)〕先证(103)。首先由正则性可知对任意固定的 $t>0$ ,当 $n$ 充分大时,有 $p_{ii}\left(\displaystyle\frac{t}{n}\right)>0$ ,再由定理14可得结论 $p_{ii}\left(s+t\right)=\displaystyle\sum_{k \in S}p_{ik}\left(s\right)p_{ki}\left(t\right)\ge p_{ii}\left(s\right)p_{ii}\left(t\right)$ ,因此 $p_{ii}\left(t\right)\ge \left(p_{ii}\left(\displaystyle\frac{t}{n}\right)\right)^n>0$ 。故可以定义 $\phi\left(t\right)=-\ln p_{ii}\left(t\right)$ ,它非负有限,且由于 $p_{ii}\left(s+t\right)\ge p_{ii}\left(s\right)p_{ii}\left(t\right)$ ,有 $\phi\left(s+t\right) \le \phi\left(s\right)+\phi\left(t\right)$ 。令 $q_{ii}=\displaystyle\sup\limits_{t>0}\frac{\phi\left(t\right)}{t}$ ,现在要证明 $\displaystyle\frac{\phi\left(t\right)}{t}$ 极限存在且为其上确界。显然

$$\begin{aligned} 0 \le q_{ii} \le \infin,\quad \limsup\limits_{t \to 0}\le q_{ii} \tag{105}\end{aligned}$$

  所以以下只需证下极限 $\displaystyle\liminf\limits_{t \to 0}\frac{\phi\left(t\right)}{t}\ge q_{ii}$ 。任给 $0 < h < t$ ,取 $n$ 使 $t=nh+\varepsilon,\space 0 \le \varepsilon < h$ ,得

$$\begin{aligned} \frac{\phi\left(t\right)}{t} \le \frac{n\phi\left(h\right)}{t}+\frac{\phi\left(\varepsilon\right)}{t} = \frac{nh}{t}\frac{\phi\left(h\right)}{h}+\frac{\phi\left(\varepsilon\right)}{t} \tag{106}\end{aligned}$$

  注意当 $h \to 0^+$ 时,$\varepsilon \to 0$ ,$\displaystyle\frac{nh}{t} \to 1$ ,$\phi\left(\varepsilon\right)=-\ln p_{ii}\left(\varepsilon\right) \to 0$ ,故 $\displaystyle\frac{\phi\left(t\right)}{t}\le\liminf\limits_{h \to 0}\frac{\phi\left(h\right)}{h}$ 因此 $q_{ii}=\displaystyle\sup\limits_{t>0}\frac{\phi\left(t\right)}{t}\le\liminf\limits_{t \to 0}\frac{\phi\left(t\right)}{t}$ 。从而 $\displaystyle q_{ii}=\lim\limits_{t \to 0}\frac{\phi\left(t\right)}{t}$ 。由 $\phi\left(t\right)$ 定义得

$$\begin{aligned} \lim\limits_{t \to 0}\frac{1-p_{ii}\left(t\right)}{t}=\lim\limits_{t \to 0}\frac{1-e^{-\phi\left(t\right)}}{\phi\left(t\right)}\frac{\phi\left(t\right)}{t}=\lim\limits_{t \to 0}\frac{\phi\left(t\right)}{t}=q_{ii} \tag{107}\end{aligned}$$

  再证(104)。由正则性,对任意 $\displaystyle 0 < \varepsilon < \frac{1}{3}$ ,存在 $0 < \delta < 1$ ,使当 $0 < t \le \delta $ 时,有 $p_{ii}\left(t\right)>1-\varepsilon$ ,$p_{jj}\left(t\right)>1-\varepsilon$ ,$p_{ji}\left(t\right)<\varepsilon$ 。
  下面要证:对任意 $0 \le h < t$ ,只要 $t \le \delta$ ,则有

$$\begin{aligned} p_{ij}\left(h\right)\le\frac{p_{ij}\left(t\right)}{n}\frac{1}{1-3\varepsilon} \tag{108}\end{aligned}$$

其中 $\displaystyle n=\left\lfloor \frac{t}{h} \right\rfloor$ (向下取整)。记

$$\begin{aligned} \begin{cases} _jp_{ik}\left(h\right)=p_{ik}\left(h\right)\\[10pt] _jp_{ik}\left(mh\right)=\displaystyle\sum_{r \ne j}{_jp_{ir}\left(\left(m-1\right)h\right)p_{rk}\left(h\right)} \end{cases} \tag{109}\end{aligned}$$

  其中 $_jp_{ik}\left(mh\right)$ 表示从 $i$ 出发,在时刻 $h,2h,\cdots,\left(m-1\right)h$ 未到达 $j$ 而在 $mh$ 时刻到达 $k$ 的概率。反复展开 $_jp_{ik}\left(mh\right)$ 并由定理14可得

$$\begin{aligned} _jp_{ik}\left(mh\right)=&\sum_{r \ne j}{_jp_{ir}\left(\left(m-1\right)h\right)p_{rk}\left(h\right)}\\ =&\sum_r{_jp_{ir}\left(\left(m-1\right)h\right)p_{rk}\left(h\right)}-{_jp_{ij}\left(\left(m-1\right)h\right)p_{jk}\left(h\right)}\\ =&\sum_r\sum_{s \ne j}{_jp_{is}\left(\left(m-2\right)h\right)p_{sr}\left(h\right)p_{rk}\left(h\right)}-{_jp_{ij}\left(\left(m-1\right)h\right)p_{jk}\left(h\right)}\\ =&\sum_{s \ne j}{_jp_{is}\left(\left(m-2\right)h\right)p_{sk}\left(2h\right)}-{_jp_{ij}\left(\left(m-1\right)h\right)p_{jk}\left(h\right)}\quad\text{(定理14)}\\ =&\sum_s{_jp_{is}\left(\left(m-2\right)h\right)p_{sk}\left(2h\right)}-{_jp_{ij}\left(\left(m-2\right)h\right)p_{jk}\left(2h\right)}-{_jp_{ij}\left(\left(m-1\right)h\right)p_{jk}\left(h\right)}\\ =&\cdots\\ =&\sum_r{_jp_{ir}\left(h\right)p_{rk}\left(\left(m-1\right)h\right)}-\sum_{l=1}^{m-1}{_jp_{ij}\left(\left(m-l\right)h\right)p_{jk}\left(lh\right)}\\ =&\sum_r{p_{ir}\left(h\right)p_{rk}\left(\left(m-1\right)h\right)}-\sum_{l=1}^{m-1}{_jp_{ij}\left(\left(m-l\right)h\right)p_{jk}\left(lh\right)}\\ =&p_{ik}\left(mh\right)-\sum_{l=1}^{m-1}{_jp_{ij}\left(\left(m-l\right)h\right)p_{jk}\left(lh\right)}\quad\text{(定理14)}\\ =&p_{ik}\left(mh\right)-\sum_{l=1}^{m-1}{_jp_{ij}\left(\left(lh\right)p_{jk}\left(\left(m-l\right)h\right)\right)}\quad(换元l \to \left(m-l\right)) \tag{110}\end{aligned}$$

  由正则性可得

$$\begin{aligned} p_{ik}\left(mh\right)=&_jp_{ik}\left(mh\right)+\sum_{l=1}^{m-1}{_jp_{ij}\left(lh\right)p_{jk}\left(\left(m-l\right)h\right)}\\ =&_jp_{ij}\left(mh\right)\delta_{jk}+\sum_{l=1}^{m-1}{_jp_{ij}\left(lh\right)p_{jk}\left(\left(m-l\right)h\right)}\\ =&_jp_{ij}\left(mh\right)p_{jk}\left(0\right)+\sum_{l=1}^{m-1}{_jp_{ij}\left(lh\right)p_{jk}\left(\left(m-l\right)h\right)}\quad(正则性)\\ =&\sum_{l=1}^{m}{_jp_{ij}\left(lh\right)p_{jk}\left(\left(m-l\right)h\right)} \tag{111}\end{aligned}$$

  由上式和定理14可得

$$\begin{aligned} p_{ij}\left(t\right)=&\sum_k{p_{ik}\left(nh\right)p_{kj}\left(t-nh\right)}\\ =&\sum_k\sum_{m=1}^{n}{_jp_{ij}\left(mh\right)p_{jk}\left(\left(n-m\right)h\right)}p_{kj}\left(t-nh\right)\\ =&\sum_{m=1}^{n}{_jp_{ij}\left(mh\right)p_{jj}\left(t-mh\right)} \tag{112}\end{aligned}$$

  当 $h < t \le \delta$ 时,由上式可得

$$\begin{aligned} \varepsilon > 1-p_{ii}\left(t\right)=&\sum_{k \ne i}p_{ik}\left(t\right)\\[10pt] \ge&p_{ij}\left(t\right)\quad(注意i \ne j)\\[5pt] \ge&\sum_{m=1}^{n}{_jp_{ij}\left(mh\right)p_{jj}\left(t-mh\right)}\\ \ge&\left(1-\varepsilon\right)\sum_{m=1}^{n}{_jp_{ij}\left(mh\right)} \tag{113}\end{aligned}$$

  即

$$\begin{aligned} \sum_{m=1}^{n}{_jp_{ij}\left(mh\right)} \le \frac{\varepsilon}{1-\varepsilon} \tag{114}\end{aligned}$$

(110)取 $k=i$ 可得

$$\begin{aligned} _jp_{ii}\left(mh\right)=&p_{ii}\left(mh\right)-\sum_{l=1}^{m-1}{_jp_{ij}\left(\left(lh\right)p_{ji}\left(\left(m-l\right)h\right)\right)}\\ \ge&p_{ii}\left(mh\right)-\sum_{l=1}^{m-1}{_jp_{ij}\left(\left(lh\right)\right)}\\ \ge&1 - \varepsilon - \frac{\varepsilon}{1-\varepsilon} \tag{115}\end{aligned}$$

  因此由(112)定理14可得

$$\begin{aligned} p_{ij}\left(t\right)=&\sum_{m=1}^{n}{_jp_{ij}\left(mh\right)p_{jj}\left(t-mh\right)}\\[5pt] \ge&\sum_{m=1}^{n}{_jp_{ii}\left(\left(m-1\right)h\right)p_{ij}\left(h\right)p_{jj}\left(t-mh\right)}\\[5pt] \ge&n\left(1 - \varepsilon - \frac{\varepsilon}{1-\varepsilon}\right)p_{ij}\left(h\right)\left(1-\varepsilon\right)\\[10pt] \ge&n\left(1-3\varepsilon\right)p_{ij}\left(h\right) \tag{116}\end{aligned}$$

(108)得证。两边除以 $h$ 并注意当 $h \to 0$ 时 $nh \to t$ ,得

$$\begin{aligned} \limsup\limits_{h \to 0}\frac{p_{ij}\left(h\right)}{h} \le \frac{1}{1+3\varepsilon}\frac{p_{ij}\left(t\right)}{t} < \infin \tag{117}\end{aligned}$$

  再令 $t \to 0$ ,有

$$\begin{aligned} \limsup\limits_{h \to 0}\frac{p_{ij}\left(h\right)}{h} \le \frac{1}{1+3\varepsilon}\liminf\limits_{t \to 0}\frac{p_{ij}\left(t\right)}{t} < \infin \tag{118}\end{aligned}$$

  再令 $\varepsilon \to 0$ ,定理得证。

证毕

  推论6:对有限状态时齐的连续时间的Markov链,有

$$\begin{aligned} q_{ii}=\sum_{j \ne i}q_{ij} < +\infin \tag{119}\end{aligned}$$

 〔证明(推论6)〕由定理14知,$\displaystyle\sum_{j \in S}p_{ij}\left(t\right)=1$ ,即

$$\begin{aligned} 1-p_{ii}\left(t\right)=\sum_{j \ne i}p_{ij}\left(t\right) \tag{120}\end{aligned}$$

  故由定理16

$$\begin{aligned} \lim\limits_{t \to 0}\frac{1-p_{ii}\left(t\right)}{t}=&\lim\limits_{t \to 0}\sum_{j \ne i}\frac{p_{ij}\left(t\right)}{t}\\ =&\sum_{j \ne i}\lim\limits_{t \to 0}\frac{p_{ij}\left(t\right)}{t}\\ =&\sum_{j \ne i}q_{ij} < +\infin \tag{121}\end{aligned}$$

证毕

保守性

  对于无限状态的情况,一般只能得到 $q_{ii} \ge \displaystyle\sum_{j \ne i}q_{ij}$ ((121)中积分和求和不可交换,因此只能使用Fatou引理)。设状态空间为 $S=\set{1,2,\cdots,n,\cdots}$ ,此时记

$$\begin{aligned} \bm{Q}= \begin{pmatrix} -q_{11} & q_{12} & q_{13} & \cdots & q_{1i} & \cdots \\[5pt] q_{21} & -q_{22} & q_{23} & \cdots & q_{2i} & \cdots \\[5pt] \vdots & \vdots & \vdots & & \vdots & \cdots \\[5pt] q_{i1} & q_{i2} & q_{i3} & \cdots & -q_{ii} & \cdots \\[5pt] \vdots & \vdots & \vdots & & \vdots & \\[5pt] \end{pmatrix} \tag{122}\end{aligned}$$

  称为连续时间Markov链的 $\bm{Q}$ 矩阵。当矩阵元素 $q_{ii}=\sum_{j \ne i}q_{ij}<+\infin$ 时,称该矩阵为保守的

Kolmogorov微分方程

  定理17(Kolmogorov微分方程):对一切 $i,j \in S,t \ge 0$ 且 $q_{ii}=\displaystyle\sum_{j \ne i}q_{ij}<+\infin$ ,有
  (1) 向后方程 $$\begin{aligned} p_{ij}^\prime\left(t\right)=\sum_{k \ne i}q_{ik}p_{kj}\left(t\right)-q_{ii}p_{ij}\left(t\right) \tag{123}\end{aligned}$$   (2) 向前方程(如果满足 $\displaystyle\sum_{k \ne i}\frac{p_{kj}\left(h\right)}{h}$ 有限) $$\begin{aligned} p_{ij}^\prime\left(t\right)=\sum_{k \ne j}q_{kj}p_{ik}\left(t\right)-q_{jj}p_{ij}\left(t\right) \tag{124}\end{aligned}$$

 〔证明(Kolmogorov微分方程)〕先证明(123)。由定理14可得

$$\begin{aligned} p_{ij}\left(t+h\right)=\sum_{k \in S}p_{ik}\left(h\right)p_{kj}\left(t\right) \tag{125}\end{aligned}$$

  或等价地

$$\begin{aligned} p_{ij}\left(t+h\right)-p_{ii}\left(h\right)p_{ij}\left(t\right)=\sum_{k \ne i,k \in S}p_{ik}\left(h\right)p_{kj}\left(t\right) \tag{126}\end{aligned}$$

  变形为

$$\begin{aligned} p_{ij}\left(t+h\right)-p_{ij}\left(t\right)=\sum_{k \ne i,k \in S}p_{ik}\left(h\right)p_{kj}\left(t\right)-\left(1-p_{ii}\left(h\right)\right)p_{ij}\left(t\right) \tag{127}\end{aligned}$$

  于是

$$\begin{aligned} \lim\limits_{h \to 0}\frac{p_{ij}\left(t+h\right)-p_{ij}\left(t\right)}{h}=\lim\limits_{h \to 0}\sum_{k \ne i,k \in S}\frac{p_{ik}\left(h\right)}{h}p_{kj}\left(t\right)-\lim\limits_{h \to 0}\frac{1-p_{ii}\left(h\right)}{h}p_{ij}\left(t\right) \tag{128}\end{aligned}$$

  若此时Markov链状态是有限的,应用定理16推论6从上式直接可以得到(123)(向后方程)
  下面证明对于无限状态下依然有(123)成立。由上式,我们只需证明其中的极限与求和可交换次序即可。由Fatou引理可推导出

$$\begin{aligned} \liminf\limits_{h \to 0}\sum_{k \ne i}\frac{p_{ik}\left(h\right)}{h}p_{kj}\left(t\right)\ge&\sum_{k \ne i}\liminf\limits_{h \to 0}\frac{p_{ik}\left(h\right)}{h}p_{kj}\left(t\right)\\ =&\sum_{k \ne i}q_{ik}p_{kj}\left(t\right) \tag{129}\end{aligned}$$

  注意 $\displaystyle\sum_{k \ne i}\frac{p_{ik}\left(h\right)}{h}p_{kj}\left(t\right)\le\sum_{k \ne i}\frac{p_{ik}\left(h\right)}{h}=\frac{1-p_{ii}\left(h\right)}{h}$ ,因此可以使用反向Fatou引理

$$\begin{aligned} \limsup\limits_{h \to 0}\sum_{k \ne i}\frac{p_{ik}\left(h\right)}{h}p_{kj}\left(t\right)\le&\sum_{k \ne i}\limsup\limits_{h \to 0}\frac{p_{ik}\left(h\right)}{h}p_{kj}\left(t\right)\\ =&\sum_{k \ne i}q_{ik}p_{kj}\left(t\right) \tag{130}\end{aligned}$$

  因此

$$\begin{aligned} \lim\limits_{h \to 0}\sum_{k \ne i}\frac{p_{ik}\left(h\right)}{h}p_{kj}\left(t\right)=\sum_{k \ne i}q_{ik}p_{kj}\left(t\right) \tag{131}\end{aligned}$$

  因此无限状态下(123)仍然成立。实际上(123)可以被写成矩阵形式,也就是 $\bm{P}^\prime\left(t\right)=\bm{Q}\bm{P}\left(t\right)$ ,其中 $\bm{P}\left(t\right)=\left(p_{ij}\left(t\right)\right)$ ,$\bm{Q}=\left(q_{ij}\right)$ 。依Kolmogorov微分方程条件知 $\bm{Q}$ 是保守的。
  下面证明(124)。在(123)中计算 $t+h$ 的状态时是对退后到时刻 $h$ 的状态来取条件的(所以称为后退方程),这里我们考虑对时刻 $t$ 的状态取条件,用定理14

$$\begin{aligned} p_{ij}\left(t+h\right)=\sum_{k \in S}p_{ik}\left(t\right)p_{kj}\left(h\right) \tag{132}\end{aligned}$$

  同理得到

$$\begin{aligned} \lim\limits_{h \to 0}\frac{p_{ij}\left(t+h\right)-p_{ij}\left(t\right)}{h}=\lim\limits_{h \to 0}\sum_{k \ne i,k \in S}p_{ik}\left(t\right)\frac{p_{kj}\left(h\right)}{h}-\lim\limits_{h \to 0}\frac{1-p_{jj}\left(h\right)}{h}p_{ij}\left(t\right) \tag{133}\end{aligned}$$

  注意上式的极限和求和不一定是能交换的( $\displaystyle\sum_{k \ne i}\frac{p_{kj}\left(h\right)}{h}$ 不一定有限,因此反向Fatou引理不可用)。如果上式的极限和求和运算可以交换,则可得(124)成立。

证毕

前进!前进!不择手段地前进!

刘慈欣, 《三体Ⅱ:黑暗森林》
本图书馆累计发布了37篇文章 共51.8万字
本图书馆访客数 访问量