离散的概率模型:
P
(
Y
∣
X
1
,
…
,
X
i
)
P(Y|X_1,…,X_i)
P(Y∣X1,…,Xi),其中类别变量Y,依赖于特征变量
X
1
,
X
2
,
…
,
X
i
X_1, X_2,…,X_i
X1,X2,…,Xi, 修改模型为:
P
(
Y
∣
X
1
,
.
.
,
X
i
)
=
P
(
X
1
,
.
.
,
X
i
)
P
(
Y
)
P
(
X
1
,
.
.
.
,
X
i
)
P(Y|X_1,..,X_i)=\frac{P(X_1,..,X_i)P(Y)}{P(X_1,...,X_i)}
P(Y∣X1,..,Xi)=P(X1,...,Xi)P(X1,..,Xi)P(Y)
由于在预测时,同种方案下,分母
P
(
X
1
,
…
,
X
i
)
P(X_1,…,X_i)
P(X1,…,Xi)相同,因此我们可以不用考虑这部分。因此,此模型,我们重点需要计算的部分即为:
P
(
X
1
,
.
.
,
X
i
)
P
(
Y
)
P(X_1,..,X_i)P(Y)
P(X1,..,Xi)P(Y)。
根据链式法则,假设各个特征相互独立,模型即可变为以下公式:
P
(
X
1
∣
P
)
∗
P
(
X
2
∣
Y
)
.
.
.
P
(
X
i
∣
Y
)
P(X_1|P)*P(X_2|Y)...P(X_i|Y)
P(X1∣P)∗P(X2∣Y)...P(Xi∣Y)其中,
P
(
X
i
∣
Y
)
=
D
X
,
Y
D
Y
P(X_i|Y)=\frac{D_{X,Y}}{D_Y}
P(Xi∣Y)=DYDX,Y 。