如何标准化单个度量
让我们考虑一个任意的相似性度量M
并取任意单词w
.
Define m = M(w,w)
。那么m取最大可能值M
.
让我们定义一下MN
作为标准化指标M
.
对于任意两个单词w, u
你可以计算MN(w, u) = M(w, u) / m
.
很容易看出如果M
取非负值,那么MN
取值于[0, 1]
.
如何标准化由多个度量组合而成的度量
为了计算您自己定义的度量F
k个不同措施的组合m_1, m_2, ..., m_k
首先独立标准化每个m_i
使用上面的方法然后定义:
alpha_1, alpha_2, ..., alpha_k
这样alpha_i
表示第 i 个度量的权重。
所有 alpha 之和必须为 1,即:
alpha_1 + alpha_2 + ... + alpha_k = 1
然后计算你自己的衡量标准w, u
you do:
F(w, u) = alpha_1 * m_1(w, u) + alpha_2 * m_2(w, u) + ... + alpha_k * m_k(w, u)
很明显F
取 [0,1] 范围内的值