文書間の類似度を測る尺度の一つ. 上記のTF-IDFで文書の特徴を表現するベクトルを生成するわけですが, そのベクトルの近さを測る尺度として最も単純にはベクトルの内積が用いられます. ですが,単純にベクトル同士の内積を取ると長いベクトル(長い文書)…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。