参考2

cosine

文書間の類似度を測る尺度の一つ. 上記のTF-IDFで文書の特徴を表現するベクトルを生成するわけですが, そのベクトルの近さを測る尺度として最も単純にはベクトルの内積が用いられます. ですが,単純にベクトル同士の内積を取ると長いベクトル(長い文書)…