使用 gensim word2vec,构建了一个带有一堆诉讼文件的 CBOW 模型,用于在命名实体识别问题中将单词表示为向量,但我想知道如何评估我的单词表示。如果我使用任何其他数据集,如 wordsim353(NLTK) 或谷歌的其他在线数据集,它就不起作用,因为我构建了特定于我的域文件数据集的模型。如何评估 word2vec 对词向量的表示。我希望属于相似上下文的词在向量空间中更接近。如何确保构建模型正在执行它?
我开始使用一种叫做奇数一出的技术。例如:
model.wv.doesnt_match("breakfast cereal dinner lunch".split()) --> 'cereal'
我使用 word2vec 训练中的单词创建了自己的数据集(用于验证)。开始评估三个词的相似上下文和一个奇怪的词脱离上下文。但是我的模型的准确率只有 30%。
上述方法真的有助于评估我的 w2v 模型吗?或者,还有更好的方法 ?
我想使用 word_similarity 度量,但我需要一个参考分数(人工评估)来评估我的模型,或者有什么技术可以做到吗?请提出任何想法或技术。