我正在尝试使用它们提供的文件将 VerbNet 与 WordNet 链接以直接处理数据:
VerbNet => http://verbs.colorado.edu/verb-index/vn/verbnet-3.3.tar.gz
WordNet => http://wordnet-rdf.princeton.edu/static/wordnet.nt.gz
VerbNet 中的动词通过其 sense_key 链接到 WordNet:
例如直播%2:31:00::
这将是 sense_key 的结构:
(引理)%(part_of_speech_number):(lexical_file_number):(lexicographer_id)::
解析nt文件的n个三元组,我找到了除lexicographer_id之外的所有数据:
lemma => live
part_of_speech_number => 2
lexical_file_number => 31
lexicographer_id => ??