2

我正在尝试使用它们提供的文件将 VerbNet 与 WordNet 链接以直接处理数据:

VerbNet => http://verbs.colorado.edu/verb-index/vn/verbnet-3.3.tar.gz

WordNet => http://wordnet-rdf.princeton.edu/static/wordnet.nt.gz

VerbNet 中的动词通过其 sense_key 链接到 WordNet:

例如直播%2:31:00::

这将是 sense_key 的结构:

(引理)%(part_of_speech_number):(lexical_file_number):(lexicographer_id)::

解析nt文件的n个三元组,我找到了除lexicographer_id之外的所有数据:

lemma => live 
part_of_speech_number => 2 
lexical_file_number => 31
lexicographer_id => ??
4

1 回答 1

0

解析 wordnet.nt 文件似乎没有为您提供此信息。

如果从http://wordnetcode.princeton.edu/wn3.1.dict.tar.gz下载 Wordnet 3.1 数据库(链接在https://wordnet.princeton.edu/download/current-version),你会找到包含以下条目的文件“index.sense”:

bethel%1:06:00:: 02836245 1 0
bethink%2:31:00:: 00685046 2 1
bethink%2:39:00:: 02171205 1 3
bethlehem%1:15:00:: 08813084 2 0

该结构的当前描述位于https://wordnet.princeton.edu/documentation/senseidx5wn

该行中的第一个参数是在 VerbNet 中使用的 sense_key。第二个参数是 synset_offset,它与文件 wordnet.nt 中的 Synset 标识符一致。

从文件“index.sense”中,您还可以获得与结构“word.pos.sense_number”匹配的感觉编号,例如:“man.n.02”

于 2018-11-28T16:27:19.900 回答