1

我希望使用 URLGetRelations API 来帮助识别文本中未来时态的句子。但是,我发现 API 识别为将来时的句子不准确。下面的示例都被标识为“未来”,但这些都可以说是不正确的。我在下面的 API 响应中看到有一些乱码(例如第一篇文章中的“revivehim”),这可能是导致标签错误的原因吗?但是,如果您查看我将 API 定向到的 URL,原始源文本中不会出现失真。

来自:http ://www.reuters.com/article/new-york-police-idUSL2N15R02C

{ "sentence": " \"天哪,有人被撞了",泪流满面的梁回忆说,当他的女朋友疯狂地试图救活他时,他发现一个流血的格利躺在楼梯平台上时说。", "subject": { "text": “他的女朋友”},“动作”:{“文本”:“试图复兴”,“lemmatized”:“试图复兴”,“动词”:{“文本”:“复兴”,“时态”:“未来” " } },"object": { "text": "him","sentimentFromSubject": { "type": "negative","score": "-0.70197" } } },

二来自:http ://www.cnn.com/2016/02/11/us/nypd-officer-trial/

{ "sentence": " 星期四晚上,在判决前大约一个小时,陪审团要求 Danny Chun 大法官宣读指控和法律定义,这是本周第二次。","subject": { "text": "Justice Danny Chun" },"action": { "text": "to read","lemmatized": "to read", "verb": {"text": "read", "tense": "future" } }, “object”:{“text”:“指控和法律定义”,“sentiment”:{“type”:“negative”,“score”:“-0.597878”}}},

4

1 回答 1

1

我认为是“to”这个词造成了这种混乱。包含“to”一词的将来时动词短语很常见,例如“I'm going to eat that later”和“We are planning to fly today”。您还会看到诸如“乔今晚将出现在电视上”之类的短语,即使它在语法上不是 100% 正确,也意味着将来时。在您分享的案例中,“to”这个词正在形成一个不定式,但由于与将来时动词短语的结构非常相似,它们被归类为将来时。在第二个例子中很容易看出这是如何发生的:主题是“Justice Danny Chun”,动作是“阅读”,对象是“指控......”。

于 2016-02-29T19:53:25.203 回答