ibm-watson - 为什么 URLGetRelations API 错误地将某些句子标记为“未来”时态？

Question

我希望使用 URLGetRelations API 来帮助识别文本中未来时态的句子。但是，我发现 API 识别为将来时的句子不准确。下面的示例都被标识为“未来”，但这些都可以说是不正确的。我在下面的 API 响应中看到有一些乱码（例如第一篇文章中的“revivehim”），这可能是导致标签错误的原因吗？但是，如果您查看我将 API 定向到的 URL，原始源文本中不会出现失真。

来自：http ://www.reuters.com/article/new-york-police-idUSL2N15R02C

{ "sentence": " \"天哪，有人被撞了"，泪流满面的梁回忆说，当他的女朋友疯狂地试图救活他时，他发现一个流血的格利躺在楼梯平台上时说。", "subject": { "text": “他的女朋友”}，“动作”：{“文本”：“试图复兴”，“lemmatized”：“试图复兴”，“动词”：{“文本”：“复兴”，“时态”：“未来” " } },"object": { "text": "him","sentimentFromSubject": { "type": "negative","score": "-0.70197" } } },

二来自：http ://www.cnn.com/2016/02/11/us/nypd-officer-trial/

{ "sentence": " 星期四晚上，在判决前大约一个小时，陪审团要求 Danny Chun 大法官宣读指控和法律定义，这是本周第二次。","subject": { "text": "Justice Danny Chun" },"action": { "text": "to read","lemmatized": "to read", "verb": {"text": "read", "tense": "future" } }, “object”：{“text”：“指控和法律定义”，“sentiment”：{“type”：“negative”，“score”：“-0.597878”}}}，

score 1 · Accepted Answer

我认为是“to”这个词造成了这种混乱。包含“to”一词的将来时动词短语很常见，例如“I'm going to eat that later”和“We are planning to fly today”。您还会看到诸如“乔今晚将出现在电视上”之类的短语，即使它在语法上不是 100% 正确，也意味着将来时。在您分享的案例中，“to”这个词正在形成一个不定式，但由于与将来时动词短语的结构非常相似，它们被归类为将来时。在第二个例子中很容易看出这是如何发生的：主题是“Justice Danny Chun”，动作是“阅读”，对象是“指控......”。

ibm-watson - 为什么 URLGetRelations API 错误地将某些句子标记为“未来”时态？

1 回答 1

Related

Reference