有很多问题可以提取包含单词的特定句子(例如使用 python提取句子和Python 提取包含单词的句子),我有足够的 NLTK 和 SciPy 初学者经验,能够在我的自己的。
但是,我在尝试提取包含一个单词的句子时遇到了困难……以及目标句子之前和之后的句子。
例如:
“前几天我正在上学路上下雨了。我伸手去拿我的雨伞,但我意识到我把它忘在家里了。我该怎么办?我立即跑到最近的树上。但后来我意识到我不能一直尝试一棵没有叶子的树。”
在这个例子中,目标词是“could”。如果我想提取目标句子(我能做什么?)以及前后句子(我伸手去拿我的伞,但我意识到我把它忘在家里了。我立即跑到最近的树。) ,什么是好方法?
假设我将每个段落划分为自己的文本...
for paragraph in document:
do something
...有没有解决这个问题的正确方法?我有大约 10,000 个段落,目标词周围有不同数量的句子(每个段落都出现)。