目前,我正在尝试使用boilerpipe APl 从新闻文章中提取文本。但是,它并不完全有效。例如,请参阅此链接。尽管boilerpipe 获取了所有主要文本,但它也获取了一些不重要的文本,例如“在Facebook Messenger 上与我们聊天”。是否有任何可行的锅炉管替代品,或者有没有办法配置锅炉管以便更好地找到主要文章文本?
目前,我正在尝试使用boilerpipe APl 从新闻文章中提取文本。但是,它并不完全有效。例如,请参阅此链接。尽管boilerpipe 获取了所有主要文本,但它也获取了一些不重要的文本,例如“在Facebook Messenger 上与我们聊天”。是否有任何可行的锅炉管替代品,或者有没有办法配置锅炉管以便更好地找到主要文章文本?