我正在尝试使用样板代码从 HTML 中获取文章的主要内容。
从这里下载了最新的 jars 。
我正在尝试使用以下代码:
String article = "";
try {
article = ArticleExtractor.INSTANCE.getText(url);
System.out.println("Article ++++ >>" + article);
} catch (BoilerpipeProcessingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
但这会为每个 URL 返回一个空字符串。谁可以帮我这个事?