1

我最近安装了 RDFLib 来处理 RDF 数据。我想从任何具有非 RDF/RDF 数据的网页中提取 RDF 数据,例如 Virtuoso Sponger

[就像这个链接一样](http://linkeddata.uriburner.com/about/html/http/www.slideshare.net/kleinerperkins/internet-trends-v1

并存储为 N-Triples(nt) 或 N3/Turtle 格式(如链接页脚中的选项)。如果我执行,我会收到警告和错误

 g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

还有一个用于使用 RDFLib 进行本体映射的内置功能吗?

4

1 回答 1

0

如果我执行,我会收到警告和错误

g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

这并不奇怪,因为您实际上是在要求它使用 n3 解析器解析 HTML 页面。

你可以跑

g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html", format="html")

但这可能也不是您想要的。RDFLib 可以与嵌入在 HTML 中的 RDF(如 RDFa 或微数据)一起使用,它还可以从 HTML 中提取一些“通用 RDF”,但结果与您从 uriburner 得到的结果大不相同。原因是它使用了一个定制的“slideshare”Virtuoso Sponger,它专门用于从幻灯片共享 HTML 中提取更多有用的信息。如果您想使用放入特殊海绵中的知识,您可以通过从 uriburner 解析 RDF 版本来“通过”uriburner 查询页面(链接可以在页面底部找到): 如何找到链接

g.parse(
    'http://linkeddata.uriburner.com/sparql?default-graph-uri=http%3A%2F%2Fwww.slideshare.net%2Fkleinerperkins%2Finternet-trends-v1&query=DESCRIBE%20%3Chttp%3A%2F%2Flinkeddata.uriburner.com%2Fabout%2Fid%2Fentity%2Fhttp%2Fwww.slideshare.net%2Fkleinerperkins%2Finternet-trends-v1%3E&output=text%2Frdf%2Bn3',
    format='n3'
)
于 2015-05-30T18:44:24.300 回答