rdf - 使用 RDFLib 从网页中提取非 RDF 数据作为 RDF 数据

Question

我最近安装了 RDFLib 来处理 RDF 数据。我想从任何具有非 RDF/RDF 数据的网页中提取 RDF 数据，例如 Virtuoso Sponger

[就像这个链接一样]（http://linkeddata.uriburner.com/about/html/http/www.slideshare.net/kleinerperkins/internet-trends-v1）

并存储为 N-Triples(nt) 或 N3/Turtle 格式（如链接页脚中的选项）。如果我执行，我会收到警告和错误

 g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

还有一个用于使用 RDFLib 进行本体映射的内置功能吗？

score 0 · Accepted Answer

如果我执行，我会收到警告和错误
g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

这并不奇怪，因为您实际上是在要求它使用 n3 解析器解析 HTML 页面。

你可以跑

g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html", format="html")

但这可能也不是您想要的。RDFLib 可以与嵌入在 HTML 中的 RDF（如 RDFa 或微数据）一起使用，它还可以从 HTML 中提取一些“通用 RDF”，但结果与您从 uriburner 得到的结果大不相同。原因是它使用了一个定制的“slideshare”Virtuoso Sponger，它专门用于从幻灯片共享 HTML 中提取更多有用的信息。如果您想使用放入特殊海绵中的知识，您可以通过从 uriburner 解析 RDF 版本来“通过”uriburner 查询页面（链接可以在页面底部找到）：如何找到链接

g.parse(
    'http://linkeddata.uriburner.com/sparql?default-graph-uri=http%3A%2F%2Fwww.slideshare.net%2Fkleinerperkins%2Finternet-trends-v1&query=DESCRIBE%20%3Chttp%3A%2F%2Flinkeddata.uriburner.com%2Fabout%2Fid%2Fentity%2Fhttp%2Fwww.slideshare.net%2Fkleinerperkins%2Finternet-trends-v1%3E&output=text%2Frdf%2Bn3',
    format='n3'
)

rdf - 使用 RDFLib 从网页中提取非 RDF 数据作为 RDF 数据

1 回答 1

Related

Reference