我想提取 CRAN 上所有包的 github repo url。我尝试先阅读 CRAN 的链接并获取所有包名称的表,其中还包含每个包的描述页面的 url,因为我想通过描述页面提取 github repo url。但我无法获得完整的网址。你能帮我解决这个问题吗?或者有没有更好的方法来获取所有包的 repo url?
这是我的补充: 其实我想过滤那些确实有官方github repo的pkgs,比如一些pkgs如xfun或fddm。我发现我可以从 CRAN 上的 pkgs 描述中提取用户名和 repo 名称,并将它们放在 github 格式的 url 中。(对于它们中的大多数具有相同格式的 url,例如:https://github.com/{username}/{reponame}。例如,对于 package xfun,它会像:https://github.com/yihui/xfun .
现在,我得到了其中一些:(其中三个)
我想知道如何获得所有这些的网址。我知道使用胶水 pkg 可以替换 url 中的元素。为了通过替换元素(用户名和 reponame)来获取 url,我尝试了 map() 和 map_dfr() 函数。但它返回我错误: parse_url(url) 中的错误:length(url) == 1 is not TRUE
这是我的代码:
get <- map_dfr(dat, ~{
username <- dat$user
reponame <- dat$package
pkg_url <- GET(glue::glue("https://github.com/{username}/{reponame}"))
})
你能帮我解决这个问题吗?非常感谢 !:)