简而言之:
有没有办法使用pup来限制结果的数量,而不是整体,而是在标签级别?
背景故事/用例:
自从我了解小狗以来,我一直很着迷。我一直在思考新的用例。今天早上我想用它来获取ESPN的最新头条新闻。
ESPN 似乎有一个像这样的无序列表:<ul class="headlines">
然后是一堆列表项。
一个简单的解决方案是:
$ curl -s -S http://espn.go.com/ | pup .headlines a text{}
正确的?但是,正如您所看到的,有时每行每个主题都有多个链接与备用作者,因此您最终会得到像“Low”、“Anande”、“Stark”和“Dinich”这样的结果(ESPN 的姓氏作者)。
理想情况下,我想做这样的事情:
$ curl -s -S http://espn.go.com/ | pup .headlines li a slice{:1} text{}
但这只会返回第一个结果。:\
每个有多个<a>
标签<li>
,所以我想检索所有<li>
项目,但将<a>
标签数量限制为 1 个<li>
。这可能吗?