我有一个抓取的数据集,其中包含一列数据,如下所示:
<td>1,968</td>
<td>185</td>
<td>1,285<sup id="cite_ref-4" class="reference"><a href="#cite_note-4">[4]</a></sup></td>
我正在使用Alteryx来处理数据,我想使用正则表达式来提取 html 标签<td>
和</td>
. 因此,在上述情况下,我应该返回 1968、185 和 1285。我尝试了以下正则表达式,但都没有使用这个 tester。我相信正则表达式的版本应该是 Alteryx 的 R,但不确定。
>([0-9]+)<
>[0-9]+<
有人可以对此有所了解吗?谢谢!