0

我有一个 URL 列表,我想将其拆分为具有某些字符的元组,例如'p'or 'blog'(完整的元组如下所示:)[('p', '958')][('blog', '3')][('p', '2512')]。我想将这些拆分并写入单独的、适当命名的文件(p_file.txt、、blog_file.txt等)。然而,我被困住了。我一直在尝试多种方法,但我没有取得任何成功。将不胜感激任何帮助。

def parse_file():
    infile = open("URLlist.txt", 'r')
    outfile = open("newfile4.txt", 'w')
    lines = infile.readlines()
    for line in lines:
        line = line.strip()
        url = parse_qsl(urlparse(line)[4])
        if url:
            print url
parse_file()
4

1 回答 1

0

要获取列表中的所有 'p' 元组,只需遍历以找到匹配项。列表推导使这很容易。

urls = ( [('p', '958')],[('blog', '3')],[('p', '2512')])
p_names = [ p_tuple  for url in urls for p_tuple in url if 'p' in p_tuple ]

p_name 现在是一个包含“p”元组的列表。

于 2013-10-17T21:22:39.997 回答