Tcpflow 输出一堆文件,其中许多是来自 Web 服务器的 HTTP 响应。在内部,它们包含 HTTP 标头,包括 Content-type: 和其他重要的标头。我正在尝试编写一个脚本,该脚本可以仅提取有效负载数据(即图像/jpeg;文本/html;等)并将其保存到文件中[可选:具有适当的名称和文件扩展名]。
EOL 字符是 \r\n (CRLF),因此这使得它难以在 GNU 发行版中使用(根据我的经验)。
我一直在尝试以下方式:
sed /HTTP/,/^$/d
删除从 HTTP (incl) 开头到 \r\n\r\n (incl) 结尾的所有文本,但我没有找到运气。我正在寻求任何在sed
和/或方面有良好经验的人的帮助awk
。我对 Perl 的经验为零,我更愿意为此使用通用的 GNU 命令行实用程序
在此处查找示例 tcpflow 输出文件。(坏链接)
谢谢,
费利佩