0

我正在使用 PHP 生成一封输出 HTML 表格的电子邮件。大部分表格都很好,但一些<and>字符被随机编码为&lt;and &gt;。它并不总是在同一个地方进行。有时它只发生在一个地方,有时根本不发生,有时在多个地方。

这是我的电子邮件客户端看到的表格中间的代码片段。&lt; /tr&gt;注意不应该存在的插入:

<tr>  
  <td>SERVER_SOFTWARE</td>
  <td>Apache/2.2.29 (Red Hat)</td>
</tr>
<tr>
  <td>SERVER_PROTOCOL</td>
  <td>HTTP/1.1</td>
  &lt; /tr&gt;
</tr>
<tr>
  <td>REQUEST_METHOD</td>
  <td>POST</td>
</tr>

以及电子邮件明文部分中的同一段:(再次注意,</tr>以某种方式插入。)

SERVER_SOFTWARE Apache/2.2.29 (Red Hat)
SERVER_PROTOCOL HTTP/1.1 < /tr>
REQUEST_METHOD POST

在发送之前,我在标头中将其设置为 UTF-8:

$headers  = "MIME-Version: 1.0\r\nContent-Type: text/html; charset=UTF-8\r\nContent-Transfer-Encoding: quoted-printable";

(PS 我之前使用 . 时遇到了完全相同的问题charset=ISO-8859-1。)

但尽管如此,它还是以某种方式显示在US-ASCII

Content-type: text/html;
    charset="US-ASCII"
Content-transfer-encoding: quoted-printable

生成电子邮件的 PHP 脚本如下所示:

//generate $table
$indicesServer = array('PHP_SELF', 'argv', 'argc', 'GATEWAY_INTERFACE', 'SERVER_ADDR', 'SERVER_NAME', 'SERVER_SOFTWARE', 'SERVER_PROTOCOL', 'REQUEST_METHOD', 'REQUEST_TIME', 'REQUEST_TIME_FLOAT', 'QUERY_STRING', 'DOCUMENT_ROOT', 'HTTP_ACCEPT', 'HTTP_ACCEPT_CHARSET', 'HTTP_ACCEPT_ENCODING', 'HTTP_ACCEPT_LANGUAGE', 'HTTP_CONNECTION', 'HTTP_HOST', 'HTTP_REFERER', 'HTTP_USER_AGENT', 'HTTPS', 'REMOTE_ADDR', 'REMOTE_HOST', 'REMOTE_PORT', 'REMOTE_USER', 'REDIRECT_REMOTE_USER', 'SCRIPT_FILENAME', 'SERVER_ADMIN', 'SERVER_PORT', 'SERVER_SIGNATURE', 'PATH_TRANSLATED', 'SCRIPT_NAME', 'REQUEST_URI', 'PHP_AUTH_DIGEST', 'PHP_AUTH_USER', 'PHP_AUTH_PW', 'AUTH_TYPE', 'PATH_INFO', 'ORIG_PATH_INFO') ;
$table = '<table cellpadding="3" cellspacing="0" border="1" bordercolor="#bbb">';
foreach ($indicesServer as $arg) {
    if (isset($_SERVER[$arg])) {
        $table .= '<tr><td>'.$arg.'</td><td>' . $_SERVER[$arg] . '</td></tr>' ;
    } else {
        $table .= '<tr><td>'.$arg.'</td><td>-</td></tr>' ;
    }
}
$table .=  '</table>' ;

//set up email
$to = [redacted];
$subject = [redacted];
$email_body = "Heres data:" . $table;
$headers  = "MIME-Version: 1.0\r\nContent-Type: text/html; charset=UTF-8\r\nContent-Transfer-Encoding: quoted-printable";

//send email
mail($to, $subject, $email_body, $headers);

编辑: 我注意到 HTML 属性变得混乱。它与quoted-printable等号的编码有关。=被编码=3D为预期,但有时下一个字符被删除!因此发生了以下情况:

<a href="http://example.com"> 变成 <a href=3D"ttp://example.com">

<table cellpadding=3 cellspacing=0 border=1> 变成 <table cellpadding<ellspacingorder=3D"&lt;tr">

4

2 回答 2

1

我的猜测是,因为这是一个不应该存在的结束“tr”(你后面还有另一个),所以一些友好的 html 解析器正在“帮助”你,从一个标签变成一些普通的字符串。

另一个想法:

见这里: https: //support.sendgrid.com/hc/en-us/articles/200182068-HTML-Formatting-Issues

  1. 某些邮件客户端(例如 Outlook 和 Thunderbird)似乎在每一行都插入了双倍间距换行符。原因是 MIME 中的 'content-transfer-encoding' 设置为 'quoted-printable',这会将回车换行 (CRLF) 换行符添加到电子邮件的源内容中,这些内容是这些邮件客户端解释的字符。要缓解此问题,请执行以下操作:

一个。如果您可以自定义电子邮件的 MIME 设置,请将“Content-Transfer-Encoding”设置为“7bit”而不是“Quoted-Printable”。

湾。确保您的内容遵循上述第 2 项的行长限制。

我想知道是否有什么东西在你的标签中放了一个换行符,导致它不可读,然后浏览器正在添加一个额外的作为替换。

您可以试试这个:将“Content-Transfer-Encoding”更改为“7bit”还是完全忽略它?

于 2015-04-29T20:47:03.667 回答
1

问题可能是由于您插入的值中有特殊的 HTML 字符。当您在 HTML 中插入随机文本,并且您不希望它被解释为 HTML 时,您应该使用htmlentitiesorhtmlspecialchars对其进行编码:

foreach ($indicesServer as $arg) {
    if (isset($_SERVER[$arg])) {
        $table .= '<tr><td>'.$arg.'</td><td>' . htmlentities($_SERVER[$arg]) . '</td></tr>' ;
    } else {
        $table .= '<tr><td>'.$arg.'</td><td>-</td></tr>' ;
    }
}

另一种可能是您的行对于邮件软件来说太长了。尝试"\n"在每个表格行的末尾添加:

$table .= '<tr><td>'.$arg.'</td><td>' . htmlentities($_SERVER[$arg]) . "</td></tr>'."\n" ;
于 2015-04-29T21:06:01.283 回答