WebRequest
我在 C# 中有一个问题。这是一个谷歌页面。
标题说明
text/html; charset=ISO-8859-1
该网站称
<meta http-equiv=content-type content="text/html; charset=utf-8">
最后,当我使用Encoding.Default
默认为System.Text.SBCSCodePageEncoding
现在我该怎么办?您有任何提示,这是如何发生的或我如何解决这个问题?
页面的实际编码似乎是 UTF-8。至少 FF 在 UTF-8 中正确显示它,而不是在 Windows-Whatever 中,也不是在 Latin1 中。
网址是这个
问题在于欧元符号以及所有德语变音符号。
提前感谢您对这个问题的帮助,这让我非常抓狂!
更新:当我通过输出字符串时
// create a writer and open the file
TextWriter tw = new StreamWriter("test.txt");
// write a line of text to the file
tw.WriteLine(html);
// close the stream
tw.Close();
一切正常。
所以问题似乎是,调试器没有显示正确的编码,也没有显示正则表达式。
如何告诉 C# 将 RegEx 处理为 UTF-8?