0

这是一些代码,用于从 url 请求 html 代码。

var currentUrl = "https://www.google.com";
HttpClient client = new HttpClient();
System.Diagnostics.Process.Start(currentUrl); //here i open a browser with same URL, 
var response = await client.GetAsync(currentUrl);
string sourse = null;


if (response != null && response.StatusCode == HttpStatusCode.OK)
{
     sourse =await response.Content.ReadAsStringAsync(); // here i get the html-code
}

所以,问题是:为什么我从程序中获得的 html 代码和我之前打开几秒钟的浏览器中真实页面的 html 代码不同?这没有任何意义。

另外,这里有一些证明。第一个图像 - 浏览器 html 代码中的字符数 在此处输入图像描述

...在program-html代码中在此处输入图像描述

我给出了最简单的证据,使问题更容易。但如果我深入挖掘,html 代码不知从何而来。当我解析一个特定的页面时,它应该是 39 个产品,程序返回 html 代码,其中只有 6 个产品(顺便提一下,这 39 个产品不包括在浏览器中实际出现在页面上的 39 个产品中)。所以我就这么简单地问了这个问题。真的,我在一分钟前用这段代码做了一个新项目,但正如我上面写的那样,它工作不正确。要获取程序返回的代码,我可以在源变量中查找它或将其保留在文件中,然后进行比较。喜欢:

        FileStream fs = new FileStream("report.txt", FileMode.OpenOrCreate);
        StreamWriter SW = new StreamWriter(fs);
        SW.WriteLine(sourse);
4

0 回答 0