使用 HttpWebRequest 向网站提交资料
HttpWebRequest 是 .net 基础类别库中的一个类别,在命名空间 System.Net 下面,用来使使用者通过 HTTP 协议和伺服器交互沟通。
HttpWebRequest 对 HTTP 协议进行了完整的封装,对 HTTP 协议中的 Header, Content, Cookie 都做了属性和方法的支援,很容易就能撰写出一个模拟浏览器自动登录的程式。
程式使用 HTTP 协定和伺服器交互主要是进行资料的提交,通常资料的提交是通过 GET 和 POST 两种方式来完成,下面对这两种方式进行一下说明:
1. GET 方式:
GET 方式通过在网路位址附加参数来完成资料的提交,比如在位址 http://www.google.com/webhp?hl=zh-CN 中,前面部分 http://www.google.com/webhp 表示资料提交的网址,后面部分 hl=zh-CN 表示附加的参数,其中 hl 表示一个键(key), zh-CN 表示这个键对应的值(value)。
程式码如下:
string Url = "http://www.google.com/webhp?hl=zh-CN"; HttpWebRequest req = (HttpWebRequest) HttpWebRequest.Create(Url); req.Method = "GET"; using (WebResponse wr = req.GetResponse()) { //在这里对接收到的页面内容进行处理
}
2. POST 方式:
POST 方式通过在页面内容中填写参数的方法来完成资料的提交,参数的格式和 GET 方式一样,是类似于 hl=zh-CN&newwindow=1 这样的结构。
程式码如下:
string Url="http://www.google.com/intl/zh-CN/"; string param = "hl=zh-CN&newwindow=1"; byte[] bs = Encoding.ASCII.GetBytes(param); HttpWebRequest req = (HttpWebRequest) HttpWebRequest.Create(Url); req.Method = "POST"; req.ContentType = "application/x-www-form-urlencoded"; req.ContentLength = bs.Length; using (Stream reqStream = req.GetRequestStream()) { reqStream.Write(bs, 0, bs.Length); } using (WebResponse wr = req.GetResponse()) { //在这里对接收到的页面内容进行处理 }
在上面的代码中,我们访问了 http://www.google.com 的网址,分别以 GET 和 POST 方式提交了资料,并接收了返回的页面内容。然而,如果提交的参数中含有中文,那么这样的处理是不够的,需要对其进行编码,让对方网站能够识别。
3. 使用 GET 方式提交中文资料:
GET 方式通过在网路位址中附加参数来完成资料提交,对于中文的编码,常用的有 gb2312 和 utf8 两种,用 gb2312 方式编码访问的程式码如下:
Encoding myEncoding = Encoding.GetEncoding("gb2312"); string address = "http://www.baidu.com/s?" + HttpUtility.UrlEncode("参数一", myEncoding) + "=" + HttpUtility.UrlEncode("值一", myEncoding); HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create(address); req.Method = "GET"; using (WebResponse wr = req.GetResponse()) { //在这里对接收到的页面内容进行处理 }
在上面的程式码中,我们以 GET 方式访问了网址 http://www.baidu.com/s ,传递了参数“参数一=值一”,由于无法告知对方提交资料的编码类型,所以编码方式要以对方的网站为标准。常见的网站中, www.baidu.com (百度)的编码方式是 gb2312, www.google.com(谷歌)的编码方式是 utf8。
4. 使用 POST 方式提交中文资料:
POST 方式通过在页面内容中填写参数的方法来完成资料的提交,由于提交的参数中可以说明使用的编码方式,所以理论上能获得更大的相容性。用 gb2312 方式编码访问的程式码如下:
Encoding myEncoding = Encoding.GetEncoding("gb2312"); string param = HttpUtility.UrlEncode("参数一", myEncoding) + "=" + HttpUtility.UrlEncode("值一", myEncoding) + "&" + HttpUtility.UrlEncode("参数二", myEncoding) + "=" + HttpUtility.UrlEncode("值二", myEncoding); byte[] postBytes = Encoding.ASCII.GetBytes(param); HttpWebRequest req = (HttpWebRequest) HttpWebRequest.Create( "http://www.baidu.com/s" ); req.Method = "POST"; req.ContentType = "application/x-www-form-urlencoded;charset=gb2312"; req.ContentLength = postBytes.Length; using (Stream reqStream = req.GetRequestStream()) { reqStream.Write(bs, 0, bs.Length); } using (WebResponse wr = req.GetResponse()) { //在这里对接收到的页面内容进行处理 }
从上面的代码可以看出, POST 中文资料的时候,先使用 UrlEncode 方法将中文字元转换为编码后的 ASCII 码,然后提交到伺服器,提交的时候可以说明编码的方式,用来使对方伺服器能够正确的解析。
以上列出了用户端程式使用 HTTP 协定与伺服器交互的情况,常用的是 GET 和 POST 方式。现在流行的 WebService 也是通过 HTTP 协议来交互的,使用的是 POST 方法。与以上稍有所不同的是, WebService 提交的资料内容和接收到的资料内容都是使用了 XML 方式编码。所以, HttpWebRequest 也可以使用在调用 WebService 的情况下。
原文:http://www.cnblogs.com/webman/archive/2006/11/17/564106.html