「HTTP協(xié)議其實很簡單.02」理解HTTP協(xié)議的第一行
本篇主題:理解HTTP協(xié)議的第一行
上一篇,講了講怎么去理解協(xié)議,其中的核心點就是用計算機的思維模式去思考。這一篇開始正式接觸HTTP協(xié)議的第一行。
古語講:預先善其事,必先利其器。所以在開始之前,我們需要了解一個“工具”(一個軟件的操作)。這個工具就是去看HTTP協(xié)議內容的工具,有的小伙伴可能已經想到了,是F12。下面講講工具的打開方法:
- 打開瀏覽器(chrome、360、qq隨便什么都可以)
- 按下快捷鍵F12。你應該會看到下圖:
3.下面的每一條代表的是一次HTTP請求。點擊可以查看這一次請求的具體內容。
工具準備好了,下面進入正題。
我們設想一個打電話的場景,目標是找某訊公司/研發(fā)部/XX工作室/開發(fā)小組,而我們只知道某訊公司前臺的電話(0755-00000000)。
撥通電話,問候之后,我們要告訴對方,我找研發(fā)部xx工作室開發(fā)小組,順利的情況下前臺小姐姐會把電話轉給xx工作室開發(fā)小組。
我們梳理一下整個過程中的重要信息:0755-00000000/研發(fā)部/農藥工作室/開發(fā)小組
是不是有點像:pvp.pp.com/web201605/herodetail/116.shtml
電話號碼就像一個網址的域名(pvp.pp.com),研發(fā)部/農藥工作室 就像web201605/herodetail,開發(fā)小組就像116.shtml
這些信息幫助前臺小姐姐很精準的找到我們想找的人,是這次電話場景中必不可少的內容。
同樣這也是HTTP協(xié)議中最重要的組成部分,我們來看看他們在HTTP協(xié)議中是如何體現(xiàn)的。
我們以這個網址為例來看: https://sale.vmall.com/pseries.html?cid=10618
注意打開瀏覽器后先按下F12,然后再輸入網址,會在開發(fā)人員工具里看到這樣的界面:
(注意,有很多網址看不到view source,找不到就換個別的網址)
依次點擊圖中紅框的位置,會看到下圖:
這就是http協(xié)議的第一行,這一行內容告訴服務器我需要什么。就像打電話告訴前臺小姐姐我要找誰一樣。
我們可以寫一個程序代替瀏覽器發(fā)起這一次請求。來完整的看一看一個完整的HTTP協(xié)議請求和響應的內容分別是什么。
這次實驗的地址是: www.12371yun.com/news-info.php?cid=2&id=69
下面是模擬瀏覽器的代碼:
import java.io.*;import java.net.InetsocketAddress;import java.net.Socket;import java.net.SocketAddress;public class MyChrome { public static void main(String[] args) throws IOException { String host = “www.12371yun.com”; //定義要訪問哪個服務器,就像是要撥打哪個電話 int port = 80; //定義端口,一般HTTP請求的默認商品是80 SocketAddress endpoint = new InetSocketAddress(host, port); //創(chuàng)建地址對象 // 與服務端建立連接 Socket socket = new Socket(); //Socket類是TCP/IP請求的核心類。要知道HTTP是建立的TCP/IP基礎上的。 socket.connect(endpoint,2000); //開始連接服務器,就好比開始撥打電話,參數2000是超時時間,意思是2秒中沒有影響則停止。 // 建立連接后獲得輸出流 OutputStream os = socket.getOutputStream(); //獲得輸出流,用來向服務器發(fā)送報文。告訴服務器我想干什么 //message字符串就是具體的請求報文 String message = “GET /news-info.php?cid=2&id=69 HTTP/1.1n” //第一行告訴服務器我的請求方式是GET,需要的資源是/news-info.php,cid=2&id=69是包含了兩個參數 //Host是廣告服務器我要訪問的是哪個域名,服務器上往往是運行著多個網站,每個網站可能有不同的域名。雖然在代碼的第一行里有域名, // 但是在連接的時候域名會被解析為ip地址。而作為服務器并不知道你要訪問哪一個域名。 “Host: www.12371yun.comn” “Connection: keep-aliven” “Pragma: no-cachen” “Cache-Control: no-cachen” “Upgrade-Insecure-Requests: 1n” “User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36n” “Accept: text/html,application/xhtml xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8n” “Accept-Encoding: gzip, deflaten” “Accept-Language: zh-CN,zh;q=0.9n”; System.out.println(message); os.write(message.getBytes(“UTF-8″));//將報文數據通過輸出流發(fā)送給服務器 //通過shutdownOutput高速服務器已經發(fā)送完數據,后續(xù)只能接受數據 socket.shutdownOutput();//結束輸出流,就向通話完成后告訴對方:完畢 InputStream inputStream = socket.getInputStream(); //定義輸出流,準備接收服務器返回的報文 byte[] bytes = new byte[1024]; int len; StringBuilder sb = new StringBuilder(); while ((len = inputStream.read(bytes)) != -1) { //注意指定編碼格式,發(fā)送方和接收方一定要統(tǒng)一,建議使用UTF-8 sb.append(new String(bytes, 0, len,”UTF-8”)); } System.out.println(“Response:rn================”); System.out.println(sb); inputStream.close(); os.close(); socket.close(); }}
以上代碼運行后會在服務器端輸出如下結果:
以下為請求報文:GET http://12371yun.com/news-info.php?cid=2&id=69 HTTP/1.1Host: www.12371yun.comConnection: keep-alivePragma: no-cacheCache-Control: no-cacheUpgrade-Insecure-Requests: 1User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36Accept: text/html,application/xhtml xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8Accept-Encoding: gzip, deflateAccept-Language: zh-CN,zh;q=0.9================以下為響應報文:HTTP/1.1 200 OKDate: Wed, 12 Jun 2019 05:02:48 GMTServer: Apache/2.2.21 (Win32) mod_ssl/2.2.21 OpenSSL/0.9.8t PHP/5.3.10X-Powered-By: PHP/5.3.10Keep-Alive: timeout=5, max=100Connection: Keep-AliveTransfer-Encoding: chunkedContent-Type: text/html;charset=utf-8<!DOCTYPE html><html lang=”en”><head> <meta charset=”UTF-8″ /> <meta name=”viewport” content=”width=device-width, initial-scale=1.0″ /> <meta http-equiv=”X-UA-Compatible” content=”ie=edge” /> <meta name=”renderer” content=”webkit”><title>話端陽 品傳統(tǒng),跟習近平總書記學中華文化傳承之道 – 黨建動態(tài) – 五心鴻卓,智慧黨建_專注智慧黨務,智慧黨建管理系統(tǒng)研發(fā) – 鴻卓黨建云平臺</title><meta name=”generator” content=”” /><meta name=”author” content=”” /><meta name=”keywords” content=”智慧黨建,黨建云,智慧黨建系統(tǒng),鴻卓黨建云平臺” />//以下HTML內容省略
我們可以看到請求的報文內容是
GET http://12371yun.com/news-info.php?cid=2&id=69 HTTP/1.1Host: www.12371yun.comConnection: keep-alivePragma: no-cacheCache-Control: no-cacheUpgrade-Insecure-Requests: 1User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36Accept: text/html,application/xhtml xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8Accept-Encoding: gzip, deflateAccept-Language: zh-CN,zh;q=0.9
這和瀏覽器檢測到的請求內容是一樣的:
而響應內容可以明顯看出是分成了兩部分,第一部分是:
HTTP/1.1 200 OK
Date: Wed, 12 Jun 2019 05:02:48 GMT
Server: Apache/2.2.21 (Win32) mod_ssl/2.2.21 OpenSSL/0.9.8t PHP/5.3.10
X-Powered-By: PHP/5.3.10
Keep-Alive: timeout=5, max=100
Connection: Keep-Alive
Transfer-Encoding: chunked
Content-Type: text/html;charset=utf-8
這一部分和請求的格式有些相似,一般我們稱之為報頭。
第二部分是:
<!DOCTYPE html><html lang=”en”><head> <meta charset=”UTF-8″ /> <meta name=”viewport” content=”width=device-width, initial-scale=1.0″ /> <meta http-equiv=”X-UA-Compatible” content=”ie=edge” /> <meta name=”renderer” content=”webkit”><title>話端陽 品傳統(tǒng),跟習近平總書記學中華文化傳承之道 – 黨建動態(tài) – 五心鴻卓,智慧黨建_專注智慧黨務,智慧黨建管理系統(tǒng)研發(fā) – 鴻卓黨建云平臺</title><meta name=”generator” content=”” /><meta name=”author” content=”” /><meta name=”keywords” content=”智慧黨建,黨建云,智慧黨建系統(tǒng),鴻卓黨建云平臺” />//以下HTML內容省略
第二部分的內容和實際網頁的源碼則是一模一樣的。
這就是一次HTTP請求的完整過程,與瀏覽器不同的是我們的程序最后顯示的結果是源碼,而瀏覽器收到這些響應的內容則是呈現(xiàn)出一個好看的頁面。
另外,細心的同學可能會發(fā)現(xiàn),F(xiàn)12工具中發(fā)現(xiàn)第一條請求之后會跟著發(fā)出了N多次請求,這就是瀏覽器在接收到第一個請求的響應之后,根據源碼的內容將所需要的各類資源(js,css,png,jpg等)依次下載,最終將這些內容呈現(xiàn)為完整的網頁。
看到這里我們再回到本篇文章的主題:第一行。 請求報文的第一行是:
GET http://12371yun.com/news-info.php?cid=2&id=69 HTTP/1.1
很明顯這里面包含了三部分:
第一部分
GET:表示請求的類型.
HTTP協(xié)議中共定義了八種方法或者叫“動作”來表明對Request-URI指定的資源的不同操作方式,具體介紹如下:
OPTIONS:返回服務器針對特定資源所支持的HTTP請求方法。也可以利用向Web服務器發(fā)送’*’的請求來測試服務器的功能性。
HEAD:向服務器索要與GET請求相一致的響應,只不過響應體將不會被返回。這一方法可以在不必傳輸整個響應內容的情況下,就可以獲取包含在響應消息頭中的元信息。
GET:向特定的資源發(fā)出請求。
POST:向指定資源提交數據進行處理請求(例如提交表單或者上傳文件)。數據被包含在請求體中。POST請求可能會導致新的資源的創(chuàng)建和/或已有資源的修改。
PUT:向指定資源位置上傳其最新內容。
DELETE:請求服務器刪除Request-URI所標識的資源。
TRACE:回顯服務器收到的請求,主要用于測試或診斷。
CONNECT:HTTP/1.1協(xié)議中預留給能夠將連接改為管道方式的代理服務器。
雖然HTTP的請求方式有8種,但是我們在實際應用中常用的也就是get和post,其他請求方式也都可以通過這兩種方式間接的來實現(xiàn)。
這些請求方式中GET請求的報文中是只有報頭,沒有body的。 而POST請求則是有body的。POST請求一般是用在向服務器提交一些數據的時候使用,例如:登錄、注冊帳號、填寫一些數據等等。 我們來對比一下
POST http://127.0.0.1:80/auth/login.do HTTP/1.1Host: 127.0.0.1:80Connection: keep-aliveContent-Length: 66Origin: http://127.0.0.1:80X-Requested-With: XMLHttpRequestUser-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36Content-Type: application/json;charset=UTF-8Accept: */*{“loginName”:”test”,”loginPwd”:”test”,”verifyCode”:”aujp0e”}
這一段報文在最后還有一段json格式的數據。而GET請求是沒有這最后的內容的。
第二部分
http://12371yun.com/news-info.php?cid=2&id=69
這部分表示你要請求服務器上哪個資源,可以是一個html、php、jsp、css、png等等,或者是一個目錄。
那么如果我們想要請求一個css的請需要怎么修改這個報文呢?很簡單,只需要把這一部分換成下面這樣就可以了。
GET http://www.12371yun.com/css/index.css HTTP/1.1
實際上,要完整的呈現(xiàn)出一個頁面,只有一次HTTP的請求過程是不夠的,因為一個頁面需要有基本的HTML代碼,還有樣式、js、以及很多圖片,甚至還有從其它站點引入的js代碼庫等等,這些都需要瀏覽器在得到基本的HTML代碼之后進行解析,然后依次將所有的資源請求回來之后才能完整的呈現(xiàn)。
第三部分
HTTP/1.1 這一部分表示http協(xié)議的版本
總結
這一篇文章我們用一個控制臺程序去模擬瀏覽器進行了一次請求,通過這個程序我們可以完整的看到請求和響應的報文內容。
這個程序相當于是一個瀏覽端客戶端,下一篇,我將講解如何去寫一個服務器端,然后用瀏覽器去訪問我們的服務器端,去初步了解一下服務器端是如何處理HTTP請求的。