WinSock编程基础
? ?在上一篇中,我們具體介紹了socket的相關(guān)概念,本節(jié)將概述套接字規(guī)范及操作的一些基礎(chǔ)性知識(shí)。
?
一.套接字的一些基礎(chǔ)知識(shí)
1.Windows通信相關(guān)驅(qū)動(dòng)
netio.sys(Network I/O Subsystem)
ndis.sys(NDIS Driver)
ipnat.sys(IP Network Address Translator)
tcpip.sys(TCP/IP Driver)
tdtcp.sys(TCP Transport Driver)
tdi.sys(TDI wrapper)
afd.sys(Ancillary Function Driver for Winsock)
http.sys(HTTP Protocol Stack)
……
2.socket描述符(套接字句柄)
“在UNIX系統(tǒng)中,任何東西都是一個(gè)文件。”這句話描述了這樣一個(gè)事實(shí):在UNIX系統(tǒng)中,任何對(duì)I/O的操作,都是通過(guò)讀或?qū)懸粋€(gè)文件描述符(File DescriptorFile了到對(duì)方發(fā)送的數(shù)據(jù)Port+Length+Checksum)來(lái)實(shí)現(xiàn)的。
一個(gè)文件描述符(FD)只是一個(gè)簡(jiǎn)單的整形數(shù)值,代表一個(gè)被打開(kāi)的文件(這里的文件是廣義的文件,并不只是代表不同的磁盤(pán)文件,它可以代表一個(gè)網(wǎng)絡(luò)上的連接,一個(gè)先進(jìn)先出的隊(duì)列,一個(gè)終端顯示屏等)。
既然在UNIX系統(tǒng)中任何東西都是一個(gè)文件,通過(guò)Internet和另外一臺(tái)機(jī)器進(jìn)行通訊也是基于文件描述符來(lái)實(shí)現(xiàn)的。這個(gè)文件描述符即套接字內(nèi)核對(duì)象:intsockfd。在早期的UNIX/Linux系統(tǒng)中,可調(diào)用read()和write()直接對(duì)套接字進(jìn)行類似文件的讀寫(xiě)操作,盡管調(diào)用recv()和send()顯得更為專業(yè)。
在Windoze系統(tǒng)中,內(nèi)核對(duì)象往往交由一個(gè)句柄與外部交互,如文件句柄。在很多WinSock場(chǎng)合我們習(xí)慣使用“套接字句柄”這一稱呼:typedefu_intSOCKET。實(shí)際上,WinSock中對(duì)于套接字的操作,很多也沿襲了文件操作的規(guī)范。例如,在Winsock 1中,應(yīng)用程序可以針對(duì)套接字句柄調(diào)用ReadFile()和WriteFile(),同時(shí)指定重疊結(jié)構(gòu)以利用重疊I/O模型,到Winsock 2中才正式替換為WSARecv()和WSASend(),以專用于套接字操作。
3.Windows Sockets規(guī)范
Sockets本來(lái)是UNIX操作系統(tǒng)下流行的一種網(wǎng)絡(luò)編程接口(API),它是1983年在Berkeley(加州大學(xué)伯克利分校)4.2 BSD操作系統(tǒng)中被首先引入的,因此被稱為“Berkeley Socket API”。
Windows Sockets是在Windows環(huán)境下使用的一套網(wǎng)絡(luò)編程規(guī)范,常常簡(jiǎn)稱為WinSock。在Winsock規(guī)范中把Winsock API函數(shù)集分為與BSD Socket(用在UNIX中)相兼容的基本函數(shù)、網(wǎng)絡(luò)數(shù)據(jù)信息檢索函數(shù)和Windows專用擴(kuò)展函數(shù)三類。
Windows Socket 1規(guī)范的核心內(nèi)容是符合Berkeley Socket風(fēng)格的庫(kù)函數(shù),例如可以編寫(xiě)基于select模型的的socket跨平臺(tái)庫(kù)。select模型可以很好地實(shí)現(xiàn)跨平臺(tái),但對(duì)具體操作系統(tǒng)平臺(tái)而言,并非性能最佳的I/O模型。為了使程序員能充分利用Windows消息驅(qū)動(dòng)機(jī)制進(jìn)行編程,又定義開(kāi)發(fā)了一組針對(duì)Windows的擴(kuò)展庫(kù)函數(shù),這就是Windows Socket 2規(guī)范。Winsock 2.x提供了基于Windows消息機(jī)制的WSAAsyncSelcet異步I/O網(wǎng)絡(luò)事件通知模型,除此之外WinSock 2.x還提供了基于事件通知的異步I/O網(wǎng)絡(luò)事件通知的WSAEventSelect模型和高效的重疊I/O模型。具體平臺(tái)實(shí)現(xiàn)了各自高效的網(wǎng)絡(luò)I/O管理模型,例如Windoze的IOCP模型、Linux的epoll模型,它們用來(lái)實(shí)現(xiàn)大規(guī)模高并發(fā)的通信應(yīng)用程序。
目前常用的Winsock有兩個(gè)版本:一個(gè)是16位的Winsock 1.1,由動(dòng)態(tài)鏈接庫(kù)WINSOCK.DLL提供支持;另一個(gè)是32位的Winsock 2.2,由動(dòng)態(tài)鏈接庫(kù)WSOCK32.DLL提供支持。
從Win98/NT4開(kāi)始,Windows支持WinSock 2,而WinSock 1成為WinSock 2的功能子集。在32位系統(tǒng)下,16位的WINSOCK.DLL(Windows Socket 16-bit DLL)為Non-resident。
ws2_32.dll和mswsock.dll是WinSock 2真正的實(shí)現(xiàn)者。wsock32.dll只是映射了ws2_32.Dll和mswsock.dll兩個(gè)文件的一些函數(shù)調(diào)用,并無(wú)具體實(shí)現(xiàn)。使用Dependency Walker可以看到wsock32.dll和mswsock.dll都依賴ws2_32.dll。
mswsock.dll提供了微軟特有的WSA擴(kuò)展,包括AcceptEx/GetAcceptExSockaddrs、ConnectEx/DisconnectEx、TransmitPackets/TransmitFile、WSARecvMsg。其中僅有AcceptEx/GetAcceptExSockaddrs和TransmitFile這三個(gè)函數(shù)真正從mswsock.dll導(dǎo)出。
如果要求編寫(xiě)符合Berkeley Socket API標(biāo)準(zhǔn)的程序,則只需要加載wsock32.dll使用WinSock 1.x規(guī)范(BSD Socket API for Wndows)就可以了。如果要結(jié)合Windows平臺(tái)特性編寫(xiě)WinSock 2.x的程序,則可加載ws2_32.dll和mswsock.dll調(diào)用WSA系列(擴(kuò)展)函數(shù)。加載WinSock庫(kù)是通過(guò)WSAStartup()來(lái)指定的。
(1)加載WinSock 1.1
/* WINSOCK.H--definitions to be used with the WINSOCK.DLL
* Copyright (c) Microsoft Corporation. All rights reserved.
*
* This header file corresponds to version 1.1 of the Windows Sockets specification.
*
* (1)Basic system type definitions, taken from the BSD file sys/types.h.
* (2)Structure used in select() call, taken from the BSD file sys/time.h.
* (3)Commands for ioctlsocket(),?taken from the BSD file fcntl.h.
* (4)Structures returned by network data base library, taken from the BSD file netdb.h.
* (5)Constants and structures defined by the internet system, Per RFC 790, September 1981, taken from the BSD file netinet/in.h.
* (6)Definitions related to sockets: types, address families, options, taken from the BSD file sys/socket.h.
*
* (7)Microsoft Windows Extension function prototypes:WSA開(kāi)頭的WSAStartup、WSACleanup等Windows Sockets API。
* (8)Microsoft Windows Extended data types:typedef了SOCKADDR、SOCKADDR_IN等宏。
*/
#include?<WinSock.h>
#pragma?comment(lib,"WSock32.Lib")
LoadLibrary("C://WINDOWS//system32/wsock32.dll");// Windows Socket 32-Bit DLL
Windows Mobile下對(duì)應(yīng)winsock.h/winsock.lib/winsock.dll。
(2)加載WinSock 2.2
/* Winsock2.h -- definitions to be used with the WinSock 2 DLL and
*??????????????WinSock 2 applications.
*
* This header file corresponds to version 2.2.x of the WinSock API
* specification.
*
* #define _WINSOCKAPI_??// Prevent inclusion of winsock.h in windows.h
*/
#include?<WinSock2.h>
#pragma?comment(lib,"WS2_32.lib")
LoadLibrary("C://WINDOWS//system32//ws2_32.dll");// Windows Socket 2.0 32-Bit DLL
Windows Mobile下對(duì)應(yīng)winsock2.h/ws2.lib/ws2.dll。
(3)加載Microsoft Windows-Specific Extension Functions
/*++
Module Name:
mswsock.h
Abstract:
This module contains the Microsoft-specific extensions to the Windows Sockets API.
--*/
#include?<Mswsock.h>
#pragma?comment(lib,"MsWSock.Lib")
LoadLibrary("C://WINDOWS//system32//mswsock.dll");// Microsoft Windows Socket 2.0 Service Provider
?
二.套接字通信基礎(chǔ)
???至此,我還不打算直接進(jìn)入套接字的一些諸如recv()和send()操作。在正式使用套接字進(jìn)行通信編程之前,有必要先了解一下通信所涉及到地址識(shí)別、字節(jié)順序等知識(shí)點(diǎn)。
1.套接字地址(sockaddr)、TCP/IP套接字地址(sockaddr_in)和IP地址in_addr
1.1 struct?sockaddr
struct?sockaddr結(jié)構(gòu)用來(lái)存儲(chǔ)套接字地址。
/*
?* Structure used by kernel to store most addresses.
?*/
struct?sockaddr?{
???????u_short?sa_family;/* address family,AF_X */
???????char???sa_data[14];/* up to 14 bytes of direct address */
};
sa_data包含了一些遠(yuǎn)程電腦的地址、端口和套接字的數(shù)目,它里面的數(shù)據(jù)是雜溶在一起的。sa_data域的定義有些不確定性,注釋暗示內(nèi)容可能超過(guò)14個(gè)字節(jié)。這種不確定性是經(jīng)過(guò)深思熟慮的。套接字是個(gè)非常強(qiáng)大的接口。多數(shù)人可能認(rèn)為比Internet接口強(qiáng)不到哪里——大多數(shù)應(yīng)用現(xiàn)在很可能都用它——套接字可被用于幾乎任何種類的進(jìn)程間通信,Internet(更精確的說(shuō)是IP)只是其支持的協(xié)議簇中的一種。
#define?SOCK_MAXADDRLEN?255????/*可能的最長(zhǎng)的地址長(zhǎng)度?*/
socket層涉及到地址的API都是用sockaddr結(jié)構(gòu),這些API包括bind(服務(wù)器綁定本地地址+端口)、connect(連接服務(wù)器)/accept(接受客戶端)、recvfrom/sendto。
int?bind(int?sockfd, struct?sockaddr?*my_addr,int?addrlen);
int?accept(int?sockfd, struct?sockaddr?*addr,int*?addrlen);
int?connect(int?sockfd, const struct?sockaddr?*serv_addr,int?addrlen);
1.2 struct?sockaddr_in
Sockets API提供了struct?sockaddr的TCP/IP版本——struct?sockaddr_in,其中in代表“internet”,故sockaddr_in.sa_family=AF_INET。
/*
?* Socket address, internet style.
?*/
struct?sockaddr_in?{
???????short?sin_family;/* internet address family */
???????u_short?sin_port;/* port number */
???????struct?in_addr?sin_addr;/* internet address */
???????char?sin_zero[8];/* padding bits */
};
這個(gè)結(jié)構(gòu)提供了方便的手段來(lái)訪問(wèn)socket address(structsockaddr)結(jié)構(gòu)中的每一個(gè)元素。注意sin_zero[8]是為了使sockaddr和sockaddr_in結(jié)構(gòu)具有相同的尺寸,使用sockaddr_in的時(shí)候要把sin_zero全部設(shè)為零(使用memset函數(shù))。
1.3 struct?in_addr
???in_addr為IP地址,在IPv4中使用32位無(wú)符號(hào)整數(shù)。
/*
?* Internet address (WINSOCK.H)
?*/
struct?in_addr?{
???????union {
???????????????struct {u_char?s_b1,s_b2,s_b3,s_b4; }?S_un_b;
???????????????struct {u_short?s_w1,s_w2; }?S_un_w;
???????????????u_long?S_addr;
???????}S_un;
#define?s_addr?S_un.S_addr/* can be used for most tcp & ip code */
#define?s_host?S_un.S_un_b.s_b2/* host on imp */
#define?s_net??S_un.S_un_b.s_b1/* network */
#define?s_imp??S_un.S_un_w.s_w2/* imp */
#define?s_impno?S_un.S_un_b.s_b4/* imp # */
#define?s_lh???S_un.S_un_b.s_b3/* logical host */
};
???WinSock對(duì)sockaddr、sockaddr_in和in_addr進(jìn)行了typedef。
???/* Microsoft Windows Extended data types */
typedef struct?sockaddr?SOCKADDR, *PSOCKADDR,FAR?*LPSOCKADDR;
typedef struct?sockaddr_in?SOCKADDR_IN, *PSOCKADDR_IN,FAR?*LPSOCKADDR_IN;
typedef struct?in_addr?IN_ADDR,*PIN_ADDR,FAR?*LPIN_ADDR;
2.字節(jié)順序
字節(jié)順序是多字節(jié)數(shù)據(jù)被存儲(chǔ)的順序。例如,一個(gè)32位的長(zhǎng)整型0x12345678跨越4個(gè)字節(jié)(每個(gè)字節(jié)8位)。Intel x86機(jī)器使用小尾順序(little-endian),意思是最不重要的字節(jié)首先存儲(chǔ)。因此,數(shù)據(jù)0x12345678在內(nèi)存中以{0x78、0x56、0x34、0x12}順序存放。大多數(shù)不使用小尾順序的機(jī)器使用大尾順序(big-endian),即最重要的字節(jié)首先存儲(chǔ)。同樣的值在內(nèi)存中以{0x12、0x34、0x56、0x78}順序存放。
因?yàn)閰f(xié)議數(shù)據(jù)要在這些機(jī)器間傳輸,就必須選定其中的一種方式做為標(biāo)準(zhǔn),否則會(huì)引起混淆。TCP/IP協(xié)議統(tǒng)一規(guī)定使用大尾方式傳輸數(shù)據(jù),也稱為網(wǎng)絡(luò)字節(jié)順序(network byte order)。例如,端口號(hào)(它是一個(gè)16位的數(shù)字)12345(0x3039)的存儲(chǔ)順序是{0x30、0x39}。
上述sockaddr和sockaddr_in結(jié)構(gòu)中,除了?sin_family成員(它不是協(xié)議的一部分)外,其他所有值必須以網(wǎng)絡(luò)字節(jié)順序存儲(chǔ)。Sockets API提供了一些函數(shù),來(lái)對(duì)內(nèi)部字節(jié)順序與網(wǎng)絡(luò)字節(jié)順序不同的情況進(jìn)行字節(jié)順序轉(zhuǎn)換處理。
字節(jié)順序轉(zhuǎn)換函數(shù)主要有htonl()/ntohl()和htons()/ntohs()。
u_long?htonl?(u_long?hostlong);?/* Host to Network Long */
u_long?ntohl?(u_long?netlong);?/* Network to Host Long */
u_short?htons?(u_short?hostshort);?/* Host to Network Short */
u_short?ntohs?(u_short?netshort);?/* Network to Host Short */
3.IP地址
in_addr把IP地址作為一個(gè)4字節(jié)的無(wú)符號(hào)長(zhǎng)整型量存儲(chǔ)起來(lái)。IP地址習(xí)慣用點(diǎn)分十進(jìn)制(dotted address)字符串來(lái)表示,字符串中由點(diǎn)分開(kāi)的?4個(gè)域是以字符串的形式對(duì)in_addr結(jié)構(gòu)中的?4個(gè)?u_char值的描述。由于每個(gè)字節(jié)的數(shù)值范圍是?0~255,所以各域的值是不可以超過(guò)?255的。
3.1網(wǎng)址歸類
???IPv4地址被分為幾個(gè)種類,分別描述地址被分配到網(wǎng)絡(luò)的部分和端點(diǎn)的部分,見(jiàn)下表。網(wǎng)絡(luò)號(hào)和主機(jī)號(hào)通過(guò)子網(wǎng)掩碼區(qū)分,例如C類地址的子網(wǎng)掩碼為“255.255.255.0”,若IP地址為“192.168.89.125/24”,則網(wǎng)段號(hào)為“192.168.89”,主機(jī)號(hào)為“125”。?
?
???Winsock中定義了一系列對(duì)IP地址進(jìn)行歸類的宏,包括判斷地址類型的IN_CLASS*,子網(wǎng)掩碼IN_CLASS*_NET,端點(diǎn)數(shù)量IN_CLASS*_HOST及其位數(shù)IN_CLASSA_NSHIFT。
#define?IN_CLASSA(i)???????????(((long)(i) & 0x80000000) == 0)
#define?IN_CLASSA_NET??????????0xff000000
#define?IN_CLASSA_NSHIFT???????24
#define?IN_CLASSA_HOST?????????0x00ffffff
#define?IN_CLASSA_MAX??????????128
?
#define?IN_CLASSB(i)???????????(((long)(i) & 0xc0000000) == 0x80000000)
#define?IN_CLASSB_NET??????????0xffff0000
#define?IN_CLASSB_NSHIFT???????16
#define?IN_CLASSB_HOST?????????0x0000ffff
#define?IN_CLASSB_MAX??????????65536
?
#define?IN_CLASSC(i)???????????(((long)(i) & 0xe0000000) == 0xc0000000)
#define?IN_CLASSC_NET??????????0xffffff00
#define?IN_CLASSC_NSHIFT???????8
#define?IN_CLASSC_HOST?????????0x000000ff
3.2特殊的網(wǎng)絡(luò)地址
#define?INADDR_ANY?????????????(u_long)0x00000000
#define?INADDR_BROADCAST??????(u_long)0xffffffff
#define?INADDR_NONE????????????0xffffffff
???其中INADDR_NONE往往用在排錯(cuò)上,INADDR_ANY往往代表任意有效地址(一個(gè)主機(jī)可能分配到多個(gè)IP地址),INADDR_BROADCAST為子網(wǎng)廣播地址。
3.3網(wǎng)址轉(zhuǎn)換函數(shù)
inet_addr函數(shù)將一個(gè)由小數(shù)點(diǎn)分隔的十進(jìn)制?IP地址字符串轉(zhuǎn)化成由?32位二進(jìn)制數(shù)表示的?IP地址(網(wǎng)絡(luò)字節(jié)順序)。
unsigned long?inet_addr(const char *cp);
以下代碼為在little endian的Windows下,定義遠(yuǎn)程主機(jī)220.181.6.18:80。
???//定義TCP/IP地址:220.181.6.18:80
???sockaddr_in?remoteSockAddr;
???remoteSockAddr.sin_family?=?AF_INET;
???remoteSockAddr.sin_addr.S_un.S_addr?=?inet_addr("220.181.6.18");
???remoteSockAddr.sin_port?=?htons(80);
???其聯(lián)合中的四個(gè)S_un_b的四個(gè)u_char值依次為220,181,6,18。
???remoteSockAddr.sin_addr.S_un.S_un_b.s_b1?= 220;?// 0xdc
???remoteSockAddr.sin_addr.S_un.S_un_b.s_b2?= 181;?// 0xb5
???remoteSockAddr.sin_addr.S_un.S_un_b.s_b3?= 6;????// 0x06
???remoteSockAddr..sin_addr.S_un.S_un_b.s_b4?= 18;?// 0x12
在Windows中,該IP整形值解析為0x1206b5dc。
inet_ntoa函數(shù)是?inet_addr函數(shù)的逆函數(shù),它將一個(gè)網(wǎng)絡(luò)字節(jié)順序的32位IP地址轉(zhuǎn)化成字符串。
char*?inet_ntoa(struct?in_addrin);
注意inet_ntoa的參數(shù)為in_addr結(jié)構(gòu),而非無(wú)符號(hào)長(zhǎng)整數(shù)!
//?翻譯IP地址:0x1206b5dc
???struct in_addr?inAddr;
???inAddr.s_addr?= 0x1206b5dc;
???char *szIP?=inet_ntoa(inAddr);
???printf("ip = %s/n",szIP);?// "220.181.6.18"
?
三.套接字API概覽
???以下介紹WinSock 1.x即符合Berkely Socket API標(biāo)準(zhǔn)的基本socket操作接口,不包括具體操作系統(tǒng)的擴(kuò)展API和I/O通信模型。
1.Winsock庫(kù)的加載和卸載
要使用Windows Socket API進(jìn)行編程,首先必須調(diào)用WSAStartup()函數(shù)初始化Winsock動(dòng)態(tài)庫(kù)。
int?WSAStartup(WORD?wVersionRequested,LPWSADATA?lpWSAData);
參數(shù)一wVersionRequested為我們要求初始化的Winsock版本號(hào),參數(shù)二lpWSAData為實(shí)際初始化成功的WSA(Windows Socket API)版本信息。
在程序末尾,需調(diào)用intWSACleanup(void)函數(shù)卸載Winsock動(dòng)態(tài)庫(kù)。
2.套接字的創(chuàng)建和釋放
(1)套接字的創(chuàng)建
要使用套接字,首先必須調(diào)用socket()函數(shù)創(chuàng)建一個(gè)套接字描述符,就如同操作文件時(shí),首先得調(diào)用fopen()函數(shù)打開(kāi)一個(gè)文件。
// The socket function creates a socket that is bound to a specific service provider.
SOCKET?socket(int?af,// [in] Address family specification.
???????????int?type,// [in] Type specification for the new socket.
???????????int?protocol// [in] Protocol to be used with the socket that is specific to the indicated address family.
???????????);
我們往往編寫(xiě)的是基于IP協(xié)議的通信程序,故af一般取AF_INET,type可以取SOCK_RAW、SOCK_STREAM、SOCK_DGRAM。SOCK_RAW表示要?jiǎng)?chuàng)建的是原始套接字,可以進(jìn)行紅外套接字編程、基于網(wǎng)絡(luò)層的編程(例如基于ICMP協(xié)議的traceroute和ping程序,直接構(gòu)建IP數(shù)據(jù)報(bào)的網(wǎng)絡(luò)程序);SOCK_STREAM表示要?jiǎng)?chuàng)建的是面向流的套接字,例如基于TCP協(xié)議編程;SOCK_DGRAM則指明創(chuàng)建面向離散消息的數(shù)據(jù)報(bào)套接字,例如基于UDP協(xié)議編程。Linux原始套接字甚至提供了鏈路套接字的支持,而WinSock原始套接字則只支持到網(wǎng)絡(luò)層,若想在Windoze下直接獲取鏈路層數(shù)據(jù)包,則需要在NDIS級(jí)別進(jìn)行編程或借助提供了底層網(wǎng)絡(luò)訪問(wèn)支持的第三方庫(kù)winpcap。
通常有af=AF_INET,若type=SOCK_STREAM則protocol參數(shù)內(nèi)定為IPPROTO_TCP(6);若type=SOCK_DGRAM則protocol參數(shù)內(nèi)定為IPPROTO_UDP(17)。若type=SOCK_RAW,若protocol=IPPROTO_RAW則這個(gè)socket只能用來(lái)發(fā)送IP包,而不能接收任何的數(shù)據(jù),發(fā)送的數(shù)據(jù)需要自己填充IP包頭,并且自己計(jì)算校驗(yàn)和;若protocol=IPPROTO_IP則這個(gè)socket用于接收IP數(shù)據(jù)包,其中的校驗(yàn)和和協(xié)議分析由程序自己完成。
SOCKET?RawSocket?=?socket(AF_INET,SOCK_RAW,IPPROTO_RAW);
SOCKET?IpSocket?=?socket(AF_INET,SOCK_RAW,IPPROTO_IP);
SOCKET?UdpSocket?=?socket(AF_INET,SOCK_DGRAM,IPPROTO_UDP);
SOCKET?TcpSocket?=?socket(AF_INET,SOCK_STREAM,IPPROTO_TCP);
(2)套接字的釋放
當(dāng)不使用socket()創(chuàng)建的套接字時(shí),應(yīng)該調(diào)用closesocket()函數(shù)將它關(guān)閉,就如同調(diào)用fclose()函數(shù)關(guān)閉一個(gè)文件。它主要完成套接字資源的釋放。
// The closesocket function closes an existing socket.
int?closesocket(
?????????????SOCKET?s// [in] Descriptor identifying the socket to close.
);
???當(dāng)一個(gè)套接字上仍存在掛起的I/O時(shí),如何優(yōu)雅地關(guān)閉一個(gè)套接字便至關(guān)重要,此話題留待后續(xù)探討。
3.綁定套接字到指定的IP地址和端口號(hào)
對(duì)于傳輸套接字,在執(zhí)行收發(fā)數(shù)據(jù)前需要對(duì)本地端口進(jìn)行綁定,這是因?yàn)閭鬏攲有枰褂枚丝趤?lái)區(qū)分具體的通信端點(diǎn)(endpoint)。
// The bind function associates a local address with a socket.
int?bind(
???????SOCKET?s,// [in] Descriptor identifying an unbound socket.
???????const struct sockaddr?FAR?*name,// [in] Address to assign to the socket from the SOCKADDR structure.
???????int?namelen// [in] Length of the value in the name parameter.????????????????????????
???????);
bind()函數(shù)用在套接字連接建立之前,它的作用是綁定面向連接(connection oriented)的或者面向無(wú)連接(transaction oriented)的套接字。當(dāng)一個(gè)套接字被socket函數(shù)創(chuàng)建以后,它存在于指定的地址家族里,但是它是匿名的。bind()函數(shù)通過(guò)安排一個(gè)本地名稱到未命名的socket建立此socket的本地關(guān)聯(lián)。本地名稱包含3個(gè)部分:主機(jī)地址、協(xié)議號(hào)(TCP或UDP)和端口號(hào)。
通常服務(wù)器綁定本地地址時(shí),不寫(xiě)死具體的IP(因?yàn)镮P是軟件配置的),而是使用INADDR_ANY,綁定到本地任意地址。何謂“任意地址”呢,考慮多網(wǎng)卡多IP的情況,我們希望服務(wù)器應(yīng)用程序在指定端口監(jiān)聽(tīng)客戶連接,而不管客戶數(shù)據(jù)是通過(guò)哪個(gè)網(wǎng)卡進(jìn)來(lái)的。這是因?yàn)門(mén)CP層面,往往使用端口是區(qū)分不同的應(yīng)用程序。
如果想接收到的本機(jī)的所有TCP/UDP包(不指定綁定的端口),則最好直接使用原始套接字使用IP層的協(xié)議,例如sniffer程序。對(duì)于基于傳輸層的普通網(wǎng)絡(luò)程序設(shè)計(jì),一般都要綁定端口。
When using a connection-oriented protocol, the sockets must be connected before callingrecv. When using a connectionless protocol, the sockets must be bound before callingrecv.—MSDN
TCP/UDP?套接字執(zhí)行send()/sendto()時(shí)若沒(méi)有執(zhí)行本地端口綁定,系統(tǒng)會(huì)自動(dòng)調(diào)用綁定,這時(shí)可以在該套接字上執(zhí)行recv()/recvfrom()。在未綁定也未調(diào)用send()/sendto()先發(fā)探路的情況下,執(zhí)行recv()/recvfrom()將返回錯(cuò)誤SOCKET_ERROR(WSAGetLastError()=WSAEINVAL),因?yàn)樯形粗付▊鬏斀邮斩丝凇?/p>
綁定往往具有獨(dú)占性,某個(gè)套接字已經(jīng)綁定到本機(jī)IP地址及端口上時(shí),另一個(gè)bind()調(diào)用試圖再次綁定另一個(gè)套接字到該sockaddr的行為將以WSAEADDRINUSE錯(cuò)誤告終。要想實(shí)現(xiàn)對(duì)某個(gè)地址的復(fù)用,可在SOL_SOCKET級(jí)別調(diào)用setsockopt()函數(shù)設(shè)置SO_REUSEADDR/SO_EXCLUSIVEADDRUSE選項(xiàng)。
4.TCP服務(wù)器設(shè)置套接字進(jìn)入監(jiān)聽(tīng)狀態(tài)
// The listen function places a socket a state where it is listening for an incoming connection.
int?listen(
????????SOCKET?s,// [in] Descriptor identifying a bound, unconnected socket.
????????int?backlog// [in] Maximum length of the queue of pending connections.
????????);
服務(wù)器為了接受連接,首先使用socket()函數(shù)創(chuàng)建一個(gè)套接字,然后使用bind()函數(shù)將它綁定到一個(gè)本地地址,再用listen()函數(shù)為到達(dá)的連接指定一個(gè)backlog。
因?yàn)榉?wù)器是伺服系統(tǒng)(servo),它是服務(wù)的提供者,故一般必須顯式地聲明在哪個(gè)端口(即周知端口)上接受客戶的連接。例如HTTP服務(wù)器通常在80端口偵聽(tīng)客戶的HTTP請(qǐng)求。在一個(gè)隨機(jī)端口上監(jiān)聽(tīng)顯然很荒謬,故服務(wù)器在監(jiān)聽(tīng)之前往往必須調(diào)用bind()函數(shù)。即使是在無(wú)連接的UDP通信中,準(zhǔn)備接收方也需要調(diào)用bind()函數(shù)。
listen()僅應(yīng)用在支持連接的套接字上,如SOCK_STREAM類型。函數(shù)成功執(zhí)行之后,套接字s進(jìn)入了被動(dòng)模式(passive),到來(lái)的連接會(huì)被通知,排隊(duì)等候接受處理。這里著重要提醒的是,傳入listen()的套接字是專門(mén)用于接受連接的監(jiān)聽(tīng)套接字,注意區(qū)分會(huì)話套接字。
backlog參數(shù)指定了正在等待連接的最大隊(duì)列長(zhǎng)度。這個(gè)參數(shù)非常重要,因?yàn)橥耆赡芡瑫r(shí)出現(xiàn)幾個(gè)服務(wù)器連接請(qǐng)求。例如,假定backlog參數(shù)為2。如果三個(gè)客戶機(jī)同時(shí)發(fā)出請(qǐng)求,那么頭兩個(gè)會(huì)被放在一個(gè)“待決”(等待處理)隊(duì)列中,以便應(yīng)用程序依次為它們提供服務(wù)。而第三個(gè)連接會(huì)造成一個(gè)WSAECONNREFUSED錯(cuò)誤。注意,一旦服務(wù)器接受了一個(gè)連接,那個(gè)連接請(qǐng)求就會(huì)從隊(duì)列中刪去,以便別人可繼續(xù)發(fā)出請(qǐng)求。
backlog參數(shù)其實(shí)本身就存在著限制,這個(gè)限制是由基層的協(xié)議提供者決定的。如果出現(xiàn)非法值,那么會(huì)用與之最接近的一個(gè)合法值來(lái)取代。一般取SOMAXCONN(5)。
5.客戶端主動(dòng)連接
// The connect function establishes a connection to a specified socket.
int?connect(
??????????SOCKET?s,// [in] Descriptor identifying an unconnected socket.
??????????const struct sockaddr?FAR?*name,// [in] Name of the socket to which the connection should be established.
??????????int?namelen// [in] Length of name.
?????????);
客戶端是連接的發(fā)起者(initiate),它通過(guò)調(diào)用connect()函數(shù)主動(dòng)(active)連接服務(wù)器。參數(shù)二填寫(xiě)欲連接的目標(biāo)服務(wù)器的地址。如果連接的計(jì)算機(jī)并沒(méi)有在指定端口上監(jiān)聽(tīng),則connect()調(diào)用返回SOCKET_ERROR,WSAGetLastError()=WSAECONNREFUSED,另一種錯(cuò)誤是WSAETIMEOUT,例如由于路由或網(wǎng)絡(luò)故障,客戶端遲遲接受不到服務(wù)器回饋的[SYN,ACK]信號(hào)。
客戶端往往只是想連接到一個(gè)遠(yuǎn)程主機(jī)進(jìn)行通訊,而并不在乎使用本機(jī)上的哪個(gè)端口進(jìn)行通訊(比如Telnet),那么你可以不調(diào)用bind()函數(shù),而直接調(diào)用connect()函數(shù)。系統(tǒng)將會(huì)將自動(dòng)尋找出本地機(jī)器上的一個(gè)未使用的端口,然后調(diào)用bind()來(lái)將socket綁定到那個(gè)端口上。
可在客戶端套接字上調(diào)用setsockopt()在SOL_SOCKET級(jí)別獲取SO_CONNECT_TIME選項(xiàng)值,以秒為單位。判斷套接字是否已建立連接,以及建立連接的時(shí)間。SO_CONNECT_TIME是微軟特有支持選項(xiàng),往往服務(wù)器端在AcceptEx()調(diào)用中循環(huán)查詢所有未完成的客戶端套接字,從而做出超時(shí)處理,避免惡意客戶的服務(wù)拒絕攻擊。
在實(shí)際應(yīng)用中,可能需要維持持久連接,以提供/接受持續(xù)的數(shù)據(jù)服務(wù),例如HTTP的“Connection: Keep-Alive”。可以調(diào)用setsockopt()在SOL_SOCKET級(jí)別設(shè)置SO_KEEPALIVE選項(xiàng),這樣,套接字將定時(shí)向通信對(duì)方發(fā)送保持活躍數(shù)據(jù)包,保持心跳。
connect()對(duì)于UDP套接字的意義只影響send()調(diào)用和接收隊(duì)列,對(duì)recvfrom()和sendto()沒(méi)有影響,??并且可以多次成功connect()。
6.TCP服務(wù)器接受客戶連接請(qǐng)求
// The accept function permits an incoming connection attempt on a socket.
SOCKET?accept(
???????????SOCKET?s,// [in] Descriptor identifying a socket that has been placed in a listening state with the listen function.
???????????struct sockaddr?FAR?*addr,// [out] receives the address of the connecting entity, as known to the communications layer.
???????????int?FAR?*addrlen// [out] the length of addr.
???????????);
服務(wù)器進(jìn)入listen狀態(tài)后,循環(huán)調(diào)用accept()接受客戶的連接。參數(shù)一為監(jiān)聽(tīng)套接字;參數(shù)二為遠(yuǎn)端客戶的地址信息;該函數(shù)返回一個(gè)套接字句柄,負(fù)責(zé)后續(xù)與該遠(yuǎn)端客戶的會(huì)話通信。監(jiān)聽(tīng)套接字總是默默無(wú)聞的在門(mén)口守望(listen),迎接(accept)客戶的到來(lái)并安排服務(wù)員。
connect-accept完成的是TCP三次握手過(guò)程(three way or three message handshake):服務(wù)器調(diào)用socket的listen函數(shù)進(jìn)入監(jiān)聽(tīng)狀態(tài);客戶端調(diào)用connect函數(shù)連接服務(wù)器[SYN],服務(wù)器調(diào)用accept函數(shù)接受客戶連接[SYN,ACK]。客戶端發(fā)送[ACK]完成三次握手,connect函數(shù)返回;服務(wù)器收到客戶端發(fā)送的[ACK]后,accept函數(shù)返回。
服務(wù)器與客戶端基于IP協(xié)議的TCP或UDP通信的過(guò)程由一個(gè)五元組來(lái)唯一標(biāo)識(shí)。這個(gè)五元組是(協(xié)議,本地IP地址,本地端口號(hào),遠(yuǎn)程IP地址,遠(yuǎn)程端口號(hào)),它體現(xiàn)了socket通信的一一對(duì)應(yīng)關(guān)系(插座原理)。
???對(duì)于面向連接的(TCP協(xié)議)通信來(lái)說(shuō),服務(wù)器與客戶之間的連接建立完成后,這個(gè)五元組就確立了。
| 五元組 | <協(xié)議> | <本地IP地址,本地端口號(hào)> | <遠(yuǎn)程IP地址,遠(yuǎn)程端口號(hào)> |
| 服務(wù)器 | 由socket()確定 | 調(diào)用bind()確定 | 由accept()參數(shù)二返回 |
| 客戶端 | 由socket()確定 | 調(diào)用bind()確定或自動(dòng)確定 | 由connect()參數(shù)二指定 |
7.在一個(gè)已綁定或已連接的套接字上獲取連接名和對(duì)方地址信息
7.1獲取sockaddr
int?getsockname?(SOCKET?s, struct?sockaddr?*name, int*?namelen);
???getsockname函數(shù)獲取已綁定(可能是未調(diào)用bind的系統(tǒng)自動(dòng)綁定)的套接口本地協(xié)議地址。
int?getpeername?(SOCKET?s, struct?sockaddr?*name, int*?namelen);
???getpeername函數(shù)獲得與指定套接口連接的遠(yuǎn)程信息(IP:PORT)。
7.2獲取hostname
Host即通常意義上的機(jī)器名(Machine Name)或域名(Domain Name)。
int?gethostname?(char?FAR?*name, int?namelen);
gethostname()函數(shù)可以取得調(diào)用主機(jī)的機(jī)器名。返回的這個(gè)name傳給gethostbyname()調(diào)用可以取得相應(yīng)IP地址。
struct?hostent*?gethostbyname(const char*?name);
gethostbyname()函數(shù)主要用來(lái)做DNS解析,傳入域名(例如www.baidu.com),返回hostent結(jié)構(gòu)。struct hostent存放主機(jī)信息。
/*
?* Structures returned by network data base library, taken from the
?* BSD file netdb.h.?All addresses are supplied in host order, and
?* returned in network order (suitable for use in system calls).
?*/
struct?hostent?{
???????char???FAR?*h_name;??????????/* official name of host */
???????char???FAR?*FAR?*h_aliases;?/* alias list */
???????short??h_addrtype;????????????/* host address type */
???????short??h_length;??????????????/* length of address */
???????char???FAR?*FAR?*h_addr_list;/* list of addresses */
#define?h_addr?h_addr_list[0]?????????/* address, for backward compat */
};
/* Microsoft Windows Extended data types */
typedef struct?hostent?HOSTENT, *PHOSTENT, *LPHOSTENT;
以下代碼段獲取百度(www.baidu.com)機(jī)器名和地址。
???struct hostent *pBaiDu?=gethostbyname("www.baidu.com");
???printf("Host name: %s/n",pBaiDu->h_name);
???printf("IP Address: %s/n",inet_ntoa(*((struct in_addr*)pBaiDu->h_addr)));
?
struct?hostent*?gethostbyaddr(const char *addr, int?len, int?type);
gethostbyaddr函數(shù)根據(jù)主機(jī)的IP地址取得主機(jī)名和主機(jī)地址等信息。
原有的gethostbyname和inet_addr只能處理IPv4地址,在IPv6中,替代他們的函數(shù)為getnameinfo和getaddrinfo,相應(yīng)的地址信息結(jié)構(gòu)為structaddrinfo。參考<Ws2tcpip.h>。
8.I/O通信
從I/O的角度來(lái)看,套接字也是文件,它提供了同文件讀寫(xiě)(fread()/fwrite())對(duì)應(yīng)的收發(fā)數(shù)據(jù)操作接口:send()/recv()。
8.1發(fā)送數(shù)據(jù)
8.1.1 send
// The send function sends data on a connected socket.
int?send(
???????SOCKET?s,// [in] Descriptor identifying a connected socket.
???????const char?FAR?*buf,// [in] Buffer containing the data to be transmitted.
???????int?len,// [in] Length of the data in buf.
???????int?flags// [in] Indicator specifying the way in which the call is made.
???????);
send()函數(shù)在一個(gè)已連接的套接字s上執(zhí)行數(shù)據(jù)發(fā)送操作。對(duì)于客戶機(jī)而言,發(fā)送的目標(biāo)地址即connect()調(diào)用時(shí)所指定的地址;對(duì)于服務(wù)器而言,發(fā)送的目標(biāo)地址即accept()調(diào)用所返回的地址。發(fā)送的內(nèi)容為保存在緩沖區(qū)buf中,發(fā)送的內(nèi)容長(zhǎng)度為len。最后一個(gè)參數(shù)flags,通常情況下填0。
send()函數(shù)只是將欲發(fā)送的內(nèi)容從用戶緩沖區(qū)拷貝到系統(tǒng)緩沖區(qū)(TCP Send Socket Buffer),系統(tǒng)的默認(rèn)socket發(fā)送緩沖區(qū)(SO_SNDBUF)的大小為8K,我們可以調(diào)用setsockopt()將其更改,理論上最大為64K(The maximum congestion window is related to the amount of buffer space that the kernel allocates for each socket)。
只要系統(tǒng)緩沖區(qū)足夠大,send()執(zhí)行完拷貝立即返回實(shí)際拷貝的字節(jié)數(shù)。如果系統(tǒng)緩沖區(qū)不夠大,例如在網(wǎng)絡(luò)擁塞或帶寬下降的情況下,用戶大量地投遞send()操作導(dǎo)致TCP Send Socket Buffer迅速充滿,此時(shí)再調(diào)用send()操作,可能返回的值(即實(shí)際拷貝字節(jié)數(shù))要小于我們傳入的期待發(fā)送數(shù)量(len),在超時(shí)不得受理的情況下,返回SOCKET_ERROR,WSAGetLastError()=WSAETIMEDOUT。故大塊的數(shù)據(jù)可能不能一次性“發(fā)送”完畢,通常需要檢測(cè)send()返回值,多次調(diào)用send()直到“發(fā)送”完畢,可參考CSocket::Send()實(shí)現(xiàn)。關(guān)于發(fā)送超時(shí)限制(send timeout),可以調(diào)用setsockopt()在SOL_SOCKET級(jí)別設(shè)置SO_SNDTIMEO選項(xiàng)值,以毫秒為單位。建議最多兩分鐘,因?yàn)門(mén)CP的MSL(Maximum Segment Lifetime)即為兩分鐘。
需要注意的是,用戶可能短時(shí)間內(nèi)需要發(fā)送多個(gè)小數(shù)據(jù)包,在TCP/IP中,Nagle算法要求主機(jī)等待數(shù)據(jù)積累到一定數(shù)量后或超過(guò)預(yù)定時(shí)間才發(fā)送。默認(rèn)情況下實(shí)施Nagle算法,通信方會(huì)在向?qū)Ψ桨l(fā)送確認(rèn)(ACK)信息之前,花費(fèi)一定的時(shí)間來(lái)等待要傳入的數(shù)據(jù),這樣,主機(jī)的就不必發(fā)送一個(gè)只有確認(rèn)信息的數(shù)據(jù)報(bào)。發(fā)送小的數(shù)據(jù)包不僅沒(méi)有多少意義,而且徒增錯(cuò)誤檢查和確認(rèn)的開(kāi)銷。如果不想是使用Nagle算法,以“保留發(fā)送邊界”,用戶可調(diào)用setsockopt()函數(shù)在IPPROTO_TCP選項(xiàng)級(jí)別設(shè)置TCP_NODELAY為TRUE。例如一次獨(dú)立的HTTP GET請(qǐng)求往往希望“保留發(fā)送邊界”,服務(wù)器的HTTP Response Header往往希望“保留發(fā)送邊界”以區(qū)分后續(xù)的HTTP Response Content。體現(xiàn)在TCP層,即開(kāi)啟“PSH”選項(xiàng)。
具體的發(fā)送工作交由系統(tǒng)的傳輸層驅(qū)動(dòng)程序完成。因?yàn)門(mén)CP提供可靠有序的傳輸機(jī)制,故我們總是很放心地認(rèn)為它會(huì)將我們的數(shù)據(jù)發(fā)送到目的端。至于TCP分多少次將數(shù)據(jù)發(fā)送至對(duì)方,由協(xié)商的MSS(Max Segment Size)和接收方的TCP Window決定。
8.1.2 sendto
// The sendto function sends data to a specific destination.
int?sendto(
????????SOCKET?s,
????????const char?FAR?*buf,
????????int?len,
????????int?flags,
????????const struct sockaddr?FAR?*to,// [in] Optional pointer to the address of the target socket.
????????int?tolen// [in] Size of the address in to.
????????);
sendto()函數(shù)只是比send()函數(shù)多出了一個(gè)目的地址信息參數(shù),主要用于面向無(wú)連接的UDP通信。TCP套接字在建立連接(connect-accept)時(shí),便知曉對(duì)方地址信息,而UDP套接字通信之前不建立連接,需要通信時(shí),調(diào)用sendto()將消息發(fā)送給目的地址(to)。無(wú)論對(duì)方是否在指定端口“監(jiān)聽(tīng)”,sendto總是把數(shù)據(jù)發(fā)出去,要知道UDP是沒(méi)有回應(yīng)確認(rèn)的。
注釋中,sendto()函數(shù)的目標(biāo)地址是“optional”,當(dāng)我們忽略最后兩個(gè)參數(shù)時(shí),完全可以替換send()函數(shù)使用。實(shí)際上,這很方便我們?cè)诰幊探涌谏咸峁┙y(tǒng)一。例如live555的writeSocket接口針對(duì)TCP和UDP套接字統(tǒng)一使用sendto()。
由于UDP協(xié)議基本上只是在IP協(xié)議上做了簡(jiǎn)單的封裝(Source Port+Destination Port+Length+Checksum),其沒(méi)有做可靠性傳輸保障,故對(duì)UDP套接字一次sendto()的數(shù)據(jù)量不宜過(guò)大,最好以MTU為基準(zhǔn)。使用UDP套接字往發(fā)送大數(shù)據(jù)塊,往往因?yàn)镮P分片等原因丟包,考慮異構(gòu)網(wǎng)絡(luò)及設(shè)備的MTU不同,一般一次發(fā)送512字節(jié)左右比較合適。
我們?cè)谝粋€(gè)UDP套接字上執(zhí)行connect()操作,并未真正建立連接,而是執(zhí)行一種目的地址“綁定”,事后我們可以使用send()函數(shù)替換sendto()函數(shù)。要取消UDP套接字與目的地址的關(guān)聯(lián),唯一的辦法是在這個(gè)套接字上以INADDR_ANY為目標(biāo)地址調(diào)用connect()。
8.2接收數(shù)據(jù)
8.2.1 recv
// The recv function receives data from a connected or bound socket.
int?recv(
???????SOCKET?s,// [in] Descriptor identifying a connected socket.
???????char?FAR?*buf,// [out] Buffer for the incoming data.
???????int?len,// [in] Length of buf.
???????int?flags// [in] Flag specifying the way in which the call is made.
???????);
recv()函數(shù)在一個(gè)已連接的套接字s上執(zhí)行數(shù)據(jù)接收操作。對(duì)于客戶機(jī)而言,數(shù)據(jù)的源地址即connect()調(diào)用時(shí)所指定的地址;對(duì)于服務(wù)器而言,數(shù)據(jù)的源地址即accept()調(diào)用所返回的地址。接收的內(nèi)容為保存至長(zhǎng)度為len的緩沖區(qū)buf,最后一個(gè)參數(shù)flags,通常情況下填0。
recv()函數(shù)只是將TCP層當(dāng)前接收到的數(shù)據(jù)流從系統(tǒng)緩沖區(qū)(TCP Receive Socket??Buffer)拷貝到用戶緩沖區(qū),系統(tǒng)的默認(rèn)socket接收緩沖區(qū)(SO_RCVBUF)的大小為8K,我們可以調(diào)用setsockopt()將其更改,理論上最大為64K(The maximum congestion window is related to the amount of buffer space that the kernel allocates for each socket)。
recv()函數(shù)返回實(shí)際接收到的數(shù)據(jù),可能小于緩沖區(qū)的長(zhǎng)度len,可能當(dāng)前到達(dá)的有效數(shù)據(jù)大于len,但最大返回len。在超時(shí)仍無(wú)數(shù)據(jù)到來(lái)的情況下,返回SOCKET_ERROR,WSAGetLastError()=WSAETIMEDOUT。關(guān)于接收超時(shí)限制(receive timeout),可以調(diào)用setsockopt()在SOL_SOCKET級(jí)別設(shè)置SO_RCVTIMEO選項(xiàng)值,以毫秒為單位。建議最多兩分鐘,因?yàn)門(mén)CP的MSL(Maximum Segment Lifetime)即為兩分鐘。
如果對(duì)方不停發(fā)送數(shù)據(jù),而本機(jī)過(guò)于繁忙疲于應(yīng)付,則可能導(dǎo)致數(shù)據(jù)大量累積,一旦TCP Receive Socket Buffer或TCP Window充滿,則可能產(chǎn)生數(shù)據(jù)溢出。TCP滑動(dòng)窗口機(jī)制,由接收方建議性的控制發(fā)送量,即每一次確認(rèn)回應(yīng)(ACK)時(shí)都告知對(duì)方自己當(dāng)前的接收能力(TCP窗口的大小),發(fā)送方據(jù)此有效地控制自己的發(fā)送行為,協(xié)調(diào)雙方的通信步伐。
由于基于流的TCP協(xié)議,未保留消息邊界(boundary)的概念,發(fā)送者發(fā)送的數(shù)據(jù)很快就會(huì)聚集在系統(tǒng)接收緩沖區(qū)(TCP堆棧)中。假設(shè)這樣一種情景,客戶端連接流媒體服務(wù)器(如IP攝像頭)后,發(fā)送請(qǐng)求碼流的請(qǐng)求,這以后服務(wù)器總是將連續(xù)不斷地推送數(shù)據(jù)過(guò)來(lái)(如IP攝像頭實(shí)時(shí)監(jiān)控碼流)。若客戶端不執(zhí)行recv()拷貝操作而又尚未關(guān)閉連接,則服務(wù)器不斷推送數(shù)據(jù)到客戶端的TCP Stack,直至TCP window size=0。
不管消息邊界是否存在,接收端都會(huì)盡量地讀取當(dāng)前的有效數(shù)據(jù)。執(zhí)行拷貝后,數(shù)據(jù)將立即從系統(tǒng)緩沖區(qū)刪除,以釋放部分TCP Window。因?yàn)榱鞯臒o(wú)邊界性,故用戶投遞了三個(gè)send(),可能接收端只需一次或兩次recv()即接收完成。若客戶三次send()的是結(jié)構(gòu)化的數(shù)據(jù),而接收端收到的是粘連在一起的一大坨數(shù)據(jù)或兩塊隨機(jī)邊界數(shù)據(jù),這種情況即通常所說(shuō)的TCP粘包問(wèn)題。
具體的接收工作交由系統(tǒng)的傳輸層驅(qū)動(dòng)程序完成。因?yàn)門(mén)CP提供可靠有序的傳輸機(jī)制,故我們總是很放心地認(rèn)為它會(huì)將對(duì)方發(fā)送過(guò)來(lái)的數(shù)據(jù)正確的提交給我們。這里面的“正確”是指應(yīng)用層面的報(bào)文結(jié)構(gòu)及格式,即使TCP層面發(fā)生了偶然的丟包重傳(retransmit out of order),但我們得到的仍然是對(duì)方提交的完整的報(bào)文。應(yīng)用層協(xié)議就需要我們自己解析了。
粘包問(wèn)題需要我們聯(lián)合發(fā)送方,采取有效邊界措施在應(yīng)用層重組出正確的報(bào)文。例如,發(fā)送方往往在一個(gè)數(shù)據(jù)包的頭4個(gè)字節(jié)告知對(duì)方接下來(lái)的數(shù)據(jù)有多少,這樣接收方就能有效的執(zhí)行接收,以保留邊界和結(jié)構(gòu)性。假設(shè)接收方得知發(fā)送方將發(fā)送32KB的數(shù)據(jù)過(guò)來(lái),便投遞一個(gè)32KB的緩沖區(qū)調(diào)用recv試圖一次性接收完畢,這將以失敗告終。實(shí)際上,發(fā)送方的TCP層將按MSS尺寸將TCP報(bào)文分解成很多個(gè)段(Segment)分多次發(fā)送給接收方。當(dāng)然,它們往往具有相同的確認(rèn)號(hào)(ack),以表示這些段是一個(gè)回應(yīng)報(bào)文。這樣,客戶端才能識(shí)別出TCP segment of a reassembled PDU,以正確重組報(bào)文。可參考CSocket::Receive()實(shí)現(xiàn)。
8.2.2 recvfrom
// The recvfrom function receives a datagram and stores the source address.
int?recvfrom(
???????????SOCKET?s,
???????????char?FAR*?buf,
???????????int?len,
???????????int?flags,
???????????struct sockaddr?FAR?*from,// [out] Optional pointer to a buffer that will hold the source address upon return.
???????????int?FAR?*fromlen// [in, out] Optional pointer to the size of the from buffer.
???????????);
recvfrom/recv與sendto/send在行為學(xué)上同功,因?yàn)槭孪炔恢l(fā)送方為誰(shuí),故只要進(jìn)來(lái)的通信,都將對(duì)方的地址保存在參數(shù)from中。值得注意的是,盡管UDP中沒(méi)有TCP監(jiān)聽(tīng)、連接等概念,但是作為接收方往往需要在本地某個(gè)端口上等待,這個(gè)端口必須是專用,約定用戶預(yù)知的。故通常在調(diào)用recvfrom之前,必須顯式調(diào)用bind()函數(shù)將UDP套接字關(guān)聯(lián)到本地某個(gè)指定端口,進(jìn)行“監(jiān)聽(tīng)”。
UDP通信是基于離散消息(message)的,故要么收到對(duì)方發(fā)送的消息包,要么整包丟失,接收方不得而知。如果整包丟失了,由于接收方不得而知,故沒(méi)有反饋信息,也不會(huì)重發(fā)。這就是UDP通信的不可靠處。
live555中的readSocket接口針對(duì)TCP和UDP套接字統(tǒng)一使用recvfrom。
9.關(guān)閉TCP連接
在無(wú)連接的UDP中不存在關(guān)閉連接問(wèn)題,我們r(jià)ecvfrom/sendto完畢即可調(diào)用closesocket()回收套接字內(nèi)核資源。
對(duì)于面向連接的TCP通信,關(guān)閉一個(gè)連接需要四次揮手,以關(guān)閉雙向信道。其中一方A發(fā)送FIN報(bào)文給另一方B發(fā)起關(guān)閉,告訴另一方B它再也不會(huì)發(fā)送數(shù)據(jù)了,當(dāng)然它一般會(huì)先將發(fā)送隊(duì)列中尚未發(fā)送的數(shù)據(jù)先發(fā)送出去再發(fā)送FIN報(bào)文。對(duì)方B收到FIN通知,回應(yīng)ACK關(guān)閉AàB方向上的連接。此時(shí),B仍可向A發(fā)送數(shù)據(jù),A仍可讀取線路上或網(wǎng)絡(luò)堆棧上掛起的數(shù)據(jù)。當(dāng)另一方B也決定不再發(fā)送數(shù)據(jù)時(shí),它也發(fā)出一個(gè)FIN報(bào)文,關(guān)閉BàA方向上的連接。以上即TCP連接的正常關(guān)閉。
因?yàn)榭赡茉撎捉幼稚先杂形礇Q的I/O,為了保證通信方能夠接收到應(yīng)用程序發(fā)出的所有數(shù)據(jù),一個(gè)友好的應(yīng)用程序應(yīng)該通知接收端“不再發(fā)送數(shù)據(jù)”,同樣通信對(duì)方也應(yīng)該如此,這就是所謂的“從容關(guān)閉”。TCP套接字recv()/send()通信完畢,往往需要調(diào)用shutdown()函數(shù)從容地關(guān)閉TCP連接,而不是立刻調(diào)用closesocket()函數(shù)釋放套接字資源。
// The shutdown function disables sends or receives on a socket.
int?shutdown(
???????????SOCKET?s,// [in] Descriptor identifying a socket.
???????????int?how// [in] Flag that describes what types of operation will no longer be allowed.
???????????);
需要留意的是第二參數(shù)how,一個(gè)套接字既可以調(diào)用recv接數(shù)據(jù)也可以調(diào)用send發(fā)數(shù)據(jù),因此它以下三種取值:
SD_RECEIVE—subsequent calls to therecv?function on the socket will be disallowed.
SD_SEND—subsequent calls to thesend?function are disallowed
SD_BOTH—disables both sends and receives as described above.
如果how=SD_RECEIVE,則該套接口上的后續(xù)接收操作將被禁止。對(duì)于TCP協(xié)議,TCP窗口不改變并接收前來(lái)的數(shù)據(jù)(但不確認(rèn))直至窗口滿后,window size為0,無(wú)法接受數(shù)據(jù)。
通常取how=SD_SEND,表示不允許再調(diào)用發(fā)送函數(shù),TCP套接字將會(huì)在所有數(shù)據(jù)發(fā)送出去并得到對(duì)方的確認(rèn)(ACK)之后生成一個(gè)FIN包,斷開(kāi)與對(duì)方的半連接。
在沒(méi)有調(diào)用shutdown()的情況下,直接調(diào)用closesocket()試圖釋放TCP套接字資源,如果沒(méi)有對(duì)該套接字的其他引用(具體來(lái)說(shuō)是該套接字上是否存在未決I/O),那么所有與該套接字描述符關(guān)聯(lián)的資源都會(huì)被釋放,其中包括所有傳輸隊(duì)列中的數(shù)據(jù),包括同步調(diào)用和重疊操作。在TCP層面上,closesocket()將向?qū)Ψ桨l(fā)送[RST,ACK]報(bào)文,以重置虛擬鏈路。
SOL_SOCKET級(jí)別的SO_LINGER/SO_DONTLINGER參數(shù)用來(lái)控制當(dāng)未發(fā)送的數(shù)據(jù)在套接字上排隊(duì)等待時(shí),一旦執(zhí)行closesocket()命令該采取什么樣的動(dòng)作。structlinger對(duì)應(yīng)的是一段拖延時(shí)間,若超出規(guī)定的時(shí)間便不再拖延,所有未發(fā)送或未接收的數(shù)據(jù)都會(huì)被丟棄,同時(shí)重設(shè)與對(duì)方的連接。可調(diào)用setsockopt()函數(shù)在丟棄任何正在排隊(duì)的數(shù)據(jù)之前啟用拖延功能。
?
四.Winsock TCP C/S通信示例
套接字的本質(zhì)是通信過(guò)程中所要使用的一些緩沖區(qū)及一些相關(guān)的數(shù)據(jù)結(jié)構(gòu)。
通過(guò)WSA(WinSock API)構(gòu)建C/S通信程序的步驟如下:
1.服務(wù)器創(chuàng)建監(jiān)聽(tīng)套接字,并為它關(guān)聯(lián)一個(gè)本地地址(IP和端口Port),然后進(jìn)入監(jiān)聽(tīng)狀態(tài)準(zhǔn)備接受客戶的連接請(qǐng)求。為了接受客戶的連接請(qǐng)求,服務(wù)器必須調(diào)用accept函數(shù)。服務(wù)器端每接收到一個(gè)客戶端連接就新建一個(gè)套接字負(fù)責(zé)與該客戶會(huì)話。
2.客戶端創(chuàng)建套接字后即可調(diào)用connect函數(shù)去試圖連接服務(wù)器監(jiān)聽(tīng)套接字。當(dāng)服務(wù)器端的accept函數(shù)返回后,connect函數(shù)也返回。此時(shí)客戶方使用socket函數(shù)創(chuàng)建的套接字clientSocket,服務(wù)器方使用accept返回的套接字serverSocket,雙方就可以通信了。
?
?
?
以下為WinSock通信示例程序:
(1)服務(wù)器端程序serverDemo.cpp
[cpp]?view plaincopyprint?(2)客戶端程序clientDemo.cpp
[cpp]?view plaincopyprint?總結(jié)
以上是生活随笔為你收集整理的WinSock编程基础的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 一些学习cocos2d的网站
- 下一篇: 线程的数据结构