Python3之socket编程(TCP/UDP,粘包问题,数据传输、文件上传)
一、socket的定義
Socket是應用層與TCP/IP協議族通信的中間軟件抽象層,它是一組接口。在設計模式中,Socket其實就是一個門面模式,它把復雜的TCP/IP協議族隱藏在Socket接口后面,對用戶來說,一組簡單的接口就是全部,讓Socket去組織數據,以符合指定的協議。所以,我們無需深入理解tcp/udp協議,socket已經為我們封裝好了,我們只需要遵循socket的規定去編程,寫出的程序自然就是遵循tcp/udp標準的。
補充:也有人將socket說成ip+port,ip是用來標識互聯網中的一臺主機的位置,而port是用來標識這臺機器上的一個應用程序,ip地址是配置到網卡上的,而port是應用程序開啟的,ip與port的綁定就標識了互聯網中獨一無二的一個應用程序,而程序的pid是同一臺機器上不同進程或者線程的標識
二、套接字發展史及分類
套接字起源于 20 世紀 70 年代加利福尼亞大學伯克利分校版本的 Unix,即人們所說的 BSD Unix。 因此,有時人們也把套接字稱為“伯克利套接字”或“BSD 套接字”。一開始,套接字被設計用在同 一臺主機上多個應用程序之間的通訊。這也被稱進程間通訊,或 IPC。套接字有兩種(或者稱為有兩個種族),分別是基于文件型的和基于網絡型的。?
- 基于文件類型的套接字家族
套接字家族的名字:AF_UNIX
unix一切皆文件,基于文件的套接字調用的就是底層的文件系統來取數據,兩個套接字進程運行在同一機器,可以通過訪問同一個文件系統間接完成通信
- 基于網絡類型的套接字家族
套接字家族的名字:AF_INET
(還有AF_INET6被用于ipv6,還有一些其他的地址家族,不過,他們要么是只用于某個平臺,要么就是已經被廢棄,或者是很少被使用,或者是根本沒有實現,所有地址家族中,AF_INET是使用最廣泛的一個,python支持很多種地址家族,但是由于我們只關心網絡編程,所以大部分時候我么只使用AF_INET)
三、套接字的工作流程
? 一個生活中的場景。你要打電話給一個朋友,先撥號,朋友聽到電話鈴聲后提起電話,這時你和你的朋友就建立起了連接,就可以講話了。等交流結束,掛斷電話結束此次交談。
生活中的場景就解釋了套接字的工作原理
先從服務器端說起。服務器端先初始化Socket,然后與端口綁定(bind),對端口進行監聽(listen),調用accept阻塞,等待客戶端連接。在這時如果有個客戶端初始化一個Socket,然后連接服務器(connect),如果連接成功,這時客戶端與服務器端的連接就建立了。客戶端發送數據請求,服務器端接收請求并處理請求,然后把回應數據發送給客戶端,客戶端讀取數據,最后關閉連接,一次交互結束。
?
四、socket函數使用
- socket函數用法
- 服務端套接字函數
- 客戶端套接字函數
- 公共用途的套接字函數
- 面向鎖的套接字方法
- 面向文件的套接字方法
?
打電話的流程演示
服務端.py
import socket phone=socket.socket(socket.AF_INET,socket.SOCK_STREAM) #買手機 phone.bind(('127.0.0.1',8080)) #插電話卡phone.listen(5) #開機,backlogprint('starting....') conn,addr=phone.accept() #接電話 print(conn) print('client addr',addr) print('ready to read msg') client_msg=conn.recv(1024) #收消息 print('client msg: %s' %client_msg) conn.send(client_msg.upper()) #發消息conn.close() phone.close()客戶端.py
import socket phone=socket.socket(socket.AF_INET,socket.SOCK_STREAM) phone.connect(('127.0.0.1',8080)) #撥通電話phone.send('hello'.encode('utf-8')) #發消息back_msg=phone.recv(1024) print(back_msg)phone.close()輸出
服務端:
starting.... <socket.socket fd=4, family=AddressFamily.AF_INET, type=SocketKind.SOCK_STREAM, proto=0, laddr=('127.0.0.1', 8080), raddr=('127.0.0.1', 65142)> client addr ('127.0.0.1', 65142) ready to read msg client msg: b'hello'客戶端
b'HELLO'?
五、基于TCP的套接字
- tcp服務端?
- tcp客戶端
socket通信流程與打電話流程類似,我們就以打電話為例來實現一個low版的套接字通信
服務端
import socket ip_port=('127.0.0.1',9000) #電話卡 BUFSIZE=1024 #收發消息的尺寸 s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) #買手機 s.bind(ip_port) #手機插卡 s.listen(5) #手機待機conn,addr=s.accept() #手機接電話 # print(conn) # print(addr) print('接到來自%s的電話' %addr[0])msg=conn.recv(BUFSIZE) #聽消息,聽話 print(msg,type(msg))conn.send(msg.upper()) #發消息,說話conn.close() #掛電話s.close() #手機關機客戶端
import socket ip_port=('127.0.0.1',9000) BUFSIZE=1024 s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)s.connect_ex(ip_port) #撥電話s.send('nitouxiang nb'.encode('utf-8')) #發消息,說話(只能發送字節類型)feedback=s.recv(BUFSIZE) #收消息,聽話 print(feedback.decode('utf-8'))s.close() #掛電話輸出
服務端
接到來自127.0.0.1的電話 b'nitouxiang nb' <class 'bytes'>客戶端
NITOUXIANG NB?
上述流程的問題是,服務端只能接受一次鏈接,然后就徹底關閉掉了,實際情況應該是,服務端不斷接受鏈接,然后循環通信,通信完畢后只關閉鏈接,服務器能夠繼續接收下一次鏈接,下面是修改版
?服務端
import socket ip_port = ('127.0.0.1',8081) #電話卡 BUFSIZE=1024 s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) #買手機 s.bind(ip_port) #手機插卡 s.listen(5) #手機待機while True: #新增接收鏈接循環,可以不停的接電話conn,addr=s.accept() #手機接電話print('接到來自%s的電話' %addr[0])while True: ##新增通信循環,可以不斷的通信,收發消息msg=conn.recv(BUFSIZE) #聽消息,聽話if len(msg) == 0:break #如果不加,那么正在鏈接的客戶端突然斷開,recv便不再阻塞,死循環發生print(msg,type(msg))conn.send(msg.upper()) #發消息,說話conn.close() #掛電話 s.close() #手機關機客戶端
import socket ip_port=('127.0.0.1',8081) BUFSIZE=1024 s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)s.connect_ex(ip_port) #撥電話while True: #新增通信循環,客戶端可以不斷發收消息msg=input('>>: ').strip()if len(msg) == 0:continues.send(msg.encode('utf-8')) #發消息,說話(只能發送字節類型)feedback=s.recv(BUFSIZE) #收消息,聽話print(feedback.decode('utf-8'))s.close() #掛電話補充:
在重啟服務端時可能會遇到
這個是由于你的服務端仍然存在四次揮手的time_wait狀態在占用地址(如果不懂,請深入研究1.tcp三次握手,四次揮手 2.syn洪水攻擊 3.服務器高并發情況下會有大量的time_wait狀態的優化方法)
解決辦法
方法一
#加入一條socket配置,重用ip和端口phone=socket(AF_INET,SOCK_STREAM) phone.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) #就是它,在bind前加 phone.bind(('127.0.0.1',8080))方法二
發現系統存在大量TIME_WAIT狀態的連接,通過調整linux內核參數解決, vi /etc/sysctl.conf編輯文件,加入以下內容: net.ipv4.tcp_syncookies = 1 net.ipv4.tcp_tw_reuse = 1 net.ipv4.tcp_tw_recycle = 1 net.ipv4.tcp_fin_timeout = 30然后執行 /sbin/sysctl -p 讓參數生效。net.ipv4.tcp_syncookies = 1 表示開啟SYN Cookies。當出現SYN等待隊列溢出時,啟用cookies來處理,可防范少量SYN攻擊,默認為0,表示關閉;net.ipv4.tcp_tw_reuse = 1 表示開啟重用。允許將TIME-WAIT sockets重新用于新的TCP連接,默認為0,表示關閉;net.ipv4.tcp_tw_recycle = 1 表示開啟TCP連接中TIME-WAIT sockets的快速回收,默認為0,表示關閉。net.ipv4.tcp_fin_timeout 修改系統默認的 TIMEOUT 時間六、基于UDP的套接字
- udp服務端
- udp客戶端
示例
服務端
import socket ip_port=('127.0.0.1',9000) BUFSIZE=1024 udp_server_client=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)udp_server_client.bind(ip_port)while True:msg,addr=udp_server_client.recvfrom(BUFSIZE)print(msg,addr)udp_server_client.sendto(msg.upper(),addr)客戶端
import socket ip_port=('127.0.0.1',9000) BUFSIZE=1024 udp_server_client=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)while True:msg=input('>>: ').strip()if not msg:continueudp_server_client.sendto(msg.encode('utf-8'),ip_port)back_msg,addr=udp_server_client.recvfrom(BUFSIZE)print(back_msg.decode('utf-8'),addr)輸出
客戶端
>>: 123 123 ('127.0.0.1', 9000) >>: 3 3 ('127.0.0.1', 9000) >>: 4 4 ('127.0.0.1', 9000)服務端
b'123' ('127.0.0.1', 53066) b'3' ('127.0.0.1', 53066) b'4' ('127.0.0.1', 53066)?
模擬QQ聊天,多個客戶端和服務端通信
服務端
import socket ip_port=('127.0.0.1',8081) udp_server_sock=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) #買手機 udp_server_sock.bind(ip_port)while True:qq_msg,addr=udp_server_sock.recvfrom(1024)print('來自[%s:%s]的一條消息:\033[1;44m%s\033[0m' %(addr[0],addr[1],qq_msg.decode('utf-8')))back_msg=input('回復消息: ').strip()udp_server_sock.sendto(back_msg.encode('utf-8'),addr)客戶端1
import socket BUFSIZE=1024 udp_client_socket=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)qq_name_dic={'TOM':('127.0.0.1',8081),'JACK':('127.0.0.1',8081),'一棵樹':('127.0.0.1',8081),'武大郎':('127.0.0.1',8081), }while True:qq_name=input('請選擇聊天對象: ').strip()while True:msg=input('請輸入消息,回車發送: ').strip()if msg == 'quit':breakif not msg or not qq_name or qq_name not in qq_name_dic:continueudp_client_socket.sendto(msg.encode('utf-8'),qq_name_dic[qq_name])back_msg,addr=udp_client_socket.recvfrom(BUFSIZE)print('來自[%s:%s]的一條消息:\033[1;44m%s\033[0m' %(addr[0],addr[1],back_msg.decode('utf-8')))udp_client_socket.close()客戶端2
import socket BUFSIZE=1024 udp_client_socket=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)qq_name_dic={'TOM':('127.0.0.1',8081),'JACK':('127.0.0.1',8081),'一棵樹':('127.0.0.1',8081),'武大郎':('127.0.0.1',8081), }while True:qq_name=input('請選擇聊天對象: ').strip()while True:msg=input('請輸入消息,回車發送: ').strip()if msg == 'quit':breakif not msg or not qq_name or qq_name not in qq_name_dic:continueudp_client_socket.sendto(msg.encode('utf-8'),qq_name_dic[qq_name])back_msg,addr=udp_client_socket.recvfrom(BUFSIZE)print('來自[%s:%s]的一條消息:\033[1;44m%s\033[0m' %(addr[0],addr[1],back_msg.decode('utf-8')))udp_client_socket.close()輸出
客戶端1
請選擇聊天對象: JACK 請輸入消息,回車發送: 約不 來自[127.0.0.1:8081]的一條消息:不約 請輸入消息,回車發送:客戶端2
請選擇聊天對象: TOM 請輸入消息,回車發送: 123 來自[127.0.0.1:8081]的一條消息:321 請輸入消息,回車發送:服務端
來自[127.0.0.1:62851]的一條消息:123 回復消息: 321 來自[127.0.0.1:60378]的一條消息:約不 回復消息: 不約?
七、recv與recvfrom
發消息,都是將數據發送到己端的發送緩沖中,收消息都是從己端的緩沖區中收。
- tcp:send發消息,recv收消息
- udp:sendto發消息,recvfrom收消息
?1.send與sendinto
tcp是基于數據流的,而udp是基于數據報的:
- send(bytes_data):發送數據流,數據流bytes_data若為空,自己這段的緩沖區也為空,操作系統不會控制tcp協議發空包
- sendinto(bytes_data,ip_port):發送數據報,bytes_data為空,還有ip_port,所有即便是發送空的bytes_data,數據報其實也不是空的,自己這端的緩沖區收到內容,操作系統就會控制udp協議發包。
?
2.recv與recvfrom
tcp協議:
(1)如果收消息緩沖區里的數據為空,那么recv就會阻塞(阻塞很簡單,就是一直在等著收)
(2)只不過tcp協議的客戶端send一個空數據就是真的空數據,客戶端即使有無窮個send空,也跟沒有一個樣。
(3)tcp基于鏈接通信
- 基于鏈接,則需要listen(backlog),指定半連接池的大小
- 基于鏈接,必須先運行的服務端,然后客戶端發起鏈接請求
- 對于mac系統:如果一端斷開了鏈接,那另外一端的鏈接也跟著完蛋recv將不會阻塞,收到的是空(解決方法是:服務端在收消息后加上if判斷,空消息就break掉通信循環)
- 對于windows/linux系統:如果一端斷開了鏈接,那另外一端的鏈接也跟著完蛋recv將不會阻塞,收到的是空(解決方法是:服務端通信循環內加異常處理,捕捉到異常后就break掉通訊循環)
?
udp協議
(1)如果如果收消息緩沖區里的數據為“空”,recvfrom也會阻塞
(2)只不過udp協議的客戶端sendinto一個空數據并不是真的空數據(包含:空數據+地址信息,得到的報仍然不會為空),所以客戶端只要有一個sendinto(不管是否發送空數據,都不是真的空數據),服務端就可以recvfrom到數據。
(3)udp無鏈接
- 無鏈接,因而無需listen(backlog),更加沒有什么連接池之說了
- 無鏈接,udp的sendinto不用管是否有一個正在運行的服務端,可以己端一個勁的發消息,只不過數據丟失
- recvfrom收的數據小于sendinto發送的數據時,在mac和linux系統上數據直接丟失,在windows系統上發送的比接收的大直接報錯
- 只有sendinto發送數據沒有recvfrom收數據,數據丟失?
注意:
1.你單獨運行上面的udp的客戶端,你發現并不會報錯,相反tcp卻會報錯,因為udp協議只負責把包發出去,對方收不收,我根本不管,而tcp是基于鏈接的,必須有一個服務端先運行著,客戶端去跟服務端建立鏈接然后依托于鏈接才能傳遞消息,任何一方試圖把鏈接摧毀都會導致對方程序的崩潰。
2.上面的udp程序,你注釋任何一條客戶端的sendinto,服務端都會卡住,為什么?因為服務端有幾個recvfrom就要對應幾個sendinto,哪怕是sendinto(b'')那也要有。
?
基于tcp先制作一個遠程執行命令的程序(1:執行錯誤命令 2:執行ls 3:執行ifconfig)
客戶端
import socket BUFSIZE=1024 ip_port=('127.0.0.1',8080)s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) res=s.connect_ex(ip_port)while True:msg=input('>>: ').strip()if len(msg) == 0:continueif msg == 'quit':breaks.send(msg.encode('utf-8'))act_res=s.recv(BUFSIZE)print(act_res.decode('utf-8'),end='')服務端
from socket import * import subprocessip_port=('127.0.0.1',8080) BUFSIZE=1024tcp_socket_server=socket(AF_INET,SOCK_STREAM) tcp_socket_server.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) tcp_socket_server.bind(ip_port) tcp_socket_server.listen(5)while True:conn,addr=tcp_socket_server.accept()print('客戶端',addr)while True:cmd=conn.recv(BUFSIZE)if len(cmd) == 0:breakres=subprocess.Popen(cmd.decode('utf-8'),shell=True,stdout=subprocess.PIPE,stdin=subprocess.PIPE,stderr=subprocess.PIPE)stderr=res.stderr.read()stdout=res.stdout.read()conn.send(stderr)conn.send(stdout)輸出
客戶端
>>: ls 1.py 客戶端.py 客戶端1.py 客戶端2.py 服務端.py >>: ifconfig en0 en0: flags=8863<UP,BROADCAST,SMART,RUNNING,SIMPLEX,MULTICAST> mtu 1500ether 78:4f:43:5b:a5:4c inet6 fe80::d0:d821:dbf0:3d67%en0 prefixlen 64 secured scopeid 0x5 inet 192.168.31.165 netmask 0xffffff00 broadcast 192.168.31.255nd6 options=201<PERFORMNUD,DAD>media: autoselectstatus: active >>: ifconfig lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 16384options=1203<RXCSUM,TXCSUM,TXSTATUS,SW_TIMESTAMP>inet 127.0.0.1 netmask 0xff000000 inet6 ::1 prefixlen 128 inet6 fe80::1%lo0 prefixlen 64 scopeid 0x1 nd6 options=201<PERFORMNUD,DAD> gif0: flags=8010<POINTOPOINT,MULTICAST> mtu 1280 stf0: flags=0<> mtu 1280 en0: flags=8863<UP,BROADCAST,SMART,RUNNING,SIMPLEX,MULTICAST> mtu 1500ether 78:4f:43:5b:a5:4c inet6 fe80::d0:d821:dbf0:3d67%en0 prefixlen 64 secured scopeid 0x5 inet 192.168.31.165 netmask 0xffffff00 broadcast 192.168.31.255nd6 options=201<PERFORMNUD,DAD>media: autoselectstatus: active en1: flags=963<UP,BROADCAST,SMART,RUNNING,PROMISC,SIMPLEX> mtu 1500options=60<TSO4,TSO6>ether e2:00:ec:98:eb:00 media: autoselect <full-duplex>status: inactive en3: flags=963<UP,BROADCAST,SMART,RUNNING,PROMISC,SIMPLEX> mtu 1500options=60<TSO4,TSO6>ether e2:00:ec:98:eb:01 media: autoselect <full-duplex>status: inactive en2: flags=963<UP,BROADCAST,SMART,RUNNING,PROMISC,SIMPLEX> mtu 1500>>: >>:服務端
客戶端 ('127.0.0.1', 58194)上述程序是基于tcp的socket,在運行時會發生粘包
?
服務端
from socket import * import subprocessip_port=('127.0.0.1',9003) bufsize=1024udp_server=socket(AF_INET,SOCK_DGRAM) udp_server.bind(ip_port)while True:#收消息cmd,addr=udp_server.recvfrom(bufsize)print('用戶命令----->',cmd)#邏輯處理res=subprocess.Popen(cmd.decode('utf-8'),shell=True,stderr=subprocess.PIPE,stdin=subprocess.PIPE,stdout=subprocess.PIPE)stderr=res.stderr.read()stdout=res.stdout.read()#發消息udp_server.sendto(stderr,addr)udp_server.sendto(stdout,addr) udp_server.close()客戶端
from socket import * ip_port=('127.0.0.1',9003) bufsize=1024udp_client=socket(AF_INET,SOCK_DGRAM)while True:msg=input('>>: ').strip()udp_client.sendto(msg.encode('utf-8'),ip_port)data,addr=udp_client.recvfrom(bufsize)print(data.decode('utf-8'),end='')上述程序是基于udp的socket,在運行時永遠不會發生粘包
?
注意注意注意:
res=subprocess.Popen(cmd.decode('utf-8'),
shell=True,
stderr=subprocess.PIPE,
stdout=subprocess.PIPE)
的結果的編碼是以當前所在的系統為準的,如果是windows,那么res.stdout.read()讀出的就是GBK編碼的,在接收端需要用GBK解碼且只能從管道里讀一次結果
?
八、粘包
1.什么是粘包
粘包:發送方發送兩個字符串”hello”+”world”,接收方卻一次性接收到了”helloworld”。
只有TCP有粘包現象,UDP永遠不會粘包。
所謂粘包問題主要還是因為接收方不知道消息之間的界限,不知道一次性提取多少字節的數據所造成的。
補充:
分包:發送方發送字符串”helloworld”,接收方卻接收到了兩個字符串”hello”和”world”。
TCP是以段(Segment)為單位發送數據的,建立TCP鏈接后,有一個最大消息長度(MSS)。如果應用層數據包超過MSS,就會把應用層數據包拆分,分成兩個段來發送。這個時候接收端的應用層就要拼接這兩個TCP包,才能正確處理數據。
補充:
一個socket收發消息的原理
2.粘包如何產生
TCP為了提高網絡的利用率,會使用一個叫做Nagle的算法。該算法是指,發送端即使有要發送的數據,如果很少的話,會延遲發送。如果應用層給TCP傳送數據很快的話,就會把兩個應用層數據包“粘”在一起,TCP最后只發一個TCP數據包給接收端。
tcp的協議數據不會丟,沒有收完包,下次接收,會繼續上次繼續接收,己端總是在收到ack時才會清除緩沖區內容。數據是可靠的,但是會粘包。
?
反送方:
當應用程序調用send函數時,應用程序會將數據從應用程序拷貝到操作系統緩存,再由操作系統從緩沖區讀取數據并發送出去
接收方:
對方計算機收到數據也是操作系統先收到,至于應用程序何時處理這些數據,操作系統并不清楚,所以同樣需要將數據先存儲到操作系統的緩沖區中,當應用程序調用recv時,實際上是從操作系統緩沖區中將數據拷貝到應用程序的過程
上述過程對于TCP與UDP都是相同的不同之處在于:
UDP:
UDP在收發數據時是基于數據包的,即一個包一個包的發送,包與包之間有著明確的分界,到達對方操作系統緩沖區后也是一個一個獨立的數據包,接收方從操作系統緩沖區中將數據包拷貝到應用程序
這種方式存在的問題:
TCP:
當我們需要傳輸較大的數據,或需要保證數據完整性時,最簡單的方式就是使用TCP協議了,與UDP不同的是,TCP增加了一套校驗規則來保證數據的完整性,會將超過TCP包最大長度的數據拆分為多個TCP包,并在傳輸數據時為每一個TCP數據包指定一個順序號,接收方在收到TCP數據包后按照順序將數據包進行重組,重組后的數據全都是二進制數據,且每次收到的二進制數據之間沒有明顯的分界
基于這種工作機制TCP在三種情況下會發送粘包問題
基礎解決方案:
首先明確只有TCP會出現粘包問題,之所以粘包是因為接收方不知道一次該接收的數據長度,那如何才能讓接收方知道數據的長度呢?
解決方案:在發送數據前先發送數據長度
cmd 服務端:
import socket import subprocess import struct server = socket.socket() server.bind(("127.0.0.1",9090)) server.listen()while True:client,addr = server.accept()while True:try:#接收客戶端命令cmd = client.recv(1024).decode("utf-8")p = subprocess.Popen(cmd,shell=True,stdout=-1,stderr=-1)# data與err_data都是采用的系統編碼,windows是GBKdata = p.stdout.read()err_data = p.stderr.read()print("數據長度:%s" % (len(data) + len(err_data)))#計算數據長度length = len(data) + len(err_data)#將int類型的長度轉成字節len_data = struct.pack("i",length)# 先發送長度,在發真實數據有可能長度數據和真實數據黏在一起,而接收方不知道長度數據的字節數 導致黏包# 解決的方案就是 長度信息占的字節數固定死 整數 轉成一個固定長度字節# 先發送長度給客戶端 client.send(len_data)# 再發送數據給客戶端client.send(data)client.send(err_data)except ConnectionResetError:client.close()print("連接中斷......")breakcmd 客戶端:
import socket import structc = socket.socket() c.connect(("127.0.0.1",9090)) while True:cmd = input(">>:").strip()c.send(cmd.encode("utf-8"))# 先接收長度,長度固定為4個字節length = c.recv(4)# 轉換為整型len_data = struct.unpack("i",length)[0] print("數據長度為%s" % len_data)# 存儲已接收數據all_data = b"" # 已接收長度rcv_size = 0# 循環接收直到接收到的長度等于總長度while rcv_size < len_data:data = c.recv(1024)rcv_size += len(data)all_data += dataprint("接收長度%s" % rcv_size)print(all_data.decode("gbk"))上述方案已經完美解決了粘包問題,但是擴展性不高,例如我們要實現文件上傳下載,不光要傳輸文件數據,還需要傳輸文件名字,md5值等等,如何能實現呢?
解決方案:
發送端:
接收端:
cmd 服務端:
# 要求:不僅返回命令的結果 還要返回執行命令的時間 執行時間:2018/12/26 import socket import subprocess import struct import datetime import jsonserver = socket.socket() server.bind(("127.0.0.1",9090)) server.listen()while True:client,addr = server.accept()while True:try:# 接收命令cmd = client.recv(1024).decode("utf-8")p = subprocess.Popen(cmd,shell=True,stdout=-1,stderr=-1)# data與err_data都是采用的系統編碼,windows是GBKdata = p.stdout.read()err_data = p.stderr.read()print("數據長度:%s" % (len(data) + len(err_data)))# 計算真實數據長度length = len(data) + len(err_data)# 在發送數據之前發送額外的信息#t = "{執行時間:%s 真實數據長度:%s" % (datetime.datetime.now(),length)# 把要發送的數據先存到字典中t = {}t["time"] = str(datetime.datetime.now())t["size"] = lengtht["filename"] = "a.mp4"t_json = json.dumps(t) # 得到json格式字符串t_data = t_json.encode("utf-8") # 將json轉成了字節t_length = struct.pack("i",len(t_data))# 1.先發送額外信息的長度client.send(t_length)# 2.發送額外信息client.send(t_data)# 3.發送真實數據client.send(data)client.send(err_data)except ConnectionResetError:client.close()print("連接中斷......")break# 1.發送了真實數據長度 2.發送了額外信息長度 3.發送額外信息 4.發送真實數據cmd 客戶端:
import socket import struct import jsonc = socket.socket() c.connect(("127.0.0.1",9090)) while True:cmd = input(">>>:")if not cmd:print("命令不能為空")continuec.send(cmd.encode("utf-8"))# 1.接收的是額外信息的長度length = c.recv(4)len_data = struct.unpack("i",length)[0] # 轉換為整型# 2.接收額外信息t_data = c.recv(len_data)print(t_data.decode("utf-8"))json_dic = json.loads(t_data.decode("utf-8"))print("執行時間:%s" % json_dic["time"])data_size = json_dic["size"] # 得到數據長度all_data = b"" # 存儲已接收數據rcv_size = 0 # 已接收長度# 接收真實數據# 循環接收 直到 接收到的長度等于總長度while rcv_size < data_size:data = c.recv(1024)rcv_size += len(data)all_data += dataprint("接收長度%s" % rcv_size)print(all_data.decode("gbk"))文件上傳下載
服務端:
import socket import struct import json server = socket.socket() server.bind(("127.0.0.1",9090)) server.listen() client,addr = server.accept()f = open("接收到的文件",mode="wb")head_len = client.recv(4) json_len = struct.unpack("i",head_len)[0]json_str = client.recv(json_len).decode("utf-8") head = json.loads(json_str) print(head)recv_size = 0 while recv_size < head["size"]:data = client.recv(1024)f.write(data)recv_size += len(data)print("接收完成...")客戶端:
import socket import os import json import struct c = socket.socket() c.connect(("127.0.0.1",9090))filepath= r"F:\測試.mp4" f = open(filepath,mode="rb")# 在發送數據前先發送報頭 head = {"size":os.path.getsize(filepath),"filename":"回顧.mp4"} json_data = json.dumps(head).encode("utf-8")json_len = struct.pack("i",len(json_data)) c.send(json_len) # 發長度 c.send(json_data) # 發報頭# 發數據 while True:data = f.read(1024)if not data:break# 發送給服務器c.send(data)print("上傳完成...")其他實例:
import json,struct #假設通過客戶端上傳1T:1073741824000的文件a.txt#為避免粘包,必須自定制報頭 header={'file_size':1073741824000,'file_name':'/a/b/c/d/e/a.txt','md5':'8f6fbf8347faa4924a76856701edb0f3'} #1T數據,文件路徑和md5值#為了該報頭能傳送,需要序列化并且轉為bytes head_bytes=bytes(json.dumps(header),encoding='utf-8') #序列化并轉成bytes,用于傳輸#為了讓客戶端知道報頭的長度,用struck將報頭長度這個數字轉成固定長度:4個字節 head_len_bytes=struct.pack('i',len(head_bytes)) #這4個字節里只包含了一個數字,該數字是報頭的長度#客戶端開始發送 conn.send(head_len_bytes) #先發報頭的長度,4個bytes conn.send(head_bytes) #再發報頭的字節格式 conn.sendall(文件內容) #然后發真實內容的字節格式#服務端開始接收 head_len_bytes=s.recv(4) #先收報頭4個bytes,得到報頭長度的字節格式 x=struct.unpack('i',head_len_bytes)[0] #提取報頭的長度head_bytes=s.recv(x) #按照報頭長度x,收取報頭的bytes格式 header=json.loads(json.dumps(header)) #提取報頭#最后根據報頭的內容提取真實的數據,比如 real_data_len=s.recv(header['file_size']) s.recv(real_data_len)?
總結
以上是生活随笔為你收集整理的Python3之socket编程(TCP/UDP,粘包问题,数据传输、文件上传)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 解决挖矿病毒(定时任务、计划任务、系统定
- 下一篇: C# 分割字符串