小言_互联网的博客

爬虫(六十三)socket编程(五十四)

322人阅读  评论(0)

socket是基于C/S架构的,也就是说进行socket网络编程,通常需要编写两个py文件,一个服务端,一个客户端。

首先,导入Python中的socket模块:import socket

Python中的socket通信逻辑如下图所示(图片来自网络):

这张逻辑图,是整个socket编程中的重点的重点,你必须将它理解、吃透,然后刻在脑海里,真正成为自己记忆的一部分!很多人说怎么都学不会socket编程,归根到底的原因就是没有“死记硬背”知识点。


在Python中,import socket后,用socket.socket()方法来创建套接字,语法格式如下:

sk = socket.socket([family[, type[, proto]]])

参数说明:

  • family: 套接字家族,可以使AF_UNIX或者AF_INET

  • type: 套接字类型,根据是面向连接的还是非连接分为SOCK_STREAMSOCK_DGRAM,也就是TCP和UDP的区别。

  • protocol: 一般不填默认为0。

直接socket.socket(),则全部使用默认值。

下面是具体的参数定义:

socket类型 描述
socket.AF_UNIX 只能够用于单一的Unix系统进程间通信
socket.AF_INET IPv4
socket.AF_INET6 IPv6
socket.SOCK_STREAM 流式socket , for TCP
socket.SOCK_DGRAM 数据报式socket , for UDP
socket.SOCK_RAW 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。
socket.SOCK_SEQPACKET 可靠的连续数据包服务
创建TCP Socket: s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
创建UDP Socket: s=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

通过s = socket.socket()方法,我们可以获得一个socket对象s,也就是通常说的获取了一个“套接字”,该对象具有一下方法:

方法 描述
服务器端方法
s.bind() 绑定地址(host,port)到套接字,在AF_INET下,以元组(host,port)的形式表示地址。
s.listen(backlog) 开始监听。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。
s.accept() 被动接受客户端连接,(阻塞式)等待连接的到来,并返回(conn,address)二元元组,其中conn是一个通信对象,可以用来接收和发送数据。address是连接客户端的地址。
客户端方法
s.connect(address) 客户端向服务端发起连接。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
s.connect_ex() connect()函数的扩展版本,出错时返回出错码,而不是抛出异常
公共方法
s.recv(bufsize) 接收数据,数据以bytes类型返回,bufsize指定要接收的最大数据量。
s.send() 发送数据。返回值是要发送的字节数量。
s.sendall() 完整发送数据。将数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
s.recvform() 接收UDP数据,与recv()类似,但返回值是(data,address)。其中data是包含接收的数据,address是发送数据的套接字地址。
s.sendto(data,address) 发送UDP数据,将数据data发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。
s.close() 关闭套接字,必须执行。
s.getpeername() 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
s.getsockname() 返回套接字自己的地址。通常是一个元组(ipaddr,port)
s.setsockopt(level,optname,value) 设置给定套接字选项的值。
s.getsockopt(level,optname[.buflen]) 返回套接字选项的值。
s.settimeout(timeout) 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect())
s.gettimeout() 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。
s.fileno() 返回套接字的文件描述符。
s.setblocking(flag) 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。
s.makefile() 创建一个与该套接字相关连的文件

注意事项:

  1. Python3以后,socket传递的都是bytes类型的数据,字符串需要先转换一下,string.encode()即可;另一端接收到的bytes数据想转换成字符串,只要bytes.decode()一下就可以。

  2. 在正常通信时,accept()recv()方法都是阻塞的。所谓的阻塞,指的是程序会暂停在那,一直等到有数据过来。

socket编程思路:

服务端:

  1. 创建套接字,绑定套接字到本地IP与端口:socket.socket(socket.AF_INET,socket.SOCK_STREAM) , s.bind()

  2. 开始监听连接:s.listen()

  3. 进入循环,不断接受客户端的连接请求:s.accept()

  4. 接收传来的数据,或者发送数据给对方:s.recv() , s.sendall()

  5. 传输完毕后,关闭套接字:s.close()

客户端:

  1. 创建套接字,连接服务器地址:socket.socket(socket.AF_INET,socket.SOCK_STREAM) , s.connect()

  2. 连接后发送数据和接收数据:s.sendall(), s.recv()

  3. 传输完毕后,关闭套接字:s.close()

Python的socket编程,通常可分为TCP和UDP编程两种,前者是带连接的可靠传输服务,每次通信都要握手,结束传输也要挥手,数据会被检验,是使用最广的通用模式;后者是不带连接的传输服务,简单粗暴,不加控制和检查的一股脑将数据发送出去的方式,但是传输速度快,通常用于安全和可靠等级不高的业务场景,比如文件下载。

TCP编程

服务器端:


   
  1. #!/usr/bin/env python
  2. # -*- coding:utf-8 -*-
  3. import socket
  4. ip_port = ( '127.0.0.1', 9999)
  5. sk = socket.socket() # 创建套接字
  6. sk.bind(ip_port) # 绑定服务地址
  7. sk.listen( 5) # 监听连接请求
  8. print( '启动socket服务,等待客户端连接...')
  9. conn, address = sk.accept() # 等待连接,此处自动阻塞
  10. while True: # 一个死循环,直到客户端发送‘exit’的信号,才关闭连接
  11. client_data = conn.recv( 1024).decode() # 接收信息
  12. if client_data == "exit": # 判断是否退出连接
  13. exit( "通信结束")
  14. print( "来自%s的客户端向你发来信息:%s" % (address, client_data))
  15. conn.sendall( '服务器已经收到你的信息'.encode()) # 回馈信息给客户端
  16. conn.close() # 关闭连接

客户端:


   
  1. #!/usr/bin/env python
  2. # -*- coding:utf-8 -*-
  3. import socket
  4. ip_port = ( '127.0.0.1', 9999)
  5. s = socket.socket() # 创建套接字
  6. s.connect(ip_port) # 连接服务器
  7. while True: # 通过一个死循环不断接收用户输入,并发送给服务器
  8. inp = input( "请输入要发送的信息:").strip()
  9. if not inp: # 防止输入空信息,导致异常退出
  10. continue
  11. s.sendall(inp.encode())
  12. if inp == "exit": # 如果输入的是‘exit’,表示断开连接
  13. print( "结束通信!")
  14. break
  15. server_reply = s.recv( 1024).decode()
  16. print(server_reply)
  17. s.close() # 关闭连接

上面这个例子,基本能够展示出socket通信的机制。套接字的创建和关闭,服务器的绑定和监听,客户端的连接,这些都是固定套路,没什么难点。关键之处在于循环内部的收发逻辑,这里才是重点,需要根据你自己的业务需求,正确编写。这个过程中,一定要注意,收发是一一对应的,有发就要有收,并且recv()方法默认是阻塞的。

大家可以在自己的环境中测试上面的例子,并加入更多的内容,不断地进行尝试。然而试过之后,你们会发现,虽然服务器和客户端在一对一的情况下,工作良好,但是,如果有多个客户端同时连接同一个服务器呢?结果可能不太令人满意,因为服务器无法同时对多个客户端提供服务。为什么会这样呢?因为Python的socket模块,默认情况下创建的是单进程单线程,同时只能处理一个连接请求,如果要实现多用户服务,那么需要使用多线程机制。

下面我们使用Python内置的threading模块,配合socket模块创建多线程服务器。客户端的代码不需要修改,可以继续使用。


   
  1. #!/usr/bin/env python
  2. # -*- coding:utf-8 -*-
  3. import socket
  4. import threading # 导入线程模块
  5. def link_handler(link, client):
  6. "" "
  7. 该函数为线程需要执行的函数,负责具体的服务器和客户端之间的通信工作
  8. :param link: 当前线程处理的连接
  9. :param client: 客户端ip和端口信息,一个二元元组
  10. :return: None
  11. " ""
  12. print( "服务器开始接收来自[%s:%s]的请求...." % (client[ 0], client[ 1]))
  13. while True: # 利用一个死循环,保持和客户端的通信状态
  14. client_data = link.recv( 1024).decode()
  15. if client_data == "exit":
  16. print( "结束与[%s:%s]的通信..." % (client[ 0], client[ 1]))
  17. break
  18. print( "来自[%s:%s]的客户端向你发来信息:%s" % (client[ 0], client[ 1], client_data))
  19. link.sendall( '服务器已经收到你的信息'.encode())
  20. link.close()
  21. ip_port = ( '127.0.0.1', 9999)
  22. sk = socket.socket() # 创建套接字
  23. sk.bind(ip_port) # 绑定服务地址
  24. sk.listen( 5) # 监听连接请求
  25. print( '启动socket服务,等待客户端连接...')
  26. while True: # 一个死循环,不断的接受客户端发来的连接请求
  27. conn, address = sk.accept() # 等待连接,此处自动阻塞
  28. # 每当有新的连接过来,自动创建一个新的线程,
  29. # 并将连接对象和访问者的ip信息作为参数传递给线程的执行函数
  30. t = threading.Thread(target=link_handler, args=(conn, address))
  31. t.start()

启动这个多线程服务器,然后多运行几个客户端,可以很明显地看到,服务器能够同时与多个客户端通信,基本达到我们的目的。

UDP编程:

相对TCP编程,UDP编程就简单多了,当然可靠性和安全性也差很多。由于UDP没有握手和挥手的过程,因此accept()和connect()方法都不需要。下面是一个简单的例子:


   
  1. # 服务端
  2. import socket
  3. ip_port = ( '127.0.0.1', 9999)
  4. sk = socket.socket(socket.AF_INET, socket.SOCK_DGRAM, 0)
  5. sk.bind(ip_port)
  6. while True:
  7. data = sk.recv( 1024).strip().decode()
  8. print(data)
  9. if data == "exit":
  10. print( "客户端主动断开连接!")
  11. break
  12. sk.close()
  13. # 客户端
  14. import socket
  15. ip_port = ( '127.0.0.1', 9999)
  16. sk = socket.socket(socket.AF_INET, socket.SOCK_DGRAM, 0)
  17. while True:
  18. inp = input( '发送的消息:').strip()
  19. sk.sendto(inp.encode(), ip_port)
  20. if inp == 'exit':
  21. break
  22. sk.close()

请继续关注我

记得点赞加关注哦,记得加鸡腿啊


转载:https://blog.csdn.net/qq_36772866/article/details/104509494
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场