前言
嗨喽~大家好呀,这里是魔王呐 ❤ ~!

 本次网站:

本文所有模块\环境\源码\教程皆可点击文章下方名片获取此处跳转
开发环境:
-  python 3.8 运行代码 
-  pycharm 2022.3 辅助敲代码 
模块使用:
-  import parsel >>> pip install parsel 
-  import requests >>> pip install requests 
如何安装python第三方模块:
-  win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车 
-  在pycharm中点击Terminal(终端) 输入安装命令 
代码展示
导入模块
import requests
import parsel
采集多页
for page in range(1, 2953):
请求链接
    url = f'http://www.****.cn/{
     page}.html'
发送请求
    response = requests.get(url=url)
解决乱码
    response.encoding = 'gb2312'
打印数据
    html_data = response.text

解析数据
    select = parsel.Selector(html_data)
    trs = select.css('#main > div.containerbox.boxindex > div.layui-row.layui-col-space15 > div > table tr')
    for tr in trs[1:]:
        ip = tr.css('td::text').getall()[0]
        port = tr.css('td::text').getall()[1]

保存数据
        text = 'IP地址:'+ip+'-----port端口号:'+port+'\n'
        open('ip.txt', mode='a', encoding='utf-8').write(text)

 
尾语 💝
要成功,先发疯,下定决心往前冲!
学习是需要长期坚持的,一步一个脚印地走向未来!
未来的你一定会感谢今天学习的你。
—— 心灵鸡汤
本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦 😝

转载:https://blog.csdn.net/python56123/article/details/129207501
查看评论
					