python 能被称作最方便的语言不是没有道理的它的第三方库功能强大到毁天灭地(开个玩笑)
下面就介绍几个特别好用的第三方库给大家提个方向,想详细研究的小伙伴可以到官网查查那么开始。
网络爬虫
•requests[1] 最好用、最简单的网络爬虫访问库
•BeautifulSoup[2] 最简单的网页解析库
•pyquery[3] 最简洁网页解析库
•scrapy[4] 最流行的爬虫框架
•pyspider[5] 国人开发的爬虫框架
•selenium[6] 浏览器自动化框架,可以用于爬虫反爬
•scylla[7] 智能IP代理池,用于反爬
•shreport[8] 上海证券交易所上市公司定期报告下载
•newspaper[9] 新闻爬虫库,根据提供的url可以抽取出新闻标题、作者、关键词、总结,部分功能支持中文
数据库
•PyMySQL[10]
•Sqlite3[11] 轻量级sql数据库(python内置库)
•pymongo[12] 非关系型MongoDB库
•redis 缓存数据库
数据分析
•pandas[13] 必须Python数据分析库,读取文件、预处理数据、分析、存储
•modin[14] pandas加速库,接口语法与pandas高度一致
•dask[15] pandas加速库,接口语法与pandas高度一致
•plydata[16] pandas管道语法库
•networkx[17] 社交网络分析库
机器学习
•scikit-learn[18] 机器学习必学库,支持有监督、无监督多种算法,含文本分析功能
•Orange3[19] 点击操作的机器学习分析软件, 可文本分析
•doccano[20] 文本数据标注工具
•label-studio[21] 最牛掰的文本数据标注工具
可视化
•matplotlib[22] Python中最万能绘图库,很少有ta画不出来的图;但语法较难、静态图
•seaborn[23] 基于matplotlib开发的简化版可视化库, 一般的图可以用ta绘制;高度定制仍需要结合matplotlib进行样式定制;静态图
•plotnine[24] ggplot2语法的Python可视化库, 可与plydata[25] 库结合使用
•pyecharts[26] 国人开发并封装的动态可视化图绘制库; 中文文档
•plotly[27] 动态可视化图绘制库
•bokeh[28] 动态可视化图绘制库
•SciencePlots[29] 科研论文绘图,基于matplotlib
•datapane[30] 数据分析报告生成
•superset[31] 开源商务智能分析可视化库
文本分析
•nltk[32] 自然语言分析套件,对中文不友好
•spacy[33] 工业级自然语言模型库,支持中文
•pattern[34] 自然语言处理、网络分析、可视化库
•jieba[35] 中文文本分词库
•snownlp[36] 中文情感分析库
•gensim[37] 最好用、最全的话题模型
•cnsenti[38] 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、情感分析。
•label-studio[39] 最牛掰的文本数据标注工具
•doccano[40] 文本数据标注工具
•textstat[41] 文本可读性计算包(算法全,但仅支持英文)
•texthero[42] 文本预处理、展示、可视化库,仅支持英文
GUI窗体软件开发
•tkinter[43] Python内置的gui库
•PySimpleGUI[44] 最简单的gui开发库
•pyqt5、pyside[45] 最牛掰的gui软件开发库
自动化办公
•zmail[46] 自动化收发邮件管理库
•pywinauto[47] Windows电脑自动化Python库
•WeasyPrint[48] 自动化生产pdf报告
•selenium[49] 浏览器自动化框架,可以自动化点击浏览器,完成某些工作
•mkdocx[50]
•python-docx[51] 创建、修改docx文件库
•python-ppt[52] 创建、修改ppt文件库
•openpyxl[53] xlsx文件库
转载:https://blog.csdn.net/jiahuiandxuehui/article/details/116070316