Beautiful Soup 库
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库,最主要的功能是从网页抓取数据。
一、安装
目前最常用的版本是Beautiful Soup 4,也就是 bs4 ,所以在导入时 import bs4
就是在导入Beautiful Soup 4。
本次的详细教程是以windows操作系统为例,结尾有其他系统的简单教程
安装该库有两种方法,一种是在命令窗口通过 pip
直接安装,另一种是下载安装包来进行安装。
1.通过 pip
安装
- 在windows任务栏的搜索框输入cmd打开命令窗口(右键管理员方式打开)
- 输入命令
pip install beautifulsoup4
,回车,等待安装完成即可。
如下图所示:
2. 下载安装包安装
- 官方下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/
点击链接,如上图。这里有 BeautifulSoup 4 所有版本的安装包,根据需要选择下载,这里推荐目前最新版 4.9 。
点击红色框链接下载。 - 下载完成后解压安装包,在windows任务栏的搜索框输入Windows PowerShell,以管理员身份进入。
输入cd d:\python\beautifulsoup4-4.9.0
命令,即安装包文件的位置,这里演示的是我自己的路径。具体输入你安装的实际位置。
回车之后输入python setup.py install
再回车就会自动安装。
二、验证
上述方式安装完成之后,在你的python执行终端,或者是编辑器里输入
from bs4 import BeautifulSoup #注意大小写
如果编辑器没有报错,说明安装成功。
注:不管是 pip安装,还是安装包下载,都需要联网。
三、其它系统安装方式(Linux 和 Mac)
1. Linux 系统基本安装方法
在系统的命令窗口输入
$sudo apt-get install python-bs4
2. Mac 系统基本安装方法
在系统的命令窗口输入
$sudo easy_install pip
安装 Python 的包管理器 pip,然后运行
$pip install beautifulsoup4
来安装库文件。
另外,注意如果你的设备同时安装了 Python 2.x 和 Python 3.x,你需要用 python3 运行
Python 3.x:
$python3 myScript.py
当你安装包的时候,如果有可能安装到了 Python 2.x 而不是 Python 3.x 里,就需要使用:
$sudo python3 setup.py install
如果用 pip 安装,你还可以用 pip3 安装 Python 3.x 版本的包:
$pip3 install beautifulsoup4
注: Linux和mac操作系统的安装方式我没有亲测过,这里参考自一本经典畅销的爬虫学习书,如有顾虑,请谨慎。
相关链接
Beautiful Soup 官网:
https://www.crummy.com/software/BeautifulSoup/
Beautiful Soup 英文教程:
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#
Beautiful Soup 中文教程:
http://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
转载:https://blog.csdn.net/weixin_44880296/article/details/105990022