分类数据:实验用到的水果数据集由爱丁堡大学教授 Iain Murray 所
创。他买了很多种类的橙子、柠檬和苹果,并把它们的相关数据记录
在表格中。然后密歇根大学的一些学者将这些水果数据编排了格式,
数据已经提供,见附件。
微信提示:由于 python 版本差异问题,前两个实验如果没发运行,
把 lxml 改成 html
五、实验步骤[或实验参考代码]
1.文本下载
import requests
from bs4 import BeautifulSoup
if __name__ == '__main__':
target =
'https://www.cnr.cn/dj/rwft/20230629/t20230629_526308291.shtml'
req = requests.get(url=target)
req.encoding='gb2312'
html = req.text
bf = BeautifulSoup(html,'lxml')
##使用 find_all 方法,获取 html 信息中所有 class 属性为 showtxt
的 div 标签
##find_all 的第一个参数是获取的标签名,第二个参数 class_是
标签属性
##class 在 Python 中是关键字,所以用 class_标识 class 属性,,避