首页 星云 工具 资源 星选 资讯 热门工具
:

PDF转图片 完全免费 小红书视频下载 无水印 抖音视频下载 无水印 数字星空

图片自动下载器-单线程增量式爬虫

网络技术 18.38MB 13 需要积分: 1
立即下载

资源介绍:

程序名称:ImageSpider 程序介绍: ImageSpider是一款网络图片爬取工具,它可以根据用户键入的关键词和数量自动检索并下载网络图片。用户只需输入想要搜索的图片关键词和希望下载的数量,ImageSpider就会自动开始工作,将相关图片下载到本地。 ImageSpider还提供了增量爬取的选择。如果用户选择增量爬取,那么在每次运行程序时,它只会下载新的、未被下载过的图片,而不会重复下载已经存在的图片。这对于需要定期更新图片库的用户来说非常有用。 使用场景: ImageSpider适用于各种需要自动化检索与下载网络图片的场景。例如,网站管理员可以使用它来自动更新网站上的图片库;设计师可以使用它来寻找灵感和素材;研究人员可以使用它来收集特定主题的图片数据等。无论是个人用户还是企业用户,都可以从ImageSpider的强大功能中受益。
# ImageSpider 说明文档 ## 一、程序简介 >ImageSpider是一个自动化下载公网图片的单线程增量式爬虫程序 ## 二、程序概述 >1. 开发环境: python3.8 >2. IDE: Pycharm 2024.1 >3. 项目作者: 2578713815@qq.com >4. 程序最后更新时间:2024.8.5 23:42 >5. 文档最后修改时间: 2024.8.5 23:50 ## 三、功能特点 >1. 收集用户键入关键词和需要的图片数量 >2. 按照键入信息下载图片 >3. 下载的图片序列号将会被记录在LOG.TXT文件中,并作为下一次同名关键词下载的重复性依据,确保不会下载重复图片 >4. 可以手动选择是否开启增量爬取 ## 四、安装与使用 ### 4.1 安装 >1. 绿色应用, 无需安装; >2. 将本程序压缩包解压,确保所有文件都不缺失; ### 4.2 使用 >1. 首先确保网络连接稳定, 可以正常访问'https://images.baidu.com/' >2. 双击程序(ImageSpider.exe)即可开始使用; > 例子: >1. 输入关键词:aaa,输入图片数量:5; >2. 若是第一次搜索aaa,则等待程序运行完成即可; >3. 若不是第一次搜索aaa, 则根据SETTINGS.json文件中的增量开关来决定是否使用增量式爬取; > 设置增量式开关: >> 用记事本打开 SETTINGS.json 修改"incrementalSwitch"的键值; > >> {"incrementalSwitch": 1} --> 增量式爬取; > >> {"incrementalSwitch": 0} --> 非增量爬取 ; ### 4.3 格式转换 > 1. 本程序默认下载JPEG格式文件; > 2. 若需要转换格式,请使用 formatConversion文件夹 下的 formatConversion.exe 进行图像格式转化; > 3. 目前支持转化的格式(其他格式暂未测试,不保证能成功转化): >> ·JPEG,WEBP,PNG,TIFF之间的相互转化 >> >> ·JPEG->ICON > > 4. `formatConversion/formatConversion.exe`: 图片格式转换工具--将需要转换的图片放在`formatConversion/OriginalImage` 文件夹下,再启动`formatConversion/formatConversion.exe`即可; ## 五、注意事项 >1. 本程序仅供学习和研究使用,请勿用于非法或商业用途; >2. 本程序版权与最终解释权归作者所有; >3. 使用时如果出现报毒,忽略即可(数字证书是自己做的,没钱买😅😅😅) >4. 如有问题,请联系作者(邮箱:2878713815@qq.com); >5. 作者QQ:2878713815; >6. 作者v:z18256956639; >7. 交流群(QQ):897871645; ## 六、版本更新记录 >1. 版本号说明: 主版本号.次版本号.修订版本号.类型(0-测试开发, 1-稳定发布) >2. 项目创建;| 2024.7.4 >3. 版本0.0.0.0~1.0.0.0;| 2024.7.6 >4. 版本2.0.0.0 将之前的代码完全重构,优化效率和稳定性,删除冗余功能, 将多线程爬取改为单线程;| 2024.7.16 22:54 >5. 版本2.1.0.0 增加设置文件,内置增量式开关,可以在程序外设置是否开启增量爬取;| 2024.8.5 23:50 ## 七、开发者记录 > `json.loads(data, encoding='utf-8')` 在python3.9及以后的版本中,`encoding`参数被移除 > `json.loads`和`json.dumps`将默认采用`utf-8`编码, 若要转码, 需要在dumps后使用对应的格式转换, 例如 > ```python > import json > data = {0:"a", 1:"b"} > json_str = json.dumps(data) # 将字典转换成json字符串 > > utf8_str = json_str.encode('utf-8') # 将json字符串转换成utf-8字节串 > gbk_str = utf8_str.decode('utf-8').encode('gbk') # 先将utf-8字节串解码, 再编码成gbk字节串 > ``` > json.loads: 将json字符串解析为python对象(字典) > json.dumps: 将python对象(字典)转换成json字符串 > `re.sub(r'[\U0001F600-\U0001F64F\U0001F300-\U0001F5FF\U0001F680-\U0001F6FF\U0001F1E0-\U0001F1FF]', '', html_text)` > 抓取到的json数据中可能会出现emoji表情符号, 这段代码用于删去这些符号, 避免接下来用json.loads转换时的编码报错 > 发现主程序在虚拟环境中打包的exe文件在运行时,会出现无法解析json数据的情况(报错点 line 169),暂未找到原因

资源文件列表:

imageSpader2.1.0.zip 大约有5个文件
  1. imageSpader/formateConversion/
  2. imageSpader/formateConversion/formatConversion.exe 8.29MB
  3. imageSpader/ImageSpider.exe 10.6MB
  4. imageSpader/ReadMe.md 3.91KB
  5. imageSpader/SETTINGS.json 32B
0评论
提交 加载更多评论
其他资源 java基于BS结构下的OA流程可视化的研究与实现(源代码+论文).zip
这是“java 基于 BS 结构下的 OA 流程可视化的研究与实现(源代码+论文)”,仅供学习参考, 请勿商用。
java基于BS结构下的OA流程可视化的研究与实现(源代码+论文).zip
JAVA基于J2ME的手机游戏开发(论文+源代码).zip
这是“JAVA 基于 J2ME 的手机游戏开发(论文+源代码)”,仅供学习参考,请勿商用。
code-verification.zip
WordPress原创插件:Code-verification 微信或QQ二维码验证引导关注
code-verification.zip
mongodb-linux-x86-64-rhel70-4.0.9.tgz
mongodb-linux
井字棋小游戏,内含mitsuko.h mitsuko.lib两个文件
井字棋小游戏,需要vs2022环境,压缩包里是头文件和静态库,下载后需要自己链接,需要帮忙三连关注私聊我,网上也有资料
Axure RP 9 原型设计软件
Axure RP_9.0.0.3701_Pro
设计模式-Java单例模式的各种实现实例
单例模式(Singleton Pattern)是一种常用的软件设计模式,它保证一个类仅有一个实例,并提供一个访问该实例的全局访问点。这种模式通常用于需要频繁地创建和销毁的对象,以减少系统性能开销。 单例模式的优点: 对于频繁使用的对象,可以缩减系统的开销,特别是当对象需要频繁地进行销毁和创建时,单例模式无疑能提供更好的性能。 单例模式具有一定的“防并发作用”,由于单例模式只生成一次实例化对象,可以减少系统内存的开销,特别是对于多线程单例,即可以在系统启动时完成实例化,避免对资源的重复占用。 单例模式可以作为程序中的“全局锁”,方便控制并发。
斯坦福cs229课程笔记小抄
斯坦福大学著名的cs229机器学习课程可谓无人不知无人不晓,但其丰富庞杂的内容有时候也令人望而却步。 资源里整理了全课程中最重要的概念重点,做成了高度凝练的笔记小抄,一方面可以作为学习者的快速复习资料,另一方面也方便那些没有时间深入了解课程但希望快速掌握核心知识点的专业人士。这份笔记小抄涵盖了以下几个方面: 基础概念:包括机器学习的定义、分类、以及监督学习、无监督学习、强化学习等基本类型。 主要算法:从线性回归、逻辑回归到决策树、随机森林,再到支持向量机和神经网络,每个算法的原理、优缺点和应用场景都进行了简要介绍。 模型评估:介绍了交叉验证、偏差-方差权衡、ROC曲线等模型评估方法,帮助学习者理解如何评估和选择模型。 优化技术:包括梯度下降、随机梯度下降等优化算法,以及正则化技术在防止过拟合中的应用。 特征工程:讨论了特征选择、特征提取和特征构造等关键步骤,以及它们在提高模型性能中的作用。 深度学习:特别强调了深度学习的重要性,包括卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)等高级模型。
斯坦福cs229课程笔记小抄 斯坦福cs229课程笔记小抄 斯坦福cs229课程笔记小抄