newsgroups数据集下载,机器学习必用
立即下载
资源介绍:
20newsgroups数据集下载,机器学习必用,不需要连外网使用。下载数据集后需要修改代码才能使用。
使用方法:
找到D:\software-1\anaconda\Lib\site-packages\sklearn\datasets\_twenty_newsgroups.py下的_twenty_newsgroups.py文件,找到函数_download_20newsgroups,注释#logger.info("Downloading dataset from %s (14 MB)", ARCHIVE.url)和 # archive_path = _fetch_remote(ARCHIVE, dirname=target_dir),新增archive_path = os.path.join(target_dir, r'20news-bydate.tar.gz')
资源文件列表:
20Newsgroups dataset.zip 大约有18890个文件