fetch_20newsgroups 数据集导入失败
1、可以尝试直接从网站*( http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz)上下载,然后在放入C:\Users\(你的user_name)\scikit_learn_data\20news_home目录下;
2、Python下载的文件叫20new-sbydate.tar.gz,自己下载的叫20newsbydate.tar.gz,所以需要改文件名字;
3、Python安装文件夹中找到文件 twenty_newsgroups.py打开;
4、
上红框是下载文件的部分, 下红框是解压文件的部分
So, 我们只需要将上红框注释掉, 并加入文件地址即可
如图:
5、修改完成后,在执行自己写的代码,可能会出现以下错误:
EOFError: Compressed file ended before the end-of-stream marker was reached
此时再注释掉下红框的代码即可。
-----------------------------------------------------------------------------
注:文章参考https://segmentfault.com/a/1190000016498146,希望能帮助正在学习Python机器学习的同学。
以上是 fetch_20newsgroups 数据集导入失败 的全部内容, 来源链接: utcz.com/a/54293.html