fetch_20newsgroups 数据集导入失败

1、可以尝试直接从网站*( http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz)上下载,然后在放入C:\Users\(你的user_name)\scikit_learn_data\20news_home目录下;

2、Python下载的文件叫20new-sbydate.tar.gz,自己下载的叫20newsbydate.tar.gz,所以需要改文件名字;

3、Python安装文件夹中找到文件 twenty_newsgroups.py打开;

4、

上红框是下载文件的部分, 下红框是解压文件的部分

So, 我们只需要将上红框注释掉, 并加入文件地址即可

如图:

 5、修改完成后,在执行自己写的代码,可能会出现以下错误:

EOFError: Compressed file ended before the end-of-stream marker was reached

此时再注释掉下红框的代码即可。

-----------------------------------------------------------------------------

注:文章参考https://segmentfault.com/a/1190000016498146,希望能帮助正在学习Python机器学习的同学。

以上是 fetch_20newsgroups 数据集导入失败 的全部内容, 来源链接: utcz.com/a/54293.html

回到顶部