Hadoop 2.7.3 Streaming Jar无效

我对Hadoop非常陌生,并试图使用this运行一个简单的程序。Hadoop 2.7.3 Streaming Jar无效

我抄本地实例数据HDFS,但在我的地图缩小,当我运行此命令按照Apache官方文档

hadoop jar hadoop-streaming-2.7.3.jar \ 

-input /user/hduser/gutenberg/* \

-output /user/hduser/gutenberg-output \

-mapper /home/hduser/mapper.py \

-reducer /home/hduser/reducer.py

我收到此错误

工作不是有效的JAR:/usr/lib/hadoop-streaming-2.7.3.jar

请尽量帮助我。

回答:

它正在使用Hadoop 2.7.3

以下是你需要运行

[Linux的] $ Hadoop的罐子在/ usr /本地/ Hadoop的/股/ Hadoop的/ tools/lib目录/ Hadoop的命令-streaming-2.7.3.jar -file /home/python/mapper.py /home/python/reducer.py -mapper“python mapper.py”-reducer“python reducer1.py”-input/tmp/word_i -output/tmp/word_output

以上是 Hadoop 2.7.3 Streaming Jar无效 的全部内容, 来源链接: utcz.com/qa/263133.html

回到顶部