Spark运行出现no mudule named 'py4j'

it2022-05-06  14

记录一下,第一篇! 在学习厦门大学数据库实验室的spark教程 “Spark2.1.0+入门:第一个Spark应用程序:WordCount(Python版) 链接:http://dblab.xmu.edu.cn/blog/1692-2/ ” 过程中,运行 python3 ./test.py 文件时出现了“no mudule named ‘py4j’” 错误。 发现是因为原文使用的spark版本为2.1.0,而我安装的是2.4.3版本。原文在安装spark配置环境变量时(如下图):

py4j版本如图为0.10.4,而我使用的spark 2.4.3对应的版本为 0.10.7(好像是,有点忘记了),将py4j改成spark对应的版本就好了,将图中py4j-0.10.4改成py4j-0.10.7即可。


最新回复(0)