스파크와 팬더에 대한 멍청한 질문이 있습니다. 팬더, numpy 등을 사용하고 싶습니다. spark가 있지만 lib를 가져올 때 오류가 있습니다. PLZ 도와 줄 수있어?스파크와 팬더 사용
ImportError: No module named pandas
어떻게 사용할 수 팬더 : 이이 오류 내 코드
from pyspark import SparkContext, SQLContext
from pyspark import SparkConf
import pandas
# Config
conf = SparkConf().setAppName("Script")
sc = SparkContext(conf=conf)
log4j = sc._jvm.org.apache.log4j
log4j.LogManager.getRootLogger().setLevel(log4j.Level.ERROR)
sqlCtx = SQLContext(sc)
# Importation of csv out of HDFS
data_name = "file_on_hdfs.csv"
data_textfile = sc.textFile(data_name)
입니까? 로컬 모드가 아닙니다.
그것은 가져 오거나 설치하거나 스파크 제출로 패키지를 밀어 가능? – Zop
패키지는'pyspark' 서버 측에서 사용할 수 있어야합니다. 'spark-submit'은 의존성 (dependencies), 라이브러리 등이 아닌 스크립트 만 전송합니다. – rtkaleta