2017-09-27 6 views
0
sc = pyspark.SparkContext() 
sqlCxt = SQLContext(sc) 
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item") 

오류를 사용하여 dataframe에 CSV 파일을로드 할 때 오류가 발생 : 나는 버전 2.2.0에 스파크를 업데이트 할 때Jupyter 노트북을

ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))

+0

이 오류는 pyspark와는 관련이 없습니다. 파일에 따옴표, 아포스트로피 또는 다른 것이 없습니다. 오류 메시지에 주어진 줄 번호를 확인하십시오. – ashwinids

+0

이것은 csv 문제처럼 보이지 않습니다. 더미 csv를 만든 후에도 사용하면 동일한 오류가 발생합니다. –

+0

위의 오류를 생성하는 최소 가능한 더미 CSV 파일의 내용을 공유 할 수 있습니까? – ashwinids

답변

0

문제가 해결되었다.

Python 3.6은 Spark v2.2.0과 호환됩니다.

관련 문제