0
sc = pyspark.SparkContext()
sqlCxt = SQLContext(sc)
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item")
오류를 사용하여 dataframe에 CSV 파일을로드 할 때 오류가 발생 : 나는 버전 2.2.0에 스파크를 업데이트 할 때Jupyter 노트북을
ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))
이 오류는 pyspark와는 관련이 없습니다. 파일에 따옴표, 아포스트로피 또는 다른 것이 없습니다. 오류 메시지에 주어진 줄 번호를 확인하십시오. – ashwinids
이것은 csv 문제처럼 보이지 않습니다. 더미 csv를 만든 후에도 사용하면 동일한 오류가 발생합니다. –
위의 오류를 생성하는 최소 가능한 더미 CSV 파일의 내용을 공유 할 수 있습니까? – ashwinids