2017-02-11 3 views
1

tableau의 언더 레이 데이터 세트에서 일부 데이터를 csv로 내 보냅니다. 내가 less으로 볼 때, 그것이 말하는 그것이 may be a binary file. See it anyway? 그러나Tableau CSV를 스파크로 가져 오기

, 내가 할 때

cat file.csv | cut -d ',' -f 1

가 첫 번째 필드를 출력하지 않지만 그것은 (사람이 읽을 수있는 데이터를 보여 주지만, 전체 라인).

그래서와 불꽃이 그것을로드하려고 :

data = sqlContext.read.csv("file.csv") 
data.show(5) 

그리고 내가 얻을 :이되어 이진 파일의 밖으로 dataframe을 할 수있는 방법

+--------------------+ 
|     _c0| 
+--------------------+ 
|��Cluster ...| 
+--------------------+ 

어떤 생각을?

+0

이 링크의 방법을 사용하여 tableu의 데이터를 CSV로 전문가에게 시험해보십시오. http://www.vizwiz.com/2014/03/the-greatest-tableau-tip-ever-exporting.html -받을 수 있습니까? 이제 읽을 수있는 CSV를? – Yaron

답변

1

결국 UTF-16 텍스트 파일이었을 것입니다. 그래서 내가 사용했다

iconv -f UTF-16 -t UTF-8//TRANSLIT file.csv > file-utf8.csv 

utf-8/ascii로 파일을 변환하고 변환 된 파일을 잘로드했습니다.