2017-05-10 1 views

답변

3

하자 bash 그것을

hdfs dfs -cat /file/on/hdfs | head -15 > tmp ; file -i tmp ; rm tmp 

parquet 등이 얻을 것이다 :

tmp: application/octet-stream; charset=binary 
+0

@dev을 ツ'TMP : 텍스트 일반; charset = ascii' 나는 TXT 파일을 가지고있다. 중요한 것은 아니지만 어떤 버전을 사용하고 있습니까? – philantrovert

+0

텍스트 데이터가있는 작업 벌금, 또는 구분 기호로 탭. 그러나 내 텍스트 데이터는 ** CTRL^A ** (기본 하이브 구분 기호 _)에 의해 구분됩니다. 그것은'tmp : application/octet-stream;을 반환하고있다. charset = binary'라고 표시합니다. –

+0

기술적으로는 인쇄 할 수없는 문자입니다. – philantrovert

관련 문제