2017-01-31 2 views
1

하이브 외부 테이블에 텍스트 파일을로드했습니다. 해당 텍스트 파일에는 열을 구분할 수있는 구분 기호가 /입니다. 또한 일부 컬럼에는 한 컬럼에 새로운 라인 문자가 추가됩니다. 이로 인해 외부 테이블에 저장된 데이터가 일치하지 않습니다. 내 경우 고유 키는 1_234과 같은 값을 포함하는 row_id입니다. rowid은 숫자입니다. 그러나 텍스트 파일의 줄 바꿈 문자로 인해 일부 줄의 텍스트는 row_id입니다.하이브 외부 테이블의 행 삭제

하이브에서 해당 행을 삭제할 수있는 방법이 있습니까? 아니면 hdfs의 텍스트 파일에서 줄 바꿈 문자를 제거 할 수 있습니까?

+0

하이브 테이블을 어떻게 만들었습니까? '행 포맷은 '/''에 의해 종료 된 필드를 삭제 했습니까? –

답변

0

하이브로로드하기 전에 데이터를 정리하기 위해 hadoop (스트리밍이 옵션 임) 작업을 작성해야합니다.

관련 문제