hadoop 커넥터없이 Hive를 Vetica로 크고 빠르게 내보내는 방법을 알려주십시오.유닉스 파이프를 사용하여 vertica 데이터를 익스포트하는 방법
현재 유닉스 Namedpipe 을 통해 동일한 것을 내보내고 있지만 성능이 좋지 않습니다.
거의 5 개의 병렬 스레드로 데이터를 vertica에로드하고 시간은 16 억 개의 레코드 세트에 대해 약 230 분입니까?
이 성능을 개선하는 데 도움을주세요. 내보내기를 최적화 할 수 있습니까?
덕분에 우리는 명명 된 파이프 (에서는 mkfifo)하지만 표준 익명 쉘 파이프를 사용하지 않는,이 일을하는
당신이 무엇을 요구하고 있는지 분명하지 않으며, 예제 코드 나 자세한 내용을 제공 할 수도 있습니다. – EternalHour
이봐, 실제로 우리는 하이브에서 큰 테이블을 하이브에서 버티칼로 옮기기를 계획하고있다. 유닉스 파이프 덕분에 처음에는 하이브 테이블에서 col1 col2를 선택한다.> mkfifo 이후에 우리는 vertica 연결을하고 다음과 같이 복사본을 시작한다. 아래 고양이 mkfifo | vertica에 복사 우리는 vertica의 5 개 노드에서 5 개의 병렬 스레드로이 작업을 수행합니다. –
@ abhishekrastogi는이 일회성 일입니까, 아니면 자주 발생합니까? – Kermit