1
Teradata에서 데이터를 가져와 hadoop에 넣으려고합니다.Teradata의 빠른 내보내기 스크립트
나는 그렇게하기위한 스크립트를 작성했다.
글쎄 직접적인 과정이 아닙니다.
하둡의 로컬에 상연 된 다음 하둡에 넣습니다.
나는 다음과 같은 오류가 점점 오전 스크립트를 실행하는 동안 :
이0002 .LOGTABLE log_1; **** 16:06:28 UTY1006 CLI error: 235, MTDP: EM_GSSINITFAIL(235): call to gss_init failed. **** 16:06:28 UTY2410 Total processor time used = '0 Seconds' . Start : 16:06:28 - TUE AUG 20, 2013 . End : 16:06:28 - TUE AUG 20, 2013 . Highest return code encountered = '12'.
이 사람이 나를 도와 실수가 여기에 무엇을 말할 수 있습니까? 그 오류는 무엇을 의미합니까?
다른 곳에서 처리하기 위해 Teradata에서 많은 양의 데이터를 언로드하기 전에 다음을 수행하십시오. JDBC를 통해 Hadoop 작업을 Teradata에 연결하고 필요할 때 언제든지 읽을 수 있습니다. 모든 Bi 및 Etl 툴 공급 업체는 이러한 방식으로 최적화합니다 (푸시 다운 또는 데이터베이스와 같은 멋진 이름 지정). 이렇게하면 Teradata의 전체 병렬 처리를 사용하고 네트워크 트래픽을 최소화 할 수 있습니다. 왜 회사가 지불 한 것을 사용하지 않습니까? – jboi
@ jboi의 의견 - Teradata는 Hadoop과 Teradata 간의 커넥터를 제공하므로 사용자가 성취하고자하는 것을 용이하게 할 수 있습니다. 계정 담당자에게 문의하십시오. –
Teradata/Hadoop Connector [여기] (http://developer.teradata.com/connectivity/articles/teradata-connector-for-hadoop-now-available)에 대한 자세한 내용을 볼 수 있습니다. 라이센스 비용이 있는지 또는 developer.teradata.com에서 다운로드 할 수 있는지는 잘 모릅니다. – jboi