2013-08-20 3 views
1

Teradata에서 데이터를 가져와 hadoop에 넣으려고합니다.Teradata의 빠른 내보내기 스크립트

나는 그렇게하기위한 스크립트를 작성했다.

글쎄 직접적인 과정이 아닙니다.

하둡의 로컬에 상연 된 다음 하둡에 넣습니다.

나는 다음과 같은 오류가 점점 오전 스크립트를 실행하는 동안 :

 
0002 .LOGTABLE log_1; 
**** 16:06:28 UTY1006 CLI error: 235, MTDP: EM_GSSINITFAIL(235): call to 
    gss_init failed. 
**** 16:06:28 UTY2410 Total processor time used = '0 Seconds' 
.  Start : 16:06:28 - TUE AUG 20, 2013 
.  End : 16:06:28 - TUE AUG 20, 2013 
.  Highest return code encountered = '12'. 

이 사람이 나를 도와 실수가 여기에 무엇을 말할 수 있습니까? 그 오류는 무엇을 의미합니까?

+0

다른 곳에서 처리하기 위해 Teradata에서 많은 양의 데이터를 언로드하기 전에 다음을 수행하십시오. JDBC를 통해 Hadoop 작업을 Teradata에 연결하고 필요할 때 언제든지 읽을 수 있습니다. 모든 Bi 및 Etl 툴 공급 업체는 이러한 방식으로 최적화합니다 (푸시 다운 또는 데이터베이스와 같은 멋진 이름 지정). 이렇게하면 Teradata의 전체 병렬 처리를 사용하고 네트워크 트래픽을 최소화 할 수 있습니다. 왜 회사가 지불 한 것을 사용하지 않습니까? – jboi

+0

@ jboi의 의견 - Teradata는 Hadoop과 Teradata 간의 커넥터를 제공하므로 사용자가 성취하고자하는 것을 용이하게 할 수 있습니다. 계정 담당자에게 문의하십시오. –

+1

Teradata/Hadoop Connector [여기] (http://developer.teradata.com/connectivity/articles/teradata-connector-for-hadoop-now-available)에 대한 자세한 내용을 볼 수 있습니다. 라이센스 비용이 있는지 또는 developer.teradata.com에서 다운로드 할 수 있는지는 잘 모릅니다. – jboi

답변

1

FastExport 스크립트를 실행중인 시스템이 없거나 Teradata GSS 라이브러리에 대한 PATH 문이 잘못 설치되었거나 PATH 문이 잘못되었습니다. ICU 및 GSS 라이브러리는 Teradata 공급자 (CLI, ODBC, .Net 및 JDBC)의 보안 구성 요소입니다. 그것들이 없으면 Teradata 시스템에 연결할 수 없습니다.