돼지를 사용하여 Hadoop을 사용하여 많은 로그 파일을 분석하기 시작했으며 이전 계산 결과에 따라 다른 파일을로드해야합니다. 예를 들어 계산 결과가 0x18e0이면 0x18e0.txt라는 파일을로드해야합니다. LOAD 문에서 매개 변수화 된 파일 이름을 어떻게 제공합니까? 돼지에서이 작업을 수행 할 수있는 유사 간단한 방법이 있나요수행 방법 Apache Pig에서 매개 변수화 된 이름의 파일로드
x = str(var)
File = open(x + '.txt', 'r')
: 파이썬에서
, 그것은 이렇게 정말 간단합니다? 내가 스크립트를 실행하기 전에 내가 x의 값을 모르기 때문에 나는 x.txt
=
돼지 -param 입력과 같은 명령 줄에 입력을 줄 수 없다.
https://wiki.apache.org/pig/ParameterSubstitution에 설명 된 것처럼 입력 파일 자체를 매개 변수로 지정하는 다른 옵션이 있지만 과도하게 원형으로 보입니다. 이것에 대한 또 다른 해결책이 있습니까?
어떤 종류의 값을 사용할 수 있습니까? –
위의 예를 들었습니다. x는 단지 문자열입니다. 필자의 경우, x는 텍스트 파일로 만들기 위해 .txt와 연결된 문자열로 표현되는 16 진수입니다. – Ahmis
'% declare'는 당신의 필요에 대답할까요? – fxm