저는 2 시간 동안이 작업에 어려움을 겪었습니다!AWS EMR의 MapReduce 코드에서 사용자 정의 함수 가져 오기
다른 파이썬 스크립트에서 내 사용자 지정 함수 중 하나를 가져 오는 파이썬에서 매퍼 스크립트를 만들었습니다.
#!/usr/bin/env python
import sys
import testImport
for line in sys.stdin:
if line and line!='':
words = line.strip().lower().split('\t')
print '%s\t%s' % (words[0].strip(),testImport.age_classify(int(words[1])))
이 코드는 내 단말기에서 잘 작동합니다 ... 문제는 AWS Elastic MapReduce에이 매퍼 함수를 업로드 할 때입니다. 내 작업이 "모듈 testImport 가져 오기 실패"오류와 함께 실패합니다.
testImport는 표준 입력의 각 줄에서 작동해야하는 (도우미 함수와 같은) 일부 도우미 함수가 포함 된 'testImport.py'파일입니다.
내 매퍼 스크립트 (주어진 스크립트)와 동일한 버킷에 스크립트를 업로드했습니다.
'스트리밍 프로그램'단계를 추가 할 때 인수 섹션에서 전달하려고했습니다. 나는 모든 관련 질문을 본 후에도 어떻게 해야할지 전혀 모른다.
어떻게해야합니까?
도움이 될 것입니다.
감사합니다.
[mrjob] (https://github.com/Yelp/mrjob) – Mehraban