2012-04-13 2 views
2

저는 하둡으로 시작하여 일부지도 축소 작업을 작성하고 있습니다. 파이썬에서 MR 작업을 작성하는 데 도움을 요청했는데, 이메일로 텍스트 나 첨부 파일을 검색 할 수 있도록 일부 이메일을 HDFS에 넣을 수 있습니까?이메일 및지도 작업 축소

감사합니다.

답변

3

이메일을 처리하기 위해 stdlib의 email 모듈을 사용하는 것이 좋습니다. Hadoop 측면의 경우 Using Python with Hadoop이 유용 할 수 있지만 선택할 수있는 Google 결과가 충분합니다.

+0

가 보는 몇 가지 샘플 코드가있을 것인가? –

+0

@StevenSmith 이전 링크에서 언급 한 dumbo 프레임 워크를 사용하는 경우이 간단한 자습서 (https://github.com/klbostee/dumbo/wiki/Short-tutorial)를 살펴볼 수 있습니다. –

1

참으로, 당신은 당신이 쓰기 파이썬 코드를 사용하려는 경우 맵리 듀스 작업을 실행하기위한 하둡 스트리밍을 사용할 필요가

관련 문제