R 언어를 사용하여 Mapper 및 Reducer 프로그램을 작성했습니다. 나는 hadoop에서 R 프로그램을 실행하기 위해 Hadoop 스트리밍 유틸리티를 사용하고있다. 내 제약 조건은 매퍼 프로그램에 2 개의 텍스트 파일을 입력해야한다는 것입니다. 그것을 성취하는 방법? 가장 빠른 시간에 친절하게 도와주세요. 당신은 둘 다 표준 입력을 통해 스트리밍되는 여러 입력 파일을 지정하면 하나를 입력하여 hadoop 시스템에서 R 프로그램 구현
, 나는 HDFS에있는 입력 파일을 배치하고 다중 입력을 위해 그것을 달성하는 방법을 표준 입력 곧 명령을 사용하여 참조하고는
-1
A
답변
0
을 파일 . 기록의 순서는 임의적이다. 특정 시간에 실제로 읽고있는 것이 무엇인지 파악하려면 Sys.getenv("map_input_file")
으로 전화하십시오.
0
이것은 great tutorial이며 Hadoop Streaming을 Python으로 사용하는 방법을 가르쳐줍니다.
[email protected]:/usr/local/hadoop$
bin/hadoop jar contrib/streaming/hadoop-*streaming*.jar \
-file /home/hduser/mapper.py -mapper /home/hduser/mapper.py \
-file /home/hduser/reducer.py -reducer /home/hduser/reducer.py \
-input /user/hduser/gutenberg/* -output /user/hduser/gutenberg-output
-input /user/hduser/guttenberg/*
가 HDFS에있는 모든 파일을 읽을 것인가 : 그러나, 튜토리얼의 예는 다음과 같이 수행하여 디렉토리에서, 귀하의 경우,이 개 파일을 3 권의 책을 읽고 폴더에 저장하고 처리하십시오.
호프가 문제를 해결할 수 있기를 바랍니다.
관련 문제
- 1. Hadoop 코디네이터 서비스 구현
- 2. Hadoop 설치 R
- 3. Hadoop 및 R 시작하기
- 4. OLAP 시스템에서 날짜 범위 구현
- 5. 상위 메모리 시스템에서 Hadoop 단일 노드 구성
- 6. hadoop h2o r, h2o.importHDFS, 오류
- 7. R 툴은 아파치와 호환됩니다. hadoop
- 8. Hadoop streaming failed in R
- 9. Hadoop 나만의 프로그램 만들기
- 10. hadoop 응용 프로그램 디버그
- 11. R GP 구현 오류
- 12. R 구현 클러스터 분석
- 13. C에서 R 코드 구현
- 14. P2P 프로그램 구현
- 15. 웹 응용 프로그램 용 Hadoop
- 16. hadoop map의 InstantiationException 프로그램 축소
- 17. Hadoop Map 해시 프로그램 줄이기
- 18. Hadoop 예제 프로그램 소스 코드
- 19. Apache hadoop 얀 예제 프로그램
- 20. 가상 파일 시스템에서 심볼릭 링크 구현
- 21. R : 시스템에서 지정된 파일을 찾을 수 없습니까?
- 22. Hadoop : MapReduce에서 중첩 for 루프 구현 [Java]
- 23. Hadoop MapReduce, Java 구현 관련 질문
- 24. 시스템에서 여러 명령어로 R에서 외부 프로그램 호출하기
- 25. R 반전에 의한 정렬 구현
- 26. SVM-RFE 알고리즘 구현 R
- 27. R : Mahalanobis 구현 cmeans [e1071]
- 28. 빠른 수치 계산을 구현 R
- 29. R - 좋아하는 파이썬 구현 테이블
- 30. Django : 추천 프로그램 구현
가입을 원할 경우 rmr2 패키지를 사용할 수 있습니다.이 패키지에는 이러한 잔인한 정보가 처리됩니다. – piccolbo