나는 hadoop mapreduce를 처음 사용합니다. 나는 소문자 파일의 텍스트를 변환하기위한 mapreduce 코드를 개발하고 싶다.하지만 파일의 앞부분과 같은 순서로 말이다. 단어 순서 데이터 시퀀스와 비슷한 것보다는 파일의 실제 순서를 의미한다. 나에게 어떤 생각을 줄 수 있는가?Hadoop에서만 사례를 공유 하시겠습니까?
0
A
답변
1
< < LINENUMBER, UPPERCASEOFLINE >> 그래서, 각 라인의 상부 케이스는 (하나만 요소 목록) 감속기의 값이 될 것이다 다만 라인별로 파일 선 판독하고 키 값으로 출사 .
지금 당신이해야 할 감속기의 키에 따라 값 (각 키에 대해 한 줄)을 방출하는 것입니다 그리고 당신은 NullWritable로 감속기 값을 만들 수 있습니다.
매퍼의 LineNumber은 모든 라인 입력마다 한 번씩 1 씩 증가합니다. 또한 isSplitable()을 재정 의하여 false를 반환하면 하나의 파일을 하나의 매퍼로 완전히 처리 할 수 있습니다.
+0
고객 레코드 판독기를 작성해야합니까? – FourOfAKind
0
주어진 텍스트를 hadoop map reduce 프로그램을 통해 대문자로 변환하는 중 같은 문제가 있습니다.
은 follwing을 내 매퍼 코드에서
public static class UpperCaseReducer extends MapReduceBase implements Reducer<Text,Text,Text,Text>
{
public void reduce(Text key,Iterator<Text> value,OutputCollector<Text, Text> output,Reporter rporter) throws IOException
{
//while(value.hasNext())
{
String NULL= new String();
//System.out.println(value.toString());
output.collect(value.next(),new Text(""));
}
}
}
, 난 그냥 대문자로 동일하게 변환 키와 원래의 선을 전달하는 것과 같은 입력 텍스트 라인과 라인으로 읽기 텍스트를 변환하고 내 감속기 코드입니다 내 매퍼 메서드의 값을 출력으로 사용합니다.
관련 문제
- 1. 사용자 모범 사례를 삭제 하시겠습니까?
- 2. MACintosh를 공유 하시겠습니까?
- 3. 클래스간에 캔버스를 공유 하시겠습니까?
- 4. 모범 사례를 효율적으로
- 5. 테스트 사례를 디자인하는 방법
- 6. NHibernate 모범 사례를 삭제하십시오.
- 7. 좋은 사례를 조각내는 PSD
- 8. 우수 사례를 부스트?
- 9. 콜 사례를 생성하는 플러그인
- 10. 동영상을 Android에서 Facebook으로 공유 하시겠습니까?
- 11. 웹을 공유 호스트에 배포 하시겠습니까?
- 12. 사이트간에 세션 데이터를 공유 하시겠습니까?
- 13. 인터넷으로 Apache 서버를 공유 하시겠습니까?
- 14. iterators를 같은 iterable로 공유 하시겠습니까?
- 15. 여러 클래스로 조각을 공유 하시겠습니까?
- 16. MVVM과 MVC간에 모델을 공유 하시겠습니까?
- 17. ipa 배포 파일을 공유 하시겠습니까?
- 18. View Controller에서 NSOperationQueue를 공유 하시겠습니까?
- 19. 이벤트 처리기간에 데이터를 공유 하시겠습니까?
- 20. iOS에서 Google+에서 공유 하시겠습니까?
- 21. TEXT를 Google+에 공유 하시겠습니까?
- 22. Xnest/Xephyr과 데스크톱 공유 하시겠습니까?
- 23. FBConnect 로그인, webview와 공유 하시겠습니까?
- 24. Twitter 공유 버튼 : URL의 해시 부분을 공유 하시겠습니까?
- 25. Excel에서 간접 사례를 추적하는 방법?
- 26. 어떻게 '비교하고 최적의 발견'모범 사례를
- 27. 웹 서비스 모범 사례를 만드시겠습니까?
- 28. 공유 열이 작은 경우 조인 또는 복제 사용 하시겠습니까?
- 29. 어떻게 배우 공유 사용 사례를 묘사하고 내가 어떻게이 개 질문이 그 사용 사례
- 30. 아파치 공유 로깅의 로깅 수준을 조정 하시겠습니까?
쿼리가 명확하지 않습니다. –