2012-10-11 6 views
0

나는 매퍼가 약 10 개의 필드에 쓸 필드가 있습니다. 어떤 방법으로 필드 밖으로 빠르게 1. 쓰기 될 것이라고 하나의 텍스트 필드로 변환 (tradeDate, marketId, evenTime, bidPrice ....) 다시 구성Hadoop 맵 출력 유형 성능을 위해

tradeDate.readFields(in); 
    marketMakerId.readFields(in); 
    eventTime.readFields(in); 
    bidPrice.readFields(in); 
    ......................... 

또는 2. 다음 감속기의 객체.

어느 쪽이 더 나은 성능을 낼 수 있습니까?

답변

1

언제나처럼 벤치 마크가 도움이 될 수 있습니다. 가설을 확인하려면 Caliper을 사용할 수 있습니다.

일반적으로 텍스트가 < -> 이진 변환과 관련되어있을 때 더 빠른 이진 형식입니다. 결과적으로 바이너리 읽기/쓰기 필드가 더 빨리 작동한다고 생각합니다.

관련 문제