다음은 텍스트 파일을 처리하는 hadoop 프레임 워크에 대한 것입니다. 내가 어딘가에 잘못 가고 있다면 나를 바로 잡으십시오.DBRecordReader는 몇 번 만들어지고 있습니까?
각 매퍼는 일부 레코드가 포함 된 입력 분할에서 작동합니다. 입력 분할마다 입력 판독에서 레코드 읽기를 시작하는 레코드 판독기가 생성됩니다. 입력 분할에 n 개의 레코드가있는 경우 맵퍼의 map 메소드는 n 번 호출되며 레코드 판독기를 사용하여 키 - 값 쌍을 읽습니다.
이제 데이터베이스 관점으로 이동합니다. 단일 원격 노드에 데이터베이스가 있습니다. 이 데이터베이스의 테이블에서 일부 데이터를 가져 오려고합니다. DBConfigure를 사용하여 매개 변수를 구성하고 DBInputFormat을 사용하여 입력 테이블을 언급합니다. 이제 내 테이블에 100 개의 레코드가 있고, 출력에서 70 개의 레코드를 생성하는 SQL 쿼리를 실행한다고 가정 해보십시오.
내가 알고 싶습니다 :
어떻게 InputSplits은 위의 경우 (데이터베이스)에 만들어지고?입력 분할 작성, 내 sql 쿼리가 생성하는 레코드 수 또는 테이블 (데이터베이스)의 총 레코드 수는 무엇입니까?
위의 경우 (데이터베이스)에서 생성되는 DBRecordReader의 수는 얼마나됩니까?
예, 이전에 읽었지만 생성되는 DBRecordReader의 수는 아직 명확하지 않습니다 ... 설명해 주시겠습니까? –