지난 2-3 주 동안 flume을 연구했습니다. 나는 해결할 방법을 알지 못하는 새로운 상황에 직면했다.Flume : 오류는 발생하지 않지만 flume은 파일을 완전히 전송하지 못합니다.
흐름 : 기본 흐름을 사용하여, SPOOLDIR ->되는 FileChannel ->을의 .conf 파일에 설정
없음 추가 매개 변수를 HDFS하지
내가 전달하기 위해 노력하고있어파일 크기 : 1.4GB
상황 : 에이전트가 잘 시작되고 파일 전송이 시작되고 소스 파일의 이름이 .COMPLETED로 바뀌고 전체 파일이 HDFS로 전송되지 않고 오류/예외가 발생하지 않습니다. 나는 동일한 adhoc을 여러 번 실행했다. 1.4 기가 중 169 메가 바이트 만 전송되었다. 이상하게 보입니다!
제안 사항? 어떤 해결책? 어떤 가설?
설정을 표시 할 수 있습니까? – Dmitry
우리는 다음과 같은 흐름을 사용하고 있습니다 : spoolDir-> AvroSinks (2) -> AvroSource (2) -> HDFSSink (2)의 conf의 비 기본 매개 변수 : Tier1 : spool_source_batchsize = 1000 avro_sinks_batchsize = 500 channel_capacity = 1,000,000 Tier2 : HDFS_sinks_batchsize = 500 channel_capacity = 1000000이 확실히 내가 용 에이전트를 구성 배치 사이즈/용량 문제 . 배치 크기 접근법에서 내가 잘못 가고있는 부분을 안내해 줄 수 있습니까? 감사! – Kasa