내 kafka 제작자로 파일을 사용하려고합니다. 원본 파일은 계속 증가합니다 (예 : 초당 20 레코드/줄). 다음은 내 문제와 유사한 게시물은 다음과 같습니다 성장하는 파일을 Apache Kafka 제작자로 사용하고 새로 추가 된 데이터 만 읽는 방법
How to write a file to Kafka Producer
그러나이 경우
는 전체 파일은 새 라인이 파일에 삽입 될 때마다 읽고 카프카 항목에 추가됩니다. 새로 추가 된 행만 주제로 보냅니다 (즉, 파일에 이미 10 개의 행이 있고 4 개의 행이 추가 된 경우 4 개의 행만 주제로 보내야 함).이 방법이 있습니까?
다른 솔루션 시도 :
아파치 수로를 'SPOOLDIR'로 소스 유형를 사용하여. 그러나 이미 읽은 파일에 데이터가 추가 될 때가 아니라 디렉토리에 추가 된 새 파일에서 데이터를 읽으므로 아무 쓸모가 없습니다.
또한 우리는 '간부'와 '꼬리 -F/경로/파일 이름'과 같은 명령 같은 수로 소스 유형로했습니다. 이것 역시 효과가없는 것 같습니다. 다른 도구를 사용하는
제안도 내 목표로 환영하는 실시간에있는 파일에서 데이터를 읽을 수있다 (예.이 파일에 삽입 나는 즉시 데이터가 필요).
Kafka Connect의 [FileSource Connector] (https://docs.confluent.io/current/connect/connect-filestream/filestream_connector.html)를 사용해 보셨습니까? –
감사합니다. Chin Huang. 나는 커넥터에 대해 몰랐다. 그것은 일했다 :) – Sindhu