로그 Tcpdumps는 이진 파일이므로, hadoop의 FileInputFormat이 입력 데이터를 분할하여 사용해야하는지 알고 싶습니다 ... 도와주세요!어떻게지도를 사용하여 입력 로그를 사용할 수 있습니까? .RAPHOME Hadoop
2
A
답변
2
이에 대한 사용자 목록 스레드가 있었다 : 파일의 오프셋 (offset) 임의의 시작 기록의 시작을 찾을 수 http://hadoop.markmail.org/search/list:org%2Eapache%2Ehadoop%2Ecore-user+pcap+order:date-forward
는 기본적으로, 형식이 분열성되지는. 따라서 사전 처리, 싱크 포인트 삽입 또는 유사한 작업을 수행해야합니다. 작은 파일을 시퀀스 파일로 변환 한 다음 작은 시퀀스 파일을 병합 할 수 있습니까?
재사용 가능한 것을 작성하는 경우 프로젝트에 다시 기고 해보십시오.
1
PCAP 파일을 읽고, 키 (파일의 n 번째 패킷) 및 PCAP 데이터를 포함하는 값으로 PacketWritable에 대해 LongWritable과 같은 것을 반환하는 InputFormat을 작성하십시오. InputSplit의 경우 성능을 높이기 위해 FileSplit 또는 MultiFileSplit을 사용할 수 있습니다. 개별 PCAP 파일을 놀라운 속도로 읽을 수 있습니다. 당신의 블록 크기가 PCAP 파일의 크기보다 큰 경우를 제외하고
, 최근 파일
1
우리는 PCAP 형식 라이브러리를 발표했습니다 ... 네트워크 IO를 많이 경험하게 될 것입니다 : https://github.com/RIPE-NCC/hadoop-pcap
관련 문제
- 1. Hadoop 0.20에서 Avro를 사용할 수 있습니까?
- 2. 루트 액세스없이 hadoop cloudera를 사용할 수 있습니까?
- 3. Hadoop RunningJob에 대한 로그를 얻는 방법은 무엇입니까?
- 4. 로그를 사용할 수 없습니다. android
- 5. cat은 사용할 수 있지만 Hadoop DFS 파일은 사용할 수 없습니다.
- 6. 어떻게 여러 입력 파일을 입력 파일로 사용할 수 있습니까?
- 7. 메이븐을 사용하여 빌드 hadoop
- 8. 스트리밍 데이터 및 Hadoop? (Hadoop Streaming이 아님)
- 9. 명령 프롬프트를 사용하여 인터넷 연결 로그를 어떻게 볼 수 있습니까?
- 10. NLineInputFormat에 hadoop 입력 형식을 설정하는 방법은 무엇입니까?
- 11. Rails 개발 로그를 어떻게 볼 수 있습니까?
- 12. PHP가 서버 HTTP 로그를 읽을 수 있습니까?
- 13. Win2003 서버에서 원격으로 로그를 볼 수 있습니까?
- 14. 어디에서 오류 로그를 찾을 수 있습니까?
- 15. Apache Hadoop : "시차 변화"입력을 할 수 있습니까?
- 16. seekg라고하는 어떤 종류의 입력 스트림을 사용할 수 있습니까?
- 17. 트랜잭션 로그를 사용하여 트랜잭션 롤백
- 18. html로 이중 중첩 입력 태그 배열을 사용할 수 있습니까?
- 19. a.btn에 대한 스타일이 있습니다. 입력 유형 = 버튼에도 사용할 수 있습니까?
- 20. cufon 스타일의 텍스트 입력 및 텍스트 영역을 사용할 수 있습니까?
- 21. XML을 바이너리 파일 판독기의 입력/디코더로 사용할 수 있습니까?
- 22. html의 입력 필드에서 몇 개의 문자를 사용할 수 있습니까?
- 23. 라이브러리에는 설명과 값이 들어있는 입력 파일을 사용할 수 있습니까?
- 24. 반사를 사용하여 getMethods를 순서대로 사용할 수 있습니까?
- 25. 소켓을 사용하여 연결 프록시를 사용할 수 있습니까?
- 26. 인스트루먼트를 명령 행을 사용하여 사용할 수 있습니까?
- 27. jquery를 사용하여 다음과 같이 사용할 수 있습니까?
- 28. getopts를 사용하여 문자열을 스위치로 사용할 수 있습니까?
- 29. Hadoop (Fado) in Hadoop (Hadoop in Action exercise)
- 30. 알림에 앵커를 사용할 수 있습니까?
'belongs- 에 - tdwtf'? – voyager
흠, 사용자 이름이 Stalyn이고 거대한 pcap (패킷 캡처) 덤프 처리에 대해 알고 싶습니다. –