파이프로 구분 된 데이터에 하이브 SerDe RegEx를 구성해야합니다.하이브에서 파이프로 구분 된 데이터의 정규식
샘플 데이터 :
CEF : 0 | 마이크로 소프트 | 마이크로 소프트 Windows가 || 마이크로 소프트 윈도우 보안 - 감사 : 434 | 계정이 기록 된 오프 | 낮은 |. eventId = 260 externalId = 44 msg = 네트워크 : 사용자 또는 컴퓨터 이 컴퓨터에 네트워크로 로그온 한 상태입니다. categorySignificance =/정보 categoryBehavior =/액세스/중지 categoryDeviceGroup =/운영 체제 catdt = 운영 체제 categoryOutcome/성공 categoryObject =/호스트/운영 | Vista ad.EventIndex = -972 ad.WindowsParserFamily = Windows 2008 R2 | 2008 | 7 | 비스타 ad.WindowsVersion = 윈도우 서버 우리가 하나의 열로 그 후 파이프에 의해 처음 7 열을 분리하고 모든 것을 고려할 필요가있다이를 위해
. (CEF의 STRING, 공급 업체 STRING, 제품 STRING, 버전 STRING, 서명 STRING, 이름 STRING, 심각도 STRING, 확장 STRING)
그래서 샘플 데이터 출력이 컬럼에 매핑해야합니다 DDL은
COL1 : CEF : 0 Col2의 : 마이크로 소프트 열 3 : 마이크로 소프트 윈도우 Col4 : COL5 : 마이크로 소프트 윈도우 보안 - 감사 : 434 Col6 다음과 같이 계정은 로그 오프했다. Col7 : 낮음 Col8 : eventId = 260 externalId = 44 msg = 네트워크 : 네트워크에서이 컴퓨터에 로그온 한 사용자 또는 컴퓨터. categorySignificance =/정보 categoryBehavior =/액세스/중지 categoryDeviceGroup =/운영 체제 catdt = 운영 체제 categoryOutcome/성공 categoryObject =/호스트/운영 | Vista ad.EventIndex = -972 ad.WindowsParserFamily = Windows 2008 R2 | 2008 | ad.WindowsVersion = Windows Server
input.regex는 무엇이되어야합니까?
이 정규식을 사용하여 (key = value) 형식의 열에 대한 Map 데이터 형식을 가질 수도 있습니다.
샘플 출력하시기 바랍니다 선생님! – aelor
코드가 실패한 곳은 어디입니까? – Robin
@aelor는 샘플 데이터의 예상 출력을 추가했습니다. –