서로 x 초 이상 걸리는 토큰 쌍을 찾으려고합니다.여러 개의 큰 XML 파일을 구문 분석합니다. 일치하는 토큰이 x 초 이상 떨어진 경우 출력합니다.
XML 데이터는 다음과 같습니다
<entry stamp="2017-10-30T19:19:59" level="MESSAGE" location="Process" message="token is 191"/>
<entry stamp="2017-10-30T19:20:59" level="MESSAGE" location="Process" message="token is 192"/>
<entry stamp="2017-10-30T19:21:59" level="MESSAGE" location="Process" message="token is 193"/>
<entry stamp="2017-10-30T19:22:59" level="MESSAGE" location="Process" message="token is 194"/>
<entry stamp="2017-10-30T19:23:59" level="MESSAGE" location="Process" message="token is 191"/>
<entry stamp="2017-10-30T19:24:59" level="MESSAGE" location="Process" message="token is 192"/>
<entry stamp="2017-10-30T19:25:59" level="MESSAGE" location="Process" message="token is 193"/>
<entry stamp="2017-10-30T19:25:59" level="MESSAGE" location="Process" message="token is 194"/>
실제 메시지는 매우 깁니다. 그것은 각각에 토큰이 있습니다.
고유 한 IN 토큰이있는 행이 있으며 해당 OUT 토큰이 있습니다.
일반적으로 IN 및 OUT 토큰은 서로 1 초 내에 발생합니다.
이 파일은 거대 - 100MB이며 수백 개가 있습니다.
x 초 이상 떨어져있는 이상치 만 존재합니다.
해당 줄이 있으면 파일에 추가하십시오.
의견이 있으십니까? xmlstarlet을 사용하고 있지만, 아이디어를 파악하고 RHEL에서 실행할 수 있다면 본질적으로 어떤 것도 작동 할 수 있습니다.
_ "고유 한 IN 토큰이 있고 해당 OUT 토큰이 있습니다."_ _ 표시 한 XML과 어떻게 관련이 있습니까? 도움이 필요하면 모든 관련 정보와 데이터를 보여줘야합니다. –
주어진 '@ message'가있는 첫 번째 ''요소가 IN 토큰으로 해석되고 동일한 '@ message'를 갖는 두 번째 ''요소가 해당 OUT 토큰으로 해석된다고 추측합니다. 그러나 나는 완전히 틀릴 수도 있습니다. 분명히 설명이 명확하지 않습니다. –
RHEL = Red Hat Enterprise Linux를 찾지 않고 다른 사람을 저장하려면. –