건으로 추측 할 수 있습니다.패턴에 의한 단어의 출현 횟수를 R
XML 파일에서 모든 발생, 해당 행 및 알파와 숫자 만 (문자로 영숫자) 만 포함 된 각 12 자 문자열의 총 발생 횟수를 검색하려고합니다.
예를 들면 : 내 파일이 xmlInput
인 경우 12 문자 영문자 문자열의 모든 발생, 위치 및 총 개수를 검색하고 추출하려고합니다.
예 출력 : 내가 패턴으로 문자열의 모든 항목을 얻을 수 regmatches
을 사용할 수, 알고
String Total Count Line-Num
CPXY180D2324 2 132,846
CPXY180D2131 1 372
CPCY180D2139 1 133
. 나는 그것을 위해 아래를 사용 해왔다 : (이것에 대한 귀하의 도움에 감사드립니다).
ProNum12<-regmatches(xmlInput, regexpr("([A-Z0-9]{12})", xmlInput))
ProNum12
regmatches
패턴을 따르는 모든 경기를 알려주세요. 하지만 그것은 패턴이 나타난 곳의 라인 번호를 알려주지 않습니다. grep
이 나에게 모든 발생 행 번호를 알려줍니다.
나는 textcnt
라이브러리 Tau
패키지를 사용할 수 있다고 생각했지만 제대로 실행되지 못했습니다. 아마도 그것은 적절한 패키지가 아닐까요?
R에있는 패키지/라이브러리는 패턴과 일치하는 모든 단어를 검색하고 각각의 어커런스 및 리넨 수를 계산합니다. 그런 pacakge가 존재하지 않는 경우에, 나는 어떻게의 위 또는 더 나은 것의 이것을 사용하여 할 수있는 아이디어?
당신이 코드를 포맷 게시물을 편집시겠습니까? 또한'quoting' (틱 마크'') R 명령어를 사용하면 읽기가 더 쉽습니다. 예 : Grep 대신'grep'. – Arun
수정 됨. 바라기를, 지금 더 낫습니까? 감사! – BRZ
니스, 당신이 보여준 결과물을 줄 수있는 문자열을 우리에게 줄 수 있다면 더 좋을 것입니다. – Arun