당신은 XML
패키지를 사용하여, 예를 들어,이 작업을 수행 할 수 있습니다 데이터가 아니라 포맷되지 않은 경우
, 당신은 내가 위에서처럼 데이터를 포맷하거나 읽어야
tt <- '<?xml version="1.0" encoding="utf-8"?>
<item id="rt" name ="th">
<point1>1254</point1>
<point2>1254</point2>
</item>
'
library(XML)
xpathSApply(doc,'//item',xmlGetAttr,'id')
[1] "rt"
편집을하여 데이터를 한 줄씩 검색하고 정규식을 사용하여 정보를 추출합니다 (정규식을 사용하기 위해 XML 태그와 함께 사용하지 않는 것이 좋습니다)
tt <- '<item1 id=rt name ="th">
<point1>1254</point1>
<point2>1254</point2>
</item>
'
ll <- readLines(textConnection(tt))
gsub('.*id=(.*)[ ]name.*','\\1',ll[1])
[1] "rt"
이 실제 데이터입니다 : 여기 당신이 더 그것으로 재생하려면 행동 정규식
? 첫 번째 태그는 올바른 형식의 XML이 아니며 id 값 주변에 따옴표가 없습니다. 그것이 사용자가 가지고있는 데이터라면 XML 도구를 사용할 수 없을 것입니다. – mirod