for 루프를 사용하여 목록에서 값을 추출하려고합니다. 이 목록에는 웹 페이지에서 스크랩 한 77 개의 요소가 포함되어 있습니다. 그것들은 strsplit이 다소 엉망인 정규 표현식과 일치하는 목록에 포함되었습니다. 내가 함께해야하는 각 요소의 부품을 추출하기 위해 노력했다for 루프를 사용하여 목록에서 요소 가져 오기
> chunk[76]
[[1]]
[1] ""
[2] "<img src=\"/images/"
[3] "tats/flags/mn.png\" height=\"14\" alt='mn' title='mn' />"
[4] "Mongolia"
[5] "mn"
[6] "1"
[7] "1"
[8] "21.95"
[9] ""
[10] "<img src=\"/images/"
[11] "tats/other/hp.png\" width=\"2\" height=\"5\" alt='Pages: 1' title='Pages: 1' /><br />"
:
for (i in length(chunk)) {
values <- chunk[[i]][c(4,6:8)]
}
결과 값에 대해 반환을 항상처럼
chunk <- strsplit(lines, "(<tr>|</td>)(<td>|<td[^>]+>)|aws| MB| KB")
샘플 요소 본다 마지막 목록 요소의 추출 부분은 (chunk[[77]])
누구나 제안 할 수있는 방법 오에 모든 목록 요소에 필요한 값을 얻습니다.
, XML 페이지의 xpath는 HTML 페이지를 구문 분석 할 때 옵션이 될 수 있습니다. – daroczig
@ daroczig, 감사합니다. 나는 이것을 조사 할 것이다. – John