2016-06-21 3 views
1

HTML 파일 목록이 있습니다. 내가 정기적으로해야하는 헤더 섹션 </head>의 끝을 찾을 R에서 열 수동으로 같은 코드의 주어진 붙여 넣기입니다 말 :
R - html 자동 편집 코드

<p>This report helps you find the critical issues in your data</p>

사람은 자동으로 코드를 작성에서 저를 도와 드릴까요 헤더 태그의 끝을 찾고 주어진 줄 집합을 붙여 넣습니다.

같은 운동은 다른 도구에서 행할 수 있지만 특히 R에 대한

답변

0

저를 도와주십시오 수 있습니다 난 당신이 XML 페이지를 사용하여 HTML 파일을 검색하는 데 도움이 XPath 쿼리에 대해 배우고 싶은 생각합니다. 모든 파일을 some_dir에 다운로드하고 텍스트를 구문 분석하여 <p>이 (가) <div class="come_class">에 있었던 경우에만 검색하려고한다고 가정 해 보겠습니다.

library(XML) 
files <- list.files("some_dir", full.names = TRUE, include.dirs = TRUE) 
docs <- lapply(files, htmlParse) 

text.nodes <- 
    lapply(docs, function(doc) 
    getNodeSet(doc, '//div[@class="some_div"]//p')) 

text.value <- 
    lapply(text.nodes, function(node) 
      sapply(node, xmlValue)) 
+1

는 확신 영업 이익이 응답을하여 XML 문서에 너무 – hrbrmstr

+0

nograpes 감사 텍스트를 추가하고 싶어 @hrbrmstr는 사실, 나는 HTML이 줄을 입력하고 저장 편집 할. 코드가 섹션을 찾는 데 도움이되지만 어떻게 수정하고 편집합니까? –

+0

@AnuragH'XML' 패킷에는'addNode()','addChildren()','addSibling()'(etc) – hrbrmstr