2011-01-17 3 views
0

일부 페이지 데이터를 가져 오기 요청을 사용하고 있지만 완성 된 파일에서 중단 태그를 제거해야합니다. 기본적으로 내가하고있는 일은 get 요청을 출력하고 파일에 저장하는 것이지만, 제거해야하는 중단 태그가 hundereds 있습니다. 태그를 제거하기 위해 파일을 저장 한 후에 일괄 처리 또는 VB 스크립트를 실행해도 문제가 없지만 어떻게 처리해야하는지 잘 모르겠습니다. 지금까지 내가 본 유일한 해결책은 전체 라인을 제거하는 것입니다.GET 요청에서 <br/>을 제거하십시오.

편집 : 이것은 여러 Windows 서버에 배포되므로 요구 사항을 가능한 한 최소화하고 싶습니다. I.E. 명령/소프트웨어는 기본적으로 Windows에 있습니다.

답변

0

파이썬을 사용하는 경우 Beautiful Soup을 사용하여 <br /> 요소를 상당히 견고하게 제거 할 수 있습니다. 트리에서 요소를 제거하는 방법은 here을 참조하십시오.

0

내가 잘못 이해하지 않는 한 vbscript (태그에서 가정)의 replace 함수를 사용하여 중단 태그를 바꿀 수 있습니다. 예를 들어 :

cleanedText = Replace(rawText,"<br/>","")) 
사용에

더 많은 정보는 여기에서 찾을 수 있습니다

http://www.w3schools.com/Vbscript/func_replace.asp

그것은 그 기능은 그대로 작동 있도록 모든 얻기 위해 몇 번을 실행해야 할 수도 있지만 가치가 언급이다 공통 태그 마크 업 :

cleanedText = Replace(rawText,"<br/>","")) //no spaces 
cleanedText = Replace(cleanedText,"<br />","")) // a space 
cleanedText = Replace(cleanedText,"<br>","")) // unterminated 
+0

죄송합니다. vbscript를 작성하는 데 익숙하지 않습니다. 이 텍스트 파일을 사용하려는 경우 어떻게해야합니까? – tking

+0

죄송합니다. 질문에 태그를 추가 했으므로 vbscript로 간주했습니다. 휴식을 포함하는 데이터를 가져 오는 get 요청을 수행하기 위해 사용하는 언어/스크립트는 무엇입니까? – MrEyes

+0

나는 cron 작업을 사용하여 http get 요청을 만들고 출력을 텍스트 파일에 씁니다. 나는 페이지에서 vbscript와는 반대로 Windows 스크립트 호스트를 사용하는 vbs 스크립트를 생각하고있었습니다. – tking

관련 문제