2012-05-18 2 views
0

디렉토리를 크롤링하고 포함 된 모든 파일을 찾을 aspx 페이지를 작성하려고합니다. 나는 그 부분을 가지고 있다고 생각한다.ASP.net : HTML 및 ASP.net 페이지를 문자열로 읽으시겠습니까?

처음 읽는 HTML 페이지와 ASP 페이지에서 .txt 파일을 만들지 않고 문자열을 읽을 수 있습니까? 나는 많은 양의 새로운 파일을 생성하고 나중에 삭제해야하는 것을 원하지 않습니다.

궁극적으로, 전체 디렉토리를 검색하고 빈 alt 속성 또는 alt 속성이없는 모든 이미지 태그를 찾는 도구를 개발하려고합니다. 태그를 찾을 수있는 jQuery를 작성했으며 디렉토리를 검색하는 부분도 작성했습니다.

+0

발견 한 html 파일을 읽고 싶습니까? – Ste

+0

나는 이해하지 못한다. 당신은 디렉토리에있는 모든 파일을 찾고 문자열 객체에 지정된 파일을로드하고 싶습니까? – zgnilec

+0

그것은 본질적으로 그것입니다. 디렉토리의 모든 파일을 찾아서 문자열로 읽은 다음 내 기준에 맞는 이미지 태그의 문자열을 확인하고 싶습니다. 디렉토리 부분과 이미지 태그 검색 부분이 더 많거나 적게 있습니다. 내용을 .txt 파일로 먼저 복사하지 않고 문자열로 파일을 읽을 수 있습니까? – MNRSullivan

답변

2

파일 시스템에 파일이 있다면 간단히 읽을 수 있습니다. 텍스트 형식이라는 것을 알고 있다면 올바른 인코딩을 사용하는 스트림을 사용해야합니다.

HTML을 읽고 쿼리하므로이 작업을 위해 특별히 작성된 라이브러리 인 HTML Agility Pack을 사용하면 HTML 파일의 경로를 제공 한 다음 모든 img 요소에 대해 쿼리 할 수 ​​있습니다. 소스 다운로드에는이 프로젝트 및 다른 작업을 수행하는 방법을 보여주는 샘플 프로젝트가 함께 제공됩니다.

+0

HTML 민첩성 팩은 asp 페이지를 읽습니까? 나는 예를 추측하고있다. 그러나 나는 빠른 인터넷 검색으로 대답을 찾을 수 없었다. – MNRSullivan

+0

@MNRSullivan - 소스 파일이 아닙니다. 브라우저에서 볼 수있는 페이지가 ASP.NET으로 작성되었다는 것을 의미하는 경우 HTML을 볼 때까지는 그렇습니다. – Oded

0

확실한 이유는 환경 변수에 저장하지 마라. 그래서 이런 식으로 시도하십시오 : HTML 또는 ASP 파일을 분리하여 변수 배열에 저장합니다. 다시 배열하는 방법을 보여 줬습니다. 이것이 귀하를위한 해결책 인 경우 알려주십시오

@echo off 
setlocal EnableDelayedExpansion EnableExtensions 
echo. 
set count=0 
if exist newfile.html del newfile.html 
:: to unassemble 
for /f "tokens=*" %%a in (filename.html) do (
    echo %%a 
    set /a count=count + 1 
    set htmllinenum!count!=%%a 
)& set finalcount=!count! 
:: to assemble 
for /l %%a in (1,1,%finalcount%) do (
    echo !htmllinenum%%a!>>newfile.html 
) 
notepad newfile.tmp 
    set count=0 
if exist newfile.asp del newfile.asp 
:: to unassemble 
for /f "tokens=*" %%a in (filename.asp) do (
    echo %%a 
    set /a count=count + 1 
    set asplinenum!count!=%%a 
)& set finalcount=!count! 
:: to assemble 
for /l %%a in (1,1,%finalcount%) do (
    echo !asplinenum%%a!>>newfile.asp 
) 
notepad newfile.asp 
관련 문제