2014-08-27 9 views
0

특정 웹 페이지에서 일부 텍스트를 읽는 C# 콘솔 애플리케이션을 사용해야합니다. 이제는 태그 사이의 텍스트를 읽는 방법을 모르기 때문에 몇 가지 문제가 있습니다. 먼저 WebClient 객체를 사용하여 웹 페이지에서 html 코드를 다운로드합니다. htmlCode 문자열에서C# HTML 코드의 span 태그에서 텍스트를 대체하는 텍스트 가져 오기

WebClient client = new WebClient(); 
String htmlCode = client.DownloadString(link); 

, 태그 사이에 나는로드 바의 GIF 인 이미지를 가지고있다.

<span id="bitrate_0"><img src="http://webpage.net/images/loading.gif" /></span> 

나는 브라우저에서 해당 웹 사이트로 가서 그 부분을 확인하거나 내가 웹 페이지의 일부에 (나에게 HTML 코드를 보여주는) 요소의 기능을 검사하여 사용하는 경우, 내가 필요로 긴 텍스트 (있는 경우 얻을). 또한 브라우저에서 소스보기를 선택하면 여전히 해당 태그가 있습니다.

gif 이미지를 대체하는 텍스트를 가져와야합니다. 어떻게해야합니까?

감사합니다.

+1

이 (http://stackoverflow.com/questions/6063203/parsing-html-with-c-net) – Pete

+2

사용을 고려 [HTML Agility Pack] (http://htmlagilitypack.codeplex.com/)을 사용하여 코드에서 HTML을 사용할 수 있습니다. – qJake

+0

확인. 나는 두 가지 해결책을 모두 점검 할 것이다. 고맙습니다. –

답변

1

그냥 당신은 편리해야하므로 :

위의 내용을 말하자면, 위의 자료를 살펴볼 시간을 넣으면 스팬을 찾아서 놀아서는 안됩니다.

행운을 빕니다 :) 당신은 [HTML 파서]을 사용해야 할 수도 있습니다

+0

w3schools에서 XPath 자습서를 읽었으며 이제는 HtmlAgilityPack을 사용하려고하지만 동일한 문제가 발생합니다. 사이의 텍스트는 이미지로 남아 있습니다. 그 지역의 본문이 필요합니다. –

관련 문제