2009-07-27 3 views
0

웹에서 HTML 문서를 다운로드 할 수있는 http 라이브러리 (C# 프로그램 용)를 찾고 있습니다. 나는 HttpWebRequest 객체와 .NET 라이브러리에서 제공하는 다른 옵션을 알고 있지만 다른 문서 인코딩을 처리 할 수있는 완벽한 솔루션이 필요합니다. (때로는 인코딩이 Http보다는 문서 자체에 지정되기도합니다. 헤더).완전한 Http 라이브러리

감사합니다.

답변

3

WCF Rest Starter Kit에는 매우 유용한 HttpClient 클래스가 들어 있습니다. 현재 .NET 3.5 SP1에서 사용할 수 있으며 바로 사용할 수 있습니다. 유용한 클래스로 간주되므로 기본 클래스 라이브러리에서 .NET 4.0의 향후 릴리스에 표시 될 수 있습니다.

확실히 또한 HttpClient를하고 WCF에서 다른 간식은 스타터 키트를 휴식 및 기타 WCF 스타터 키트 자원 휴식 특징 아론 Skonnard하여 tutorial screencast 체크 아웃 :

http://msdn.microsoft.com/en-us/netframework/cc950529.aspx

를 마크

+0

.NET 4.0에서는 아직 RTM이 아니기 때문에 Asker는 몇 달 동안 프로덕션 환경에서 사용할 수 없습니다. –

+0

나는 그 사실을 몰랐다. Downvote 실행 취소. –

+1

고마워요, sztomi! –

1

Webclient을 클래스는 필요한 모든 것을 제공합니다. 특수 인코딩 케이스를 처리하려면 문서를 바이트 스트림으로 다운로드 한 다음 필요한 작업을 수행하십시오.

0

sztomi가 맞으므로 Webclient 클래스가 필요할 수 있습니다.

당신이 HTML 민첩성 팩을 확인, 구문 분석하고 HTML로 작업해야하는 경우는 (http://www.codeplex.com/htmlagilitypack)

"이것은 DOM을 읽기/쓰기를 구축하고 일반 XPATH 또는 XSLT를 (지원하는 민첩한 HTML 파서 당신 실제로는 XPATH 나 XSLT를 사용하는 것을 이해하지 않아도 괜찮습니다 ...). "웹 외부"HTML 파일을 구문 분석 할 수있는 .NET 코드 라이브러리입니다. 파서는 매우 관대합니다. "실제"형식이 잘못된 HTML입니다. 개체 모델은 System.Xml을 제안하는 것과 매우 유사하지만 HTML 문서 (또는 스트림)를 대상으로합니다. "

관련 문제