학교 프로젝트를 위해 ~ 1000 개의 웹 사이트 소스 코드를 받아야합니다. for 루프에서 HTTP Webrequest를 사용합니다. 그러나 내 목록에있는 절반 이상의 웹 사이트가 404 오류를 반환하므로 웹 사이트를 찾을 수 없습니다. Chrome, Firefox 또는 Internet Explorer에서이 웹 사이트를 탐색하면 모든 것이 올바르게 작동합니다.[C#] 웹 사이트 소스 코드 받기 (404 ERROR)
Heres는 내 코드는 소스 코드를 얻을 수 있습니다 :
public string getSource(string url){
string urlAddress = url;
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(urlAddress);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
if (response.StatusCode == HttpStatusCode.OK)
{
Stream receiveStream = response.GetResponseStream();
StreamReader readStream = null;
if (response.CharacterSet == null)
{
readStream = new StreamReader(receiveStream);
}
else
{
readStream = new StreamReader(receiveStream, Encoding.GetEncoding(response.CharacterSet));
}
data = readStream.ReadToEnd();
response.Close();
readStream.Close();
}
return data;
}
을 어쩌면 때문이 아니라 1000 개 웹 사이트의 질량의 일을합니까?
아마도 실패한 URL 중 일부를 체크 아웃해야합니다. – Kell