2012-03-03 3 views

답변

5

HTTP 요청을 만들어 html 콘텐츠 문자열을 가져온 다음 문자열을 구문 분석 할 수 있습니다. 당신이 웹 페이지를 분석하고, 다른 모든 것들없이,에 "글"을 제목으로 관련이 것을 얻을해야하는 경우

NSError *error = nil; 
NSString *html = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"http://www.google.com"] encoding:NSASCIIStringEncoding error:&error]; 
if(html) { 
    NSLog(@"HTML %@", html); 

    NSRange r = [html rangeOfString:@"<title>"]; 
    if (r.location != NSNotFound) { 
     NSRange r1 = [html rangeOfString:@"</title>"]; 
     if (r1.location != NSNotFound) { 
      if (r1.location > r.location) { 
       NSString *title = [html substringWithRange:NSMakeRange(NSMaxRange(r), r1.location - NSMaxRange(r))]; 
       NSLog(@"title %@", title); 
      } 
     } 
    } 
} else { 
    NSLog(@"Error %@", error); 
} 
3

, 당신은 뭔가를해야 예를 들어, HTML의 제목을 얻을 수 Diffbot과 같이 기사 제목, 작성자, 텍스트 및 콘텐츠 관련 이미지를 검색 할 수 있습니다. Diffbot은 한 달에 10.000 개 이상의 API 호출을하는 응용 프로그램에 대해 지불됩니다 (그리 많지는 않음). Readability, Pocket (이전 Read It Later) 및 Instapaper와 같은 응용 프로그램은 사용자가 나중에 여러 장치에서 읽을 수 있도록 구문 분석 된 문서를 저장하도록 허용하며 공개 API를 가지고 있습니다. 그러나 Pocket은 API를 파싱에만 사용하도록 허용하지 않습니다. 가독성은 요청시 파서 ("Content API")에 대한 액세스를 제공합니다 (요청하지 않았지만 나중에 필요할 수도 있음). Instapaper는 다른 두 개와 달리 응용 프로그램으로 사용한 적이 없는데 이런 종류의 사용이 허용되는지 여부를 명확하게 밝히지는 못합니다.

내 대답은, 비록 여러 달 늦어도 유용 할 수 있기를 바랍니다. 어떤 해결책을 찾았는지 간단히 회신 해주십시오.

피. 추. : 분명히 새로운 사용자로서 나는 두 가지 링크 만 제공 할 수 있습니다. 나는 이후의 것들을 모두 제거했지만, 처음 두 개가 어쨌든 가장 유용합니다.

+0

귀하의 링크는 OP가 특별히 관심이 없다고 언급 한 것들입니다. –

관련 문제