Objective-C에 접근 할 수있는 라이브러리가 있거나, this one과 같은 형식의 페이지를 긁어 낼 수 있는지 궁금합니다. 구체적으로, 모든 날짜와 모든 텍스트를 모든 날짜 옆에 표시합니다. 그렇지 않다면이 일을하는 가장 좋은 방법은 무엇입니까? 정규식? NSString
에 이미 내장 된 방법이있을 수 있다고 들었습니다. 사실입니까?위키 피 디아를 긁어서 파싱하기 페이지
XML 파일이나 API와 같은 스크래핑에 대한 대안이 있는지 살펴 보려고했습니다. 나는 API를 찾았지 만, 내가 볼 수있는 유일한 클라이언트는 다른 언어에 있으며 페이지를 검색하지 않고 콘텐츠를 게시 할 수있는 것 같습니다.
편집 : 그래서 이러한 링크에서 API에 대한 자세한 내용을 발견 :
그리고 약간의 HTML을 반환 this request을 마련 할 수 있었다 인코딩 된 텍스트 (음, 형식은 XML이지만, »a href=
등의 페이지 텍스트가 포함됩니다. 필자가 문서 작성을 통해 mak을 볼 수 있는지 알아볼 것입니다. e 이것은 조금 더 나아졌지만 그렇지 않다면 이것을 파싱하는 것에 대한 권고 사항이 있습니까?
편집 2 : 좋아 감사 this doc page에, 그래서 내가 데이터를 검색 할 수있었습니다 간단하고 깨끗한 방법은 관련 섹션의 (위키 마크 업에서 ) 원시 데이터를 반환이 constructed link을 사용하고 있습니다. 그러나, 나는 그때 그것을 파싱 할 필요가 있다고 생각하는데, 실제로 그렇다면 전체 기사보다 훨씬 쉬워야한다.
누구나 Objective-C에서 다음과 같은 위키 마크 업을 구문 분석 할 때 권장 사항이 있습니까? 내가 갖는 결국 원하는 것은
==Events==
* [[710]] – [[Saracen]] invasion of [[Sardinia]].
*[[1275]] – Traditional founding of the city of [[Amsterdam]].
*[[1682]] – [[Philadelphia]], [[Pennsylvania]] is founded.
, 나는 정보의 첨부 조각과 날짜를 저장하는 것 NSDictionary
또는 유사한 수집을 것 같아요. 감사!
감사합니다. 고맙습니다. 나는 내가가는 길을 생각한다. (내가 이것을 할 수있는 유일한 방법은) 원시 데이터의 비트를 얻고 그것을 어떻게 든 파싱하는 것이다. 위의 데이터 예제를 포함 시켰습니다.하지만 그 질문에 대해 새로운 질문을 만들 가능성이 큽니다. –
새 데이터를 분석하는 것이 훨씬 쉽습니다. 이벤트 다음에 시작하는 문자열 범위를 찾은 다음 줄 끝까지 ndash 뒤에 오는 모든 항목과 함께 대괄호로 묶인 순수한 숫자와 일치하는 문자열을 찾아서 처리합니다. 그러면 모든 "["및 "]"문자를 제거해야하고 모든 설정이 완료됩니다. HTML보다 처리가 쉽지만 무거운 슈퍼 링크입니다. –
고마워, 파싱에 관한 후속 질문에 답해 주시겠습니까? http://stackoverflow.com/questions/1634012/how-to-parse-some-wiki-markup 감사합니다. –