2015-02-05 4 views
-1

JavaScript 및 FireFox cfx SDK를 처음 사용했습니다. URL의 내용을 재귀 적으로 크롤링하여 FireFox에서 URL 내용을 완전히 저장하도록 확장 프로그램을 작성하려고합니다. 이 프로그램은 다음 단계로 나눌 수 있습니다 : 누군가가 나에게 부품 CFX SDK와 함께 수행하고있는 부분과 할 수있는 몇 가지 힌트 (예를 들어 공부하는 키워드 또는 링크 읽기를 제공하는 경우재귀 웹 사이트 저장

1- Saving contents of a given URL(including images, text, URLs and etc). 
2- Crawling pages(a.Extracting URLs inside the page, b. Recursively traversing them). 

내가 감사 할 것 자바 스크립트 등) 요청한 페이지가 현재 세션으로 완료되어야한다고 (사용자가 탭에서 URL을 연 것처럼) 한 가지 더 있습니다 [사용자가 자신의 계정에 로그인했을 수 있습니다]

감사합니다. 사전에 :-)

+1

확장 프로그램 설계를 요청합니까? 아니면 자원을 요구하고 있습니까? 그것은 분명하지 않습니다. – leDominatre

+0

@DominatorX 이것은 유효한 질문입니다. 왜이 투표가 유효하지 않은지 생각해보십시오. Re : 광대 한 API – Noitidart

+1

실제로 이러한 질문은 매우 유효합니다. 지금 당장 6k 포인터입니다. 윈도우를 아이콘 화하는 방법을 물었고 다른 사용자가 그것을 설명했습니다. 나는 그것을 애드온의 출발점으로 사용했다. 여기의 주제를보고 솔루션이 어떻게 내가 addon에서 사용할 수있는 브레인 스톰 알고리즘을 제공하는지보십시오 : http://stackoverflow.com/a/24030011/1828637 – Noitidart

답변

1

이것은 유효한 질문입니다. 초보자는 XPCOM/HTML5/Other API가 굉장히 유용하기 때문에 올바른 방향으로 도움이 필요합니다.

내가 어떻게 할 것입니다 :

당신 수 XMLHttpRequest의 (Sending Data to a Server using JavaScript(Firefox Addon))과 페이지의 HTML을 가져옵니다. 그리고이 같은 파서에 페이지를 전달합니다 (How to parse a XML string in a Firefox addon using Add-on SDK) 사용자가 나는 우리가 아마 또 다른 사건을 것이다 당신을 보장이 질문을하지 않았다면 당신은

var parser = new DOMParser(); 
var doc = parser.parseFromString(reponseFromAjax, "text/html"); 

var URLs = doc.getElementsByTagName('a'); 
var IMGs = doc.getElementsByTagName('img'); 

를 이동하여 모든 URL을 페이지의를 얻을 수 있습니다 AJAX 반환 텍스트에서 문자열 조작을 실행하는 데 어려움을 겪고있는 개발자의 그리고 리턴 텍스트에 Regex가 더 나쁠 수도 있습니다.

cfx AddonSDK에서 이러한 XPCOM을 사용하려면 xmlhttprequest 주제 i 링크의 주석을 참조하십시오. Chrome (Cu/Ci/등) 가져 오기 방법을 설명합니다.