2012-07-02 2 views
1

http://support.xbox.com/en-us/contact-us은 일부 목록을 만드는 데 자바 스크립트를 사용합니다. 이 목록을 텍스트로 파싱 할 수 있기를 원합니다. 위의 페이지에 대한 그래서 나는 다음과 같은 반환 할 :자바를 사용하여 자바 스크립트에서 콘텐츠를 생성합니다.

Billing and Subscriptions 
Xbox 360 
Xbox LIVE 
Kinect 
Apps 
Games 

내가이 자바 스크립트를 사용하여 생성 된 몰래하기 전에 잠시 동안 JSoup를 사용하려고했다. 나는 javascript가 생성 한 내용으로 페이지를 파싱하는 방법에 대해 잘 모릅니다.

어디서부터 시작해야합니까?

답변

1

Cobra과 같은 HTML + JavaScript 라이브러리를 사용하는 것이 좋습니다. HTML의 DOM 요소를 구문 분석하고 JavaScript로 인해 발생한 DOM 변경 사항을 적용합니다.

1

언제든지 전체 페이지를 가져온 다음 페이지에서 문자열 구분 기호를 수행하고 (return 등을 사용하여) 정보가 들어있는 문자열을 찾은 다음 원하는 문자열을 반환하고 해당 문자열에서 조각을 가져올 수 있습니다. 그 일을하는 더러운 방법입니다. 깨끗한 방법이 있다면 확실하지 않습니다.

0

텍스트가 자바 스크립트에 의해 생성되지 않는다고 생각합니다. 자바 스크립트를 사용하지 않으면 해당 위치에서 html 내에서 찾을 수 있습니다 (jquery selector). 자바 스크립트없이 XPath는

'div#ShellNavigationBar ul.NavigationElements li ul li a' 

에 관계없이 쿼리에 직접 대답, 당신은 내가 자바 다소 복잡한 것 기대 문서의 범위 내에서 자바 스크립트를 평가해야 할 것이다) : 사용 가능. 관련 콘텐츠를 생성하는 자바 스크립트 파일을 식별하고이를 직접 파싱하는 것이 더 많은 행운을 얻게됩니다.

관련 문제