2017-01-11 1 views
1

상황 : 웹 사이트에서 특정 텍스트를 추출하기가 어렵습니다.imacros로 텍스트 추출하기

TAG POS=1 TYPE=SPAN ATTR=CLASS:bdytxt&&TXT:* EXTRACT=HTM 

그러나 아래 HTML 코드는 특정 요소 <a href="..." target="_blank">text1</a>가 클래스가없는 다음과 같이

iMacros 제작에서 변수를 추출 위한 iMacros 제작 홈페이지 (http://wiki.imacros.net/Data_Extraction#Data_Extraction_and_Web_Scraping)에 템플릿 예는 ATTR 섹션에서 지정하십시오. 내가 특별히 아래의 예에서 텍스트 1를 추출하기 위해 노력하고 있어요 :

//This code is within an html page 
<div class="class1"> 
    <img class="class2" src="..."> 
    <strong> 
    <a href="..." target="_blank">text1</a> 
    </strong> 
    <br> 
    <small>text2</small> 
    <small class="class3"> 
    <br> 
    <em>text3:</em> 
    <span> 
     <a href="..." class="class4"> 
     <small style="color: #aaa; font-size: 80%">text4</small> 
     text5 
     </a> 
    </span> 
    <br> 
    <em>text6</em> 
    <a href="..." class="class5">text7</a>, 
    <a href="..." class="class5">text8</a> 
    </small> 
</div> 

내가 시도하는 것 :

내가 알고 내가 "실험 이벤트 녹화 모드"를 사용하여 기록하고 특정 클릭하면 나는 다음과 같은 코드를 얻을 텍스트 1는 :

EVENT TYPE=CLICK SELECTOR="HTML>BODY>DIV:nth-of-type(5)>DIV>STRONG>A" BUTTON=0 

나는 SELECTOR가 EXTR에서 일하는 것이 있는지 확인하기 위해 테스트 ACT 코드는 다음과 같습니다 :

TAG POS=1 TYPE=SPAN SELECTOR="HTML>BODY>DIV:nth-of-type(5)>DIV>STRONG>A" EXTRACT=TXT 

하지만 예상대로 그렇습니다.

질문 : 위의 상황에서 텍스트 1을 추출하는 방법을 아는 사람이 있습니까?

답변

0

음,이 텍스트를 추출하는 방법은 여러 가지가있을 수 있습니다. 예를 들어 :

TAG SELECTOR="HTML>BODY>DIV:nth-of-type(5)>DIV>STRONG>A" EXTRACT=TXT 
+0

감사 Shugar :

TAG POS=1 TYPE=IMG ATTR=CLASS:"class2" TAG POS=R1 TYPE=A ATTR=* EXTRACT=TXT 

아니면 '크롬을위한 iMacros 제작'를 사용하는 경우, 여기에 선택의 도움으로 솔루션입니다! 해결책은 훌륭했습니다. 그런데 – iwuvit

+0

그런데 실제로 여기에 게시 한 imacros에 대한 또 다른 의심이 있습니다. http://stackoverflow.com/questions/41636311/imacros-find-how-much-a-scrollbar-is-scrolled 솔루션 당신은 내 구세주가 될 것입니다 두 번째로 – iwuvit

+0

'iMacros'v.8.9.7을 사용하는 경우 Firefox에서 다중 프로세스 기능을 비활성화해야한다고 추가하고 싶습니다. – Shugar

관련 문제