셀레늄과 파이썬을 사용하여 웹 페이지를 긁어 내고 다음과 같은 구조의 div에서 원하는 데이터를 수집하는 데 어려움이 있습니다.셀렌과 파이썬을 사용하여 div에서이 데이터를 수집하는 방법
<div class="col span_6" style="margin-left: 12px;width: 47% !important;">
<div class="MainGridRow">
<span class="MainGridcolumn1">Heading1</span>
<span class="MainGridcolumn2">Text that I want</span>
</div>
<div class="MainGridRow">
<span class="MainGridcolumn1">Another heading</span>
<span class="MainGridcolumn2">More text that I want</span>
</div>
<div class="MainGridRow">
<span class="MainGridcolumn1">Next heading</span>
<span class="MainGridcolumn2">Even more text</span>
</div>
<div class="MainGridRow">
<span class="MainGridcolumn1">Yet another heading</span>
<span class="MainGridcolumn2">Piece of text</span>
</div>
</div>
div에는 여러 행이 있으며 각 행에는 2 개의 열이 span 태그 내부에 데이터/텍스트를 포함합니다. CSS ID는 없습니다.
'MainGridcolumn2'스팬 클래스에 포함 된 텍스트 만 수집하는 데 관심이 있습니다.
텍스트를 포함하는 다음 span 태그로 이동하기 위해 'following_sibling'을 사용하려고 시도하면서 첫 번째 제목으로 이동하려했으나 작동하지 않습니다. 이 텍스트를 반환하지 않습니다 나는 콘솔에 인쇄하려고하면
driver.find_element_by_xpath("//span['@class=MainGridcolumn1'][contains(text(), 'Heading1')]").text
및
driver.find_element_by_xpath("//span[contains(text(), 'Heading1')]").text
안녕을 얻을 수, MainGridcolumn1의 텍스트는 절대 변하지 않을 제목,하지만 값은 MainGridcolumn2에서는 항상 서로 다른 페이지의 데이터 순서가 바뀔 수 있습니다. 그래서 나는 heading spans로 이동 한 다음 값을 수집하기 위해 다음 범위로 이동하려고했습니다. – Matt
다른 "MainGridRow"div가 있습니까? –
예 - 총합 20 점 – Matt