2017-03-20 1 views
-1

저는 Scrapy에서 새로 왔으며 URL을 가져 와서 원하는 부분 만 추출하려고합니다. 예 :URL에서 단 하나의 부분 만 추출

>>> imgs = response.xpath ('//div[@id="productImageHolder"]/img/@src').extract() 
>>> print imgs 
ExtendedSitesCatalogAssetStore/images/catalog/productImages/41/5060119298441/5060119298441_L.jpeg 

그러나이 값을 얻고 싶습니다. 5060119298441. 어떤 도움을 주시겠습니까?

img.split("/")[-2] 

또는, 당신은 또한 Scrapy의 Selector 인스턴스의 .re_first() method을 사용할 수 있습니다 : : 일반적으로

+0

당신은 imgs.split ("/) [- 2] – iamdeowanshi

+0

을 사용할 수 있습니다."iamdeowanshi "정말 고마워요! –

답변

3

, 당신은 URL 문자열에 .split() 메소드를 호출하고 끝에서 두 번째 요소를 얻는 해결할 수

response.xpath('//div[@id="productImageHolder"]/img/@src').re_first(r"(\d+)_\w+\.jpeg$") 

(또는 여러 요소에 대해 .re_first() 대신 .re()을 사용하십시오.)

+0

고마워요 !!!!!!"alecxe "! !!! –

관련 문제