2016-09-08 6 views
0

데이터 스크래퍼를 사용하고 있습니다 : Import.io & Portia.import.io 및 portia regex url 패턴

둘 다 크롤러가 준수 할 정규 표현식을 정의 할 수 있습니다. 예 : url : https://weedmaps.com/dispensaries/pdi-medical

"pdi-medical"결말은 어떻게 설명합니까?

나는 Import.io에게/

뭔가 모든 것을보고하고 JS 환경에서 정규식을 사용하는 방법을 이해하지만, 나는 정확히 포시의 입력에 넣어 것입니다 무엇인지에 조금 혼란 스러워요했습니다 이거? 당신이 당신의 크롤러가 https://weedmaps.com/dispensaries/로 시작하는 URL을 따르십시오 https://weedmaps.com/dispensaries//^[A-ZA-Z0-9 -_] + $/포샤를 들어

답변

0

는, 당신은 다음과 같은 정규식으로 크롤링 규칙을 추가 할 수 있습니다

^https?://weedmaps.com/dispensaries/

+0

고맙습니다! 나는 그것을 달렸고 나는 다른 어떤 주들도 아닌 캘리포니아 주에서만 진료소를 제공하고 있습니다. 왜 이런 생각 일지 모른다고 생각하세요? –

+0

시작 페이지에서 다른 주에 대한 URL을 사용할 수 있습니까? 그리고 그들은 동일한 URL 패턴을 가지고 있습니까? –