2012-07-29 2 views
-3

연구를 위해 일부 웹 사이트에서 일부 콘텐츠를 긁어서보고 싶습니다. 파이썬과 웹 스크래핑을 사용하면 프로세스가 빨라지 길 바랍니다. 하나의 작은 프로젝트에서 XML을 한 형식에서 다른 형식으로 변환하기 전에 저는 파이썬과 아름다운 수프를 사용했습니다.파이썬으로 웹 사이트의 약 페이지를 긁습니다

+2

여기에는 질문이 없습니다. 만약 당신이 스크레이퍼를 찾고 있다면, [scrapy] (http://scrapy.org)는 꽤 좋습니다. – Julian

+2

여기서 질문은 어디에 있습니까? – ThirdOne

+0

문제를 해결하는 유일한 방법은 바로 들어가서 어지럽게 시작하는 것에 동의하지 않습니다. 특히 코딩으로 인해 기술이 길어지기 쉽습니다. 당신이 제안하는 그 사이트의 결함, 비록 내가 일을 통해 배우는 것이 매우 중요하다는 데 동의하지만 연구와 이론 또한 중요합니다. 균형이 있어야합니다. 나에게 해결책을 제공 해줄 것을 요구하는 것이 아니라, 아래 답변 된 사람과 같은 조언을 해주세요. 흥미있는 링크. – weaveoftheride

답변

3

추출 할 데이터의 구조가 중복되는 방식에 따라 여러 가지 도구를 사용할 수 있습니다.

+0

감사합니다. 매우 유용합니다. – weaveoftheride

관련 문제