2013-05-31 7 views
-1

매일 웹 페이지를 열고 페이지의 텍스트를 복사하여 Excel 파일에 붙여 넣어야합니다. 웹 브라우저를 열지 않고 파이썬을 사용하여이 프로세스를 자동화 할 수있는 방법이 있습니까?(Python 사용) 웹 페이지의 텍스트를 Excel 파일에 저장하는 방법은 무엇입니까?

답변을 주신 친구에게 감사드립니다. 나에게 모범을 보일 수 있습니까?

감사합니다.

+3

당신은 대답은 '예 다음이 작업을 수행하지만, SO의 포인트는 다른 사람들이 당신을 위해 일을하도록 만드는 것입니다 수 있습니다. – Noelkd

답변

1

웹 스크래핑이라는 기술을 사용할 수 있습니다. 심지어는 크롤링 및 화면 긁기를 위해 특별히 작성된 scrapy라는 Python으로 작성된 오픈 소스 프레임 워크가 있습니다.

다음과 같은 검색 구문으로 Google 검색을 수행하십시오. "파이썬을 이용한 웹 스크래핑"은 여러분이 여러분의 길을 시작할 수 있도록 충분해야합니다.

다음 게시물에 몇 가지 좋은 정보가 있습니다. Anyone know of a good Python based web crawler that I could use?

+0

이것은 나와 같은 초보자에게 적합하고 직접적인 것입니다. :) –

1

urllib2을 사용하여 웹 페이지를 열고 콘텐츠를 BeautifulSoup으로보고 해당 데이터를 Excel 파일에 xlwt으로 붙이기 만하면됩니다. 쉬운!

+0

답장과 링크에 감사 드리며 연구에 유용합니다. –

+0

urllib2를 사용하는 대신 우수한 "요청"라이브러리를 사용해보십시오. 그것은 당신을 위해 많은 무거운 짐을 처리합니다. 단계에 대한 http://docs.python-requests.org/ko/latest/ – twasbrillig

0

예, 있습니다. 그런 다음 당신이 필요로하는 값 (모듈 BeautifulSoup로 정규식)의 HTML을 구문 분석 할 필요가, 그리고 마지막으로 엑셀

에서 열 수있는 CSV 파일로 결과를 저장, 웹에서 HTML을 끌어 urllib2를 사용할 필요가
+0

감사합니다. –

1

예, 당신은이 작업을 수행 할 수 있습니다.

내가 제안 :

  • 는 파이썬에서 페이지를 얻기를 위해 urlliburllib2에 최대 읽기.
  • 페이지에서 콘텐츠 구문 분석을 위해 lxml을 조사하십시오.
  • this page on python excel manipulation을 살펴보십시오.
  • 원하는대로 코드를 작성하십시오.
  • 즉시 다음 성공하지 않는 경우 도움을 요청하고 코드 예제를 제공합니다.

당신은 (웹에서 Excel로 데이터를 가져 오기) 작은 수준에서 엑셀 자체에서 같은 작업을 수행 할 수 있습니다

+0

세부 정보 및 링크 및 글 머리 기호에 감사드립니다. 직업적인! –

1

행운을 빕니다. Excel 리본에서 '데이터'> '웹을 선택하십시오. 파이썬을 사용하여 구부릴 경우 https://datanitro.com/을 시도하십시오. Datanitro는 탁월한 Python-Excel 통합입니다. 문제가 있으면 여기 데모 http://scriptogr.am/richie/post/python-for-excel-using-datanitro

+0

또 다른 관점. 감사. –

+0

불행히도 DataNitro는 학생이 아니라면 무료가 아닙니다. 그렇지 않으면 99 달러가 든다. – twasbrillig

관련 문제