2016-07-07 2 views
0

컴퓨터가 해당 데이터를 읽고 컴퓨터 프로그램으로 촬영하여 데이터를 사용할 수있는 방법이 있는지 궁금했습니다. 예를 들어, ESPN의 사이트로 가서 리그 순위를보고 내 코드로 레코드를 보내면 가능할 것입니다. 일부 사이트에는 사용할 수있는 API가 있지만 사용하려는 사이트는 알 수 없습니다.다른 웹 페이지의 HTML 표에서 데이터를 추출하는 방법이 있습니까?

+1

Nopes합니다. 불가능합니다. CORS. –

+0

공개 API가없는 경우 [웹 스크래핑] (https://it.wikipedia.org/wiki/Web_scraping)에서 약을 걸릴 수 있습니다 – Signo

+0

ESPN 서버에 요청하는 서버에 요청할 수 있습니다 데이터를 가져올 수 있습니다. – gcampbell

답변

0

파이썬에서 Beautiful Soup (https://www.crummy.com/software/BeautifulSoup/bs4/doc/)을 사용하여 기계 학습을 위해 데이터 스크래핑을 구현했습니다. 그것은 '아름답게'작동합니다. 즉, 페이지의 HTML을 가져 와서 객체로 변환하여 작업하고 특정 태그 (예 : 테이블 태그)를 검색 할 수 있습니다.

0

가장 좋은 방법은 기술 습득이 없다면 웹 스크래핑을 사용하는 것입니다. 이것은 HTML보다 더 많은 것을 요구할 것입니다. 당신이 당신의 자신을 구축하지 않으려면 아마도이 밖으로 시도 :

http://webscraper.io/

관련 문제