1
나는 웹에서 html 형식의 위키피디아 기사를 가져 왔습니다. 기사를 설명하는 일반 텍스트와 기사가 속한 카테고리 정보를 추출해야합니까?html 페이지에서 wikipedia 기사의 텍스트 및 카테고리 정보를 추출합니다.
나는 웹에서 html 형식의 위키피디아 기사를 가져 왔습니다. 기사를 설명하는 일반 텍스트와 기사가 속한 카테고리 정보를 추출해야합니까?html 페이지에서 wikipedia 기사의 텍스트 및 카테고리 정보를 추출합니다.
카테고리를 잡으려면 HTML을 구문 분석하는 것보다 API를 사용하는 것이 더 쉽습니다.
API는 여기에 설명되어 있습니다 : http://en.wikipedia.org/w/api.php
에 오신 것을 환영합니다을 SO. 당신의 질문은 무엇이고 이미 시도한 것은 무엇입니까? –