2013-02-28 2 views
0

지금은 흥미로운 상황이 있습니다 ... 내 목표는 사람의 이름, 생년월일 및 기타 자격 증명 (논쟁의 여지가 있음)을 받아들이고 추출 할 수있는 소프트웨어를 갖추는 것입니다. 가능한 한 인터넷에서 그에게 관한 많은 정보가 있습니다.정보 소개 인터넷을 통한 정보 수집

이제 Google 검색 API와 Scrapy와 같은 웹 크롤러를 사용하여 어느 정도 목표를 달성 할 수있었습니다 ... 그러나 Google에서 단순히 큰 따옴표로 사람의 이름을 검색한다고해서 항상 올바른 결과가 산출되는 것은 아닙니다. ...

두 가지 질문이 여기에 있습니다. 정확성을 높이려면 어떻게해야합니까? 둘째, 바퀴를 다시 발명합니다. th로서 사람들을 찾을 수있는 사이트가 있습니까 ...)? 그렇다면 이미 오픈 소스 코드 (또는 사용할 수있는 모든 것)가 있습니다.

답변

1

이 답변은 많은 양의 URL에 대해 스크레이퍼를 사용하는 방법과 관련이 있습니다. 예를 들어, SmokeDoc으로 시작할 수 있습니다.

+0

의견 및 제안에 감사드립니다. 나는 그것을 조사 할 것이다. 그러나 나의 가장 큰 문제는 사람에 관한 정보를 정확하게 찾는 것이다. – ArslanW

+0

많은 수의 속성에 적합한 알고리즘은 검색의 정확도를 결정할 것이다. – user1929959