2011-08-19 5 views
0

주소와 특정 정크 데이터가 크롤링되어 DB에 저장된 특정 회사에 대한 정보를 웹 사이트에서 수집했습니다. 나는 주소 또는 위치 식별자

- junk here 
- junk here 
- 10100 Trinity Parkway, 5th Floor Stockton, CA 95219 
- junk here 

내 DB 정크 데이터뿐만 아니라 실제 주소에서 보는 바와 같이

내가 정크 데이터를 제거하고 실제를 식별 할 존재, 주소를 파악하고, 예를 들어, 스크랩 또는 정크 데이터를 제거하려면 주소.

Java 또는 다른 무료 API를 통해 가능합니까?

감사합니다, 스크럽 주소로
KARTHIK

답변

0

사용 CASS software. USPS 웹 인터페이스와 같은 무료 API는 일반적으로 주소 만 보내는 것으로 가정하므로 정크가 접미사/접미사로 붙는 경우 여러 번 시도를 보내고 가장 적합한 항목 만 준비 할 수 있도록 준비하십시오.

1

확실히 온라인 주소 확인 서비스가 필요합니다. 자바 (또는 다른 프로그래밍 언어)는 본질적으로 주소를 이해할 능력이 없습니다. 프로그래밍 언어의 맥락 밖에서 진실의 근원으로 작업해야합니다.

Google지도를 사용하기위한 제안이 여기에 있었지만 기본 해결책이라고 생각합니다. 그러나 답변의 품질은 매우 좋지 않은 데이터의 품질에 크게 좌우됩니다. Google지도는 주소 확인을 염두에두고 설계되지 않았기 때문에 결과는 여전히 의문의 여지가 있습니다. 또한 비즈니스 요구 사항에 따라 다릅니다. 메일 링 작업을 수행하려면 실제 서비스를 사용하여 주소가 존재하는지 확인한 다음 메일을 보내야합니다. 그렇지 않으면 본질적으로 수백 또는 수천 달러를 버리게됩니다.

내 회사 인 SmartyStreets가있는 address verification 서비스가 있습니다. 예산 (있는 경우) 및 비즈니스 요구에 따라 회사에 가장 적합한 것이 무엇인지 결정해야합니다. Google은 텍스트 파일 또는 Excel 파일을 업로드하고이를 정리 및 처리 할 수있는 기능을 제공하며, 원한다면 Google address verification web service API을 사용하고 주소를 개별적으로 푸시 할 수 있습니다.