2012-05-11 2 views
3

BigQuery를 제공 한 Google에 감사드립니다.
BigQuery에서 근사 문자열 일치/퍼지 문자열 검색이 가능합니까?
Google에서 BigQuery에이 기능을 추가 할 계획이 있습니까?BigQuery에서 근사 문자열 일치/퍼지 문자열 검색이 가능합니까?

Google 지적 재산권을 유지하면서 BigQuery에이 기능을 제공하기 위해 Google의 독점적 인 Approximate String Matching 알고리즘을 사용할 수 있습니다. BigQuery 설명서 및 스택 오버플로 관련 질문을 모두 검색했습니다. 물론 BigQuery와 통합하는 방법에도 불구하고이를 수행 할 수있는 알고리즘이 많이 있습니다.

우리의 필요성은 약간 다를 수 있지만 거의 동일 할 두 문자열을 비교하는 것은 간단합니다. 예를 들어 우리의 BigQuery 테스트에서

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC". 

는 BigQuery에 그들을 가입하는 두 개의 문자열도 각 문자열에 후행 공백의 수까지 정확하게 일치 할 필요가 나타납니다. 이 기능을 추가하거나 BigQuery와 통합하기위한 지침을 크게 높이 실 것입니다. 이것은 밀워키 제트, 밀워키, 위스콘신에서 지역, 혁신, 분수 제트기 소유 회사의 지원입니다. BigQuery를 제공 한 Google에 다시 한 번 감사드립니다.

는 앤드류 Paullin이 (414) 212-5372

답변

4

은 불행하게도, 대략적인 문자열 일치가 지원되지 않는, 대단히 및 안부 감사드립니다. 가장 근접한 것은 정규식을 사용하는 것입니다. 가장 좋은 건 BigQuery에 도달하기 전에 데이터를 정규화하는 것입니다. 즉, "Rhodes USA"와 "Rhodes, USA."를 동일한 문자열로 변환하십시오. 그러나이 지원을 위해 기능 요청 버그를 추가하겠습니다.

관련 문제