이름 분리에 대한 참조를 찾고 있는데, "John A. Doe"부분은 first = John, middle = A., last = Doe입니다. 멕시코에서는 부계, 모성, 첫 번째 및 두 번째 이름이 있으며 다른 순열로 쓰일 수 있으므로 문제는 상당히 복잡합니다.개인 이름을 파트로 분할하기위한 알고리즘
데이터에 따라 다르므로 우리는 의사 결정을 내릴 수 있도록 모든 단어의 점수를 계산하는 일치하는 소프트웨어로 작업하고 있습니다 (큰 데이터베이스를 기반으로 함). 입력 된 데이터는 깨끗하지 않고 일부 정부 웹 페이지에서 가져온 것으로 사람이 필터링하므로 인식해야하는 정크가있을 수 있습니다. 어떤 제안?
[편집] 예 :
name: Javier Abdul Córdoba Gándara common permutations (or as it may appear in gvt data referring to same person): Córdoba Gándara Javier Abdul Javier A. Córdoba Gándara Javier Abdul Córdoba G. paternal=Córdoba maternal=Gándara first given:Javier second given:Abdul
name: María de la Luz Sánchez Martínez paternal:Sánchez maternal: Martínez first given: María de la Luz
name: Paloma Viridiana Alin Arias Medina paternal: Arias maternal: Medina first given: Paloma second given: Viridiana Alin
나는 각 단어의 의미는 점수에 따라 어떤 말했듯이. 점수가 아닌 경우
Viridiana및
Alin에 이름이 주어 졌는지 알 수있는 방법이 없습니다.
우리는 매우 강력한 데이터베이스 (8 천만 레코드 정도)를 가지고 있으므로 점수 시스템을 사용할 수 있습니다. 나는 그것을 사용하지만 다른 참조를 찾는 알고리즘을 설계하고 있습니다.
멕시코 이름의 몇 가지 예를 제공해 주시겠습니까? –