엄청난 양의 문자열을 저장하고 중복을 검사하는 가장 좋은 방법은 무엇일까?이 엄청난 양의 고유 한 문자열을 저장하는 가장 빠른 방법은 무엇입니까?
- 중복 검사 속도
- 삽입 새 문자열 시간
- 저장 공간이 하드 디스크 :
우리는 우리의 우선 순위에 대해 생각해야 우리의 목표가 빠른 중복 검사 및 새로운 문자열 삽입 시간 (임의 액세스 또는 저장 공간 없음) 인 경우 최상의 솔루션 e matter)? SQL 데이터베이스에 대해 생각하지만 DB 중 어떤 것이이 솔루션에 가장 적합한가요? MySQL과 같은 SQL DB를 사용한다면 어떤 스토리지 엔진이 가장 좋을까요? (물론 데이터 양 때문에 메모리를 제외해야합니다)
"임의 액세스 시간"의 의미에 대해 자세히 설명해 주시겠습니까? 데이터가 문자열 집합 인 경우 "추가", "포함"및 "삭제"작업 만 수행 할 수 있습니다. –
문제에 관해 더 자세히 알려 주시면 런타임시 문자열을 사용하고 메모리에 저장할 수있을 정도로 충분히 도움이 될 수 있지만 목록/해시/배열에 저장하는 것이 가장 좋습니다. 아직 항목이 없다면 항목을 추가 한 다음 끝에 배열을 작성하십시오 (런타임 이후에 필요하면 다시 정교합니다). – deed02392
뚜렷한 문자열 모음을 모으거나 중복 된 항목을 필터링하려고합니까? 목표는 무엇입니까? 특히 : 예상되는 중복 양은 얼마입니까? 거의 모든 것이 중복되어지기를 기대합니까? 아니면 희귀 한 사건입니까? 모든 새 값을 데이터베이스에 추가 하시겠습니까? –