csv 파일을 받아서이 파일을 읽고 Cassandra에 씁니다. 나는 많은 데이터 (일일 약 1000 만 줄)에 대해 이렇게한다. 파일 자체는 상당히 작다 (100에서 1000 줄까지)많은 데이터에 데이터가 이미 존재하는지 확인하십시오.
내가 원하는 것은 데이터베이스에 쓰기 전에 검사하는 것이다. 열쇠를 삽입하려고하는데, 이미 존재합니다.
나는 Select count(*) from table where primary key1 = something and key2 is something else
으로 할 수 있음을 알고 있습니다.
그러나 이것은 느립니다. 이미 카산드라에있는 데이터에 영향을 주면 빠른 속도로 전체 파일을 확인하고 싶습니다. 내가 원하는 것을 얻을 수있는 방법이 있습니까? (또는 일괄 처리가 행에 영향을 줄지 여부를 확인하는 것과 비슷한)
당신은 당신에게 테이블 스키마를 게시 할 수 있을까요? 특히 어떤 키가 파티션이고 어떤 것이 클러스터링입니까? – yurgis