카산드라에서 대량 데이터로드가 필요한 요구 사항이 있습니다. 나는 Google 검색을 수행하여 SSTABLE 로더가 cassandra의 대량 데이터를로드하는 데 사용될 수 있음을 발견했습니다. DataStax를 사용하고 있으며 Apache Sqoop을 사용할 수 있는지 여부를 알고 싶습니다. 대량 데이터는 CSV 형식입니다. Apache SQOOp를 사용할 수 있다면 sqlo를 사용하여 CSV 형식의 대량 데이터를로드하는 방법에 대한 구문을 알려주십시오.카산드라에서 벌크로드
0
A
답변
2
Scoop은 CSV 파일이 아닌 JDBC 저장소 (관계형 데이터베이스)에서 가져 오기 용이므로 사용할 수 없습니다 그것.
파일 크기가 작 으면 (즉, 컴퓨터 한 대에 적합) CQL 쉘 COPY FROM
을 사용하여 가져 오기를 고려해야합니다. 먼저 가져 오는 스키마와 일치하는 테이블을 만든 다음 (자신의 열, 파일 이름과 구분 기호 사용) CQL 쉘에서이 명령을 실행
COPY mytable(col1, col2, col3) FROM ('myfile.csv') WITH DELIMITER=',';
을 그리고 당신은 완료됩니다. 그래서 이것은 쉬운 방법입니다.
이제 SSTableLoader에 대해 들었습니다. 사용하고 싶다면 파일을 SSTable로 변환 할 사용자 정의 Java 프로그램을 작성해야합니다. 당신이 묘사 한 바에 따르면, 이것은 당신의 시나리오를위한 최선의 방법이 아닐 수도 있습니다. CSV 파일이 정말 거대한 경우에도 관련된 단계를 설명하는 here's a blog post (복잡한 연습입니다. 따라서 여기서는 반복하지 않겠습니다).
관련 문제
- 1. "벌크로드"란 무엇을 의미합니까?
- 2. Proc 첨부 벌크로드
- 3. 카산드라에서 매우 느린 글입니다.
- 4. 카산드라에서 systemtimestamp를 얻는 방법
- 5. 카산드라에서 트랜잭션 지원 제공
- 6. 카산드라에서 마지막 레코드를 받으십시오.
- 7. 카산드라에서 업데이트가 가능한가?
- 8. "전체 벌크로드"로 HBase 대량 삭제
- 9. 카산드라에서 열의 크기를 찾는 방법
- 10. 카산드라에서 "LIKE"절을 사용하는 방법
- 11. 카산드라에서 CDC를 구현하는 방법은 무엇입니까?
- 12. 카산드라에서 대규모 데이터 집합 쿼리하기
- 13. 카산드라에서 테이블의 크기를 얻는 방법?
- 14. 카산드라에서 어떻게 과거 데이터에 액세스합니까?
- 15. 카산드라에서 값 집합으로 준비된 문
- 16. 카산드라에서 복사 명령이 작동하지 않습니다.
- 17. 카산드라에서 디버깅하기 위해 commons-logging
- 18. 카산드라에서 다음 유스 케이스를 처리할까요?
- 19. 카산드라에서 마지막 타임 스탬프 받기
- 20. 카산드라에서 사소한 압축을 강제 하시겠습니까?
- 21. 대량로드 대신 사용할 대상은 무엇입니까? '벌크로드 명령문을 사용할 권한이 없습니다.'
- 22. 카산드라에서 수백만 개 이상의 레코드 읽기
- 23. 카산드라에서 비정규 화 된 데이터를 업데이트하십시오.
- 24. 카산드라에서 안정적인 삽입 시간을 얻는 방법?
- 25. 카산드라에서 행의 열 개수를 계산하는 방법은 무엇입니까?
- 26. 카산드라에서 진행되는 읽기/쓰기 횟수 계산 방법
- 27. 카산드라에서 찾을 수없는 열쇠를 알고 싶습니까?
- 28. 저장 및 검색을 float []에/카산드라에서 헥터
- 29. 카산드라에서 100000 개의 행을 가져 오는 중
- 30. 카산드라에서 두 개의 열 패밀리를 비정규 화합니다.