2017-11-28 1 views
0

엑셀 testFile.xlsx 파일, 그것은 아래처럼 보이는이있어 :AWS GLUE 데이터 가져 오기 문제

ID ENTITY STATE 
1 Montgomery County Muni Utility Dist No.39 TX 
2 State of Washington WA 
3 Waterloo CUSD 5 IL 
4 Staunton CUSD 6 IL 
5 Berea City SD OH 
6 City of Coshocton OH 

가 지금은 AWS 접착제 데이터베이스로 데이터를 가져올, AWS GLUE에서 크롤러가 생성되었습니다 , 크롤러를 실행 한 후에 AWS GLUE 데이터베이스의 테이블에 아무것도 없습니다. 나는 AWS GLUE에서 분류 자의 문제가되어야한다고 생각하지만 AWS GLUE 데이터베이스로 Excel 파일의 데이터를 성공적으로 가져 오기 위해 적절한 분류자를 생성 할 생각이 없습니다. 어떤 답변이나 조언을 주셔서 감사합니다.

답변

0

"크롤러를 실행 한 후 AWS Glue 데이터베이스의 테이블에 아무 것도 없습니다"라고 말하면 접착제 UI에서 데이터베이스를 클릭 한 다음 데이터베이스 이름을 클릭 한 다음 "Tables in xxx" , 그리고 아무것도 나타나지 않고있다?

질문의 두 번째 부분은 Glue 데이터베이스에 파일의 실제 데이터 행을 가져 오기 위해 Glue를 찾고 있음을 나타냅니다. 그 맞습니까? Glue 데이터베이스는 데이터 행을 저장하지 않고 파일에 대한 스키마 정보 만 저장합니다. 실제로 데이터 파일에서 데이터를 mySQL과 같은 것으로 옮기려면 Glue ETL 작업 또는 Athena 또는 하이브 (hive)를 사용해야합니다.

1

접착제 크롤러에는 MS Excel 파일 (.xlsx 또는 .xls)에 대한 분류가 없습니다. Here 지원되는 형식 및 내장 분류 기준 목록을 찾을 수 있습니다. AWS Glue Catalog로 내보내기 전에 파일을 CSV 또는 기타 지원되는 형식으로 변환하는 것이 좋습니다.

관련 문제