다음과 같은 문자열이 있습니다. 첫 번째 행은 머리글이고 나머지는 열 값입니다. 문자열에서 데이터 프레임 (Spark 1.6 및 Java7)을 만들고 col3 및 col4의 값을 DOUBLE로 변환하려고합니다.공백으로 구분 된 텍스트 파일을 읽고 하이브에 저장하는 방법?
col1 col2 col3 col4 col5
val1 val2 val3 val4 val5
val6 val7 val8 val9 val10
val11 val12 val13 val14 val15
위의 데이터 프레임을 만든 후에는 값이 상수 인 첫 번째 행에 두 개의 필드가 있습니다.
const1 const2 col1 col2 col3 col4 col5
const1 const2 val1 val2 val3 val4 val5
const1 const2 val6 val7 val8 val9 val10
const1 const2 val11 val12 val13 val14 val15
나는 스키마와 테이블을 하이브 위 dataframe을 쓰고 싶어 (const1의 INT, const2의 INT, COL1, 더블 더블 COL2, 더블 COL3, 더블 COL5, 더블 col4). Spark 1.6과 Java7을 사용하고 있습니다.