2017-02-07 2 views
1

데이터 유형이 혼합되어 있습니다. spark.sql('select a,b,c from table') 명령을 사용하여 하이브 테이블에서이 데이터 프레임을 읽습니다.데이터 프레임의 모든 열을 문자열로 변환하는 방법

일부 열은 int, bigint, double 및 기타 문자열입니다. 총 32 개의 열이 있습니다. pyspark에서 데이터 프레임의 모든 열을 문자열 유형으로 변환하는 방법이 있습니까?

답변

7

그냥 :

from pyspark.sql.functions import col 

table = spark.sql("table") 

table.select([col(c).cast("string") for c in table.columns]) 
관련 문제