0
정수 목록과 sqlcontext 데이터 프레임이 목록의 길이와 같은 행 수로 있습니다. 목록을이 데이터 프레임에 열을 추가하여 순서를 유지하려고합니다. 정말 간단해야한다고 생각하지만 우아한 해결책을 찾을 수 없습니다.목록을 열로 pyspark의 Dataframe에 추가합니다.
정수 목록과 sqlcontext 데이터 프레임이 목록의 길이와 같은 행 수로 있습니다. 목록을이 데이터 프레임에 열을 추가하여 순서를 유지하려고합니다. 정말 간단해야한다고 생각하지만 우아한 해결책을 찾을 수 없습니다.목록을 열로 pyspark의 Dataframe에 추가합니다.
목록이 로컬 객체이고 데이터 프레임이 분산되어 있기 때문에 단순히 목록을 데이터 프레임 열로 추가 할 수 없습니다. collect()
또는 toLocalIterator()
에 의해 지역에
collect 또는 toLocalIterator가 메모리를 압도 할 것이므로 두 번째 작업이 끝났습니다. 문제는 두 번째 요점을 수행하는 방법을 파악하는 데 다소 시간이 걸렸습니다. 두 번째 요점은 부분적으로 제가 질문 한 이유입니다. 나는 더 우아한 방법이 있기를 바랬 기 때문에 이것을 명시 적으로 묻지 않았다. –