다른 Dataframe과 결합한 다음 원본 행을 기준으로 그룹화하려고하지만 원래 행에는 고유 ID가없는 DataFrame이 있습니다. 고유 한 ID를 추가하거나 그 목표를 달성하려면 어떻게해야합니까?DataFrame, Apache Spark, Scala에 고유 ID 열을 추가하는 방법
답변
당신은
import org.apache.spark.sql.functions._
val unique_df = original_df.withColumn("UniqueID", monotonically_increasing_id)
위와 같이 실행 해 보았습니다. 하지만 난 점점 : 아니 모듈 monotonically_increasing_id – user3245256
그 일을하기로되어 있습니다. 그 import 문을 사용 했습니까? 스파크 버전은 무엇입니까? – Tawkir
감사합니다. 나는 일하도록했다. 이 특별한 import 문은 나에게 효과가 없었다. 나는 그것을 다음과 같이 변경해야했다 : pyspark.sql.functions에서 import monotonically_increasing_id – user3245256
- 1. Apache Spark 및 Scala에 jar가 필요합니다.
- 2. DataFrame/Dataset에 대한 논리 계획 Apache spark
- 3. Spark Dataframe 열을 문자열 배열의 단일 열로 변환하는 방법
- 4. spark dataframe - GroupBy aggregation
- 5. NoClassDefFoundError : spark-cassandra-connector의 org/apache/spark/sql/DataFrame
- 6. Apache Ignite에서 spark DataFrame/DataSet을 저장하고 읽는 방법?
- 7. Spark DataFrame groupBy
- 8. Spark DataFrame AnalysisException
- 9. Spark Sql 1.5 dataframe saveAsTable 하이브 테이블 속성을 추가하는 방법
- 10. Spark DataFrame and Cassandra
- 11. Jupyter 커널의 Scala에 외부 jar를 추가하는 방법
- 12. Apache Spark에서 여러 열을 추가하는 방법
- 13. Apache Spark MultilayerPerceptronClassifier 설정
- 14. Spark DataFrame UDF Partitioning Columns
- 15. Spark DataFrame vs sqlContext
- 16. Spark : Dataframe Serialization
- 17. Spark Implicit $ for DataFrame
- 18. Transpose Spark DataFrame 배열로 집계하기
- 19. Spark Udf 함수에 Dataframe 입력 사용
- 20. Apache Spark Dataframe - CSV 파일의 n 번째 라인에서 데이터로드
- 21. DataFrame API가있는 Apache Spark MLlib는 createDataFrame() 또는 read(). csv (...)
- 22. 이 나는 테이블의 고유 ID 열을 변경해야
- 23. Spark DataFrame 두 개 이상의 열을 기반으로하는 집계
- 24. Spark Dataframe 열을 벡터에서 집합으로 변환하는 방법은 무엇입니까?
- 25. Apache Spark SQL 컨텍스트 dropDuplicates
- 26. Apache Spark DataFrame의 모든 열에 대해 고유 한 값의 수를 계산하는 방법
- 27. 이메일을 통해 Spark DataFrame 보내기
- 28. Apache Flink - 입력에 고유 ID 할당
- 29. Spark Dataframe to MongoDB 문서 삽입 문제
- 30. SQLContext :: IndexError가있는 Apache SPARK
당신이 열 세부 사항을 모두 샘플 dataframes을 추가하시기 바랍니다 수 monotonically_increasing_id 사용할 수 있습니까? –