AttributeError
또는 다른 런타임 예외를 던지기 전에 30 분 동안 실행되는 pyspark.sql
의 Apache Spark 데이터로드 및 변환 응용 프로그램이 있습니다.Spark 응용 프로그램에서 명령문 시퀀스를 단계별로 실행하는 방법은 무엇입니까?
Apache Pig의 ILLUSTRATE
과 같은 작은 데이터 샘플을 사용하여 응용 프로그램을 엔드 - 투 - 엔드로 테스트하고 싶습니다. 데이터를 샘플링하는 것은별로 도움이되지 않습니다. 이 작업을 수행하는 간단한 방법이 있습니까?