아래 텍스트를 의미 함수를 전달하는 기능를 포함하는 객체 직렬화 실수 때 조심 Learning Spark함수를 포함하는 객체 직렬화 -
은 저자가 여기에 전달하기 위해 노력하고 어떤 메시지를 설명해주십시오.한 문제의 제 3 장에서입니다. 객체의 구성원 인 함수를 전달하거나 객체의 필드 (예 : self.field)에 필드에 대한 참조를 포함하면 Spark는 전체 객체 을 작업자 노드로 보냅니다. 이는 비트보다 훨씬 클 수 있습니다. 정보 이 필요합니다 (예 3-19 참조). Python이 피클하는 방법을 알아낼 수없는 개체가 클래스에 포함되어있는 경우 가끔 이로 인해 프로그램이 실패 할 수도 있습니다.
솔직히 저자는 변수가 파이썬에서 어떻게 작동하는지 이해하지 못하기 때문에 잘못되었다고 생각합니다. 아마도 안전한 예에서'query'는'self.query'의 다른 이름 일 뿐이므로 결과는 같습니다. – martineau