1
collecting
(조치)없이 findSynonyms
작업을 사용하려고합니다. 다음은 그 예입니다. 벡터가 들어있는 DataFrame
입니다.데이터 단어에 불꽃 word2vec 찾기 동의어
df.show()
+--------------------+
| result|
+--------------------+
|[-0.0081423431634...|
|[0.04309031420520...|
|[0.03857229948043...|
+--------------------+
나는이 DataFrame
에 findSynonyms
를 사용하고 싶습니다. 시도 :
df.map{case Row(vector:Vector) => model.findSynonyms(vector)}
그러나 null 포인터 예외가 발생합니다. 그럼, 스파크가 중첩 된 변형이나 동작을 지원하지 않는다는 것을 배웠습니다. 한 가지 가능한 방법은 DataFrame
을 수집하고 findSynonyms
으로 실행하는 것입니다. DataFrame
레벨에서 어떻게이 작업을 수행 할 수 있습니까?