두 개의 데이터 세트가 있고 각 데이터 세트에는 두 개의 요소가 있습니다. 다음은 예제입니다.키로 스칼라 스파크로 두 데이터 세트를 결합하는 방법
데이터 1 : (이름, 동물)
('abc,def', 'monkey(1)')
('df,gh', 'zebra')
...
데이터 2 : (이름, 과일)
('a,efg', 'apple')
('abc,def', 'banana(1)')
...
결과 예상 : (이름, 동물, 과일)
('abc,def', 'monkey(1)', 'banana(1)')
...
I 첫 번째 열 'name'을 사용하여이 두 데이터 집합에 참여하려고합니다. 나는 이것을 몇 시간 동안 해보려고했지만, 알아 내지 못했습니다. 누구든지 나를 도울 수 있습니까?
val sparkConf = new SparkConf().setAppName("abc").setMaster("local[2]")
val sc = new SparkContext(sparkConf)
val text1 = sc.textFile(args(0))
val text2 = sc.textFile(args(1))
val joined = text1.join(text2)
위의 코드가 작동하지 않습니다!
을 확인 결과하자? – maasg
어떤 종류의 오류가 발생합니까? 그것은 무엇을 말하는가? – maasg
@maasg ''기호 결합을 해결할 수 없습니다 '라는 메시지가 나타납니다. – tobby