그래서 저는 Spark RDD와 협력하고 있습니다. 나는 다음과 같은 형식이러한 형식의 키 값 쌍을 만들려면 어떻게해야합니까?
Actor1 Movie1
Movie2
Movie3
Actor2 Movie4
Movie5
Movie6
와 탭으로 구분 된 파일을 가지고 그리고 난 키가 배우이며, 값은 배우 주조되었던 영화 어디, 키 값 쌍을 만들려고합니다. 스칼라 또는 파이썬을 사용하여 어떻게 할 수 있습니까? 텍스트 파일을 읽고 다음과 같은 탭에서 줄을 나눌 수 있지만 키 값 쌍을 구성하는 방법을 모릅니다.
lines = sc.textFile("file")
tuples = lines.map(lambda x: x.split("\t"));
# how do I create key value pairs???
입력 파일이 그대로 주어 지므로 변경할 수 없습니다. – MetallicPriest