내 텍스트 파일에서 이러한 라인 데 사용하여 각 행에서 특정 요소를 찾을 수 :어떻게 foreach 문을 사용하여 JavaRDD를 반복하고 스파크 자바
Some different lines....
Name : Praveen
Age : 24
Contact : 1234567890
Location : India
Some different lines....
Name : John
Contact : 1234567890
Location : UK
Some different lines....
Name : Joe
Age : 54
Contact : 1234567890
Location : US
일부 다른 선이 나타내는 것은 그 사이에 다른 정보입니다 .
이제 파일을 읽고 사람 정보를 추출해야합니다. 누락 된 키가 있으면 빈 문자열로 읽어야합니다 (두 번째 사람 정보에 연령이 없음).
JavaRDD<String> data = jsc.textFile("person.report");
List<String> name = data.filter(f -> f.contains("Name")).collect();
List<String> age = data.filter(f -> f.contains("Age")).collect();
List<String> contact = data.filter(f -> f.contains("Contact")).collect();
List<String> location = data.filter(f -> f.contains("Location")).collect();
위와 같은 방법으로 for 루프를 반복하면 세 번째 사람의 나이가 두 번째 사람에게 할당됩니다.
내가 당신이 어떤 자바 코드가있는 경우 –
공유 나는 다음과 같은 자바 버전을 추가하십시오, 스칼라에 대한 지식이 돈't :이 질문은 자바에 대한 질문을 받았다 이후 좀 더 자세한 더있다 가고있다 같은 논리. 그래도 textinputformat.record.delimiter를 변경하는 아이디어가 있습니까? 그것이 정말로 중요합니다. – Oli
는 구분 기호없이 가능합니까 ?? –