0
온라인 소스에서 JSON 형식으로 데이터를 추출하여 Apache Flume을 통해 Hdfs에 저장하고 있습니다. 이제 Hadoop처럼 다중 파일을 만듭니다. 이제이 모든 데이터에서이 데이터를 검색하여 관련 정보를 얻고 싶습니다. 해결 방안은 무엇인가?hadoop에서 검색 hdfs 데이터
온라인 소스에서 JSON 형식으로 데이터를 추출하여 Apache Flume을 통해 Hdfs에 저장하고 있습니다. 이제 Hadoop처럼 다중 파일을 만듭니다. 이제이 모든 데이터에서이 데이터를 검색하여 관련 정보를 얻고 싶습니다. 해결 방안은 무엇인가?hadoop에서 검색 hdfs 데이터
MapReduce 또는 Spark를 사용하여 hdfs에서 검색 할 수있는 자체 스크립트를 개발할 수 있습니다. 당신은 또 다른 해결책이 있습니다, 당신은 하이브와 돼지를 사용할 수 있습니다. Pigg 가이드 : http://archive.cloudera.com/cdh/3/pig/tutorial.html 하이브 가이드 : https://cwiki.apache.org/confluence/display/Hive/LanguageManual