문제점 처리 중 : 데이터 가상화 & 예측 인프라를 만들고 싶습니다.빅 데이터 아키텍처 : Hive 또는 Hadoop이 적용된 Elasticsearch-Kibana
나는 Hdfs (ES-Hadoop 포함), & Spark (Python)을 모델링을 위해 Hdfs에 대해 생각했다.
제 질문은 : ES로 Hdfs의 데이터를 올바르게 색인화 할 수 있습니까? 아니면 Elasticsearch & Hdfs 사이에 하이브 또는 스파크를 사용해야합니까?
어떤 아키텍처가 가장 좋은 방법인지 모르겠습니다.
내 질문에 명시 적으로 ... 나는 HDFS에서 직접 데이터를 인덱싱하는 것이 좋습니까? 아니면 하이브로 데이터를 인덱싱하는 것이 좋습니까? –