0

오픈 소스 인 데이터 시각화 도구를 찾고 있으며 백엔드로 아파치 스파크를 사용합니다. 일부 연구를 수행했으며 Apache Zeppelin으로 좁힐 수 있습니다. Apache Zeppelin에서 생성 된 표를 기반으로 차트/그래프 등을 생성 할 수 있습니다. 스파크 SQL하지만, 여기에 내 문제가있다, 데이터 비주얼을 보는 비 기술적 인 사용자가있을 것이고, 그들은 SQL 등을 쓰는 방법을 알지 못할 것이라고 생각한다. 그래서 나는 더 나은 방법/툴을 알고 있는지 알고 싶다. 드래그/드롭하고 코딩 할 필요가없는 것, 최소한의 학습 곡선. 조언을 해주십시오.백엔드 스파크가있는 웹 기반 데이터 시각화 응용 프로그램?

감사 프라 딥

+0

이미 사용하고있는 SQL 기반 도구가 있습니까? 그렇다면 Spark JDBC Server를 실행하고 도구를 통해 연결할 수 있습니다. –

답변

0

이 정확히 대답은 사용자의 요구에 맞게하지 않을 수 있습니다.

드래그 앤 드롭 지원을위한 상용 도구가 있습니다.

  • 극적 장면
  • 팁코 Spotfire의
  • SAS 비주얼 분석

것은 사용자 친화적 인 드래그 앤 드롭 도구를 구축하는 것은 매우 비용이 많이 드는 것입니다.

데이터 엔지니어가 잘 ​​설계 한 Zeppelin 노트북과 같은 기능이있는 경우

  • 로드 데이터 결과를 게시 Dynamic Form

  • 하여 데이터를 탐색

  • 일부 단락을 촉발

유스 케이스

아마도 다량 이미 해결할 수 .

수정 코드는 코드 작성보다 훨씬 쉽습니다. 제플린 (Zeppelin) 노트에 spark-highcharts으로 차트를 분석하고 플로팅하는 코드가 있다고 가정 해 보겠습니다.

import org.apache.spark.sql.functions._ 
import com.knockdata.spark.highcharts._ 
import com.knockdata.spark.highcharts.model._ 

highcharts(bank 
    .series("x" -> "age", "y" -> avg(col("balance"))) 
    .orderBy(col("age"))).plot() 

그런 다음 우리는 ... age

기능 sum, min이 있습니다를 대체 할 수

marital, job, education이 있습니다 같은 짧은 안내를 할 수 있습니다 max ... 교체 할 ... avg

관련 문제