2017-10-11 2 views
0

Oracle Big Data Spatial 및 Graph를 사용할 것입니다. PGQL을 사용하여 분산 형 그래프를 쿼리해야합니다. (PGX를 사용하는 기본/주어진 알고리즘으로는 충분하지 않습니다.) 그래프는 HBase를 사용합니다.Presto를 사용하여 PGQL을 사용하여 Oracle Spatial 및 Graph를 쿼리 할 수 ​​있습니까?

문제는 PGQL이 CDH 클러스터의 단일 노드에서만 작동한다는 것입니다. 한 x에 단일 노드를 조회 할 수는 있지만 클러스터의 전체 메모리를 사용할 수는 없습니다. 모든 노드를 쿼리 한 다음 노드의 결과를 집계 (결합)하여 사용자에게 제공하는 방법이 필요합니다.

Presto가이 문제를 해결할 수있는 방법이 있습니까?

답변

1

현재 PGQL Distributed Engine (PGX.D)에서는 PGQL이 실행되지 않습니다. PGX.D에서 PGQL을 지원하는 것은 우리의 로드맵에 있습니다.

현재 클러스터에서 분산 쿼리를 실행해야하는 경우 Oracle Big Data Spatial 및 Graph에서 지원하는 Spark 통합을 사용하는 것이 좋습니다.

다음 dev 가이드의 섹션 5가 도움이 될 것 같습니다. http://docs.oracle.com/cd/E86005_01/BDSPA/using-property-graphs-big-data.htm#BDSPA-GUID-EFECEBBB-6BD6-4A63-B962-DB5AD7EB4C03

Presto와 관련하여 Hive (및 다른 몇 가지 데이터 소스)에서 데이터를 사용할 수있는 것 같습니다. 따라서 이론적으로 HBase에 저장된 그래프 데이터 위에있는 뷰 (외부 테이블)를 하이브에 정의한 다음 Presto를 실행할 수 있습니다. 이 흐름을 확인하고 테스트해야합니다.

+0

이 링크는 질문에 대답 할 수 있지만 답변의 핵심 부분을 여기에 포함시키고 참조 용 링크를 제공하는 것이 좋습니다. 링크 된 페이지가 변경되면 링크 전용 답변이 유효하지 않게 될 수 있습니다. - [리뷰에서] (리뷰/저품절 포스트/17609567) –

관련 문제