일부 하이브 UDF를 만들었습니다. 이제 우리는 테이블 생성을 위해 하이브리드 내부에서 이러한 UDF를 사용하려고 생각하고 있습니다. 동화 XYZ { 필드 1 ...하이브 UDF 이해
fieldn } 같은 을 { 가 udf1() udf2() 을 선택 작성
... ABC에서
UDFN() , def)
이제 우리는 올바른 방법인지 확신 할 수 없습니다. 내 이해에 따라 각 행에 대해 UDF를 호출하고 내 데이터가 수백만 개에 해당하므로 클러스터의 모든 리소스를 사용할 수 있습니다.
내 이해가 정확합니까? 또는 성능에 문제가 없으며 위의 ql을 설명한대로 사용할 수 있습니다.
감사합니다.