2016-07-29 1 views
2

나는이 지시 사항에 따라 스파크 오지 처리로 이력 로그를 사용 가능하게하려고합니다. 스파크 이력 로그가 클로즈업의 Oozie Spark 액션과 함께 활성화되지 않음

https://archive.cloudera.com/cdh5/cdh/5/oozie/DG_SparkActionExtension.html이 세 스파크 구성 속성을 지정해야합니다, 당신의 스파크 작업이 스파크 기록 서버에 표시되도록하려면 중 하나에 --conf 또는 oozie.service.SparkConfigurationService.spark.configurations

에서 스파크의 opts
  1. spark.yarn.historyServer.address = http://SPH-HOST:18088
  2. spark.eventLog.dir = HDFS : // NN : 8020/사용자/스파크/applicationHistory
  3. spark.eventLog.enabled = TRUE

워크 플로 (고화질)은 다음과 같습니다

<action name="spark-9e7c"> 
    <spark xmlns="uri:oozie:spark-action:0.1"> 
     <job-tracker>${jobTracker}</job-tracker> 
     <name-node>${nameNode}</name-node> 
     <master>yarn-cluster</master> 
     <mode>cluster</mode> 
     <name>Correlation Engine</name> 
      <class>Main Class</class> 
     <jar>hdfs://<MACHINE IP>:8020/USER JAR</jar> 
      <spark-opts> --conf spark.eventLog.dir=<MACHINE IP>:8020/user/spark/applicationHistory --conf spark.eventLog.enabled=true --conf spark.yarn.historyServer.address=<MACHINE IP>:18088/</spark-opts> 
    </spark> 
    <ok to="email-f5d5"/> 
    <error to="email-a687"/> 
</action> 

내가 쉘 스크립트 이력 로그에서 테스트를 올바르게 기록하지만 Oozie 작업 로그가 제대로 기록되지 않습니다에 있습니다. 나는이 모든 세 가지 특색을 정했다.

+0

안녕 대신 내 대답을 확인하시기 바랍니다 XML 조각 아래를 참조하시기 바랍니다 허용 대답하시기 바랍니다 플래그 업 "괜찮아 경우 내 대답 –

+0

에서 언급 같은 인수를 전달하려고 스파크의 opts -by-owner "Thx –

+0

신속한 응답 RamPrasad에 감사드립니다. 구성 섹션에서 사용자가 권장하는대로 속성을 이동했습니다. 이제/user/spark/applictionHistory 위치의 일부 로그를 .inprogress로 할 수 있습니다. 그러나 히스토리 서버에는 여전히 로그가 표시되지 않습니다. – Alchemist

답변

2

제 경험으로, 당신이 잘못된 장소에서 논쟁을 통과했다고 생각합니다.

<?xml version="1.0" encoding="UTF-8"?> 
<workflow-app xmlns='uri:oozie:workflow:0.4' name='sparkjob'> 
    <start to='spark-process' /> 
    <action name='spark-process'> 
     <spark xmlns='uri:oozie:spark-action:0.1'> 
     <job-tracker>${jobTracker}</job-tracker> 
     <name-node>${nameNode}</name-node> 
     <configuration> 
      <property> 
       <name>oozie.service.SparkConfigurationService.spark.configurations</name> 
       <value>spark.eventLog.dir=hdfs://node1.analytics.sub:8020/user/spark/applicationHistory,spark.yarn.historyServer.address=http://node1.analytics.sub:18088,spark.eventLog.enabled=true</value> 
      </property> 
      <!--property> 
       <name>oozie.hive.defaults</name> 
       <value>/user/ambari-qa/sparkActionPython/hive-config.xml</value> 
      </property--> 
      <!--property> 
       <name>oozie.use.system.libpath</name> 
       <value>true</value> 
      </property--> 
      <property> 
       <name>oozie.service.WorkflowAppService.system.libpath</name> 
       <value>/user/oozie/share/lib/lib_20150831190253/spark</value> 
      </property> 
     </configuration> 
     <master>yarn-client</master> 
     <!--master>local[4]</master--> 
     <mode>client</mode> 
     <name>wordcount</name> 
     <jar>/usr/hdp/current/spark-client/AnalyticsJar/wordcount.py</jar> 
     <spark-opts>--executor-memory 1G --driver-memory 1G --executor-cores 4 --num-executors 2 --jars /usr/hdp/current/spark-client/lib/spark-assembly-1.3.1.2.3.0.0-2557-hadoop2.7.1.2.3.0.0-2557.jar</spark-opts> 
     </spark> 
     <ok to='end'/> 
     <error to='spark-fail'/> 
    </action> 
    <kill name='spark-fail'> 
     <message>Spark job failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message> 
    </kill> 

    <end name='end' /> 
</workflow-app> 
관련 문제