0
파이썬 스파크를 사용하고 있으며 각 파티션에서 http에 액세스하려고했습니다. 그러나 그것은 항상 샘플 다음으로, 거기에 붙어 :python spark가 실행 프로그램의 http 서버에 액세스 할 수 없습니다.
sc = SparkContext(appName="Fetch Http")
lines = sc.textFile("urls.txt", 10)
lines.map(fetch).saveAsTextFile("hdfs://node1/pages")
def fetch(url)
http = urllib3.PoolManager()
postResponse = http.request('POST',url,headers=JSON)
jData = json.loads(postResponse.data)
vectorStr = contertFun(jData)
return vectorStr
귀하의 통제하에있는 서버입니까? 그렇지 않은 경우 무엇이 응답 할 것이며 잠재적 인 공격으로 요청을 무시하지 않을 것이라고 생각하게합니까? –