매우 간단한 작업을하고 싶지만 Python/Spark (1.5)/Dataframe에서 수행하는 방법을 이해할 수 없습니다 (모든 것이 저에게 새로운 것입니다) .Python Spark Dataframes : 다른 열의 조건을 기반으로 열을 업데이트하는 방법
원본 데이터 셋 :
code| ISO | country
1 | AFG | Afghanistan state
2 | BOL | Bolivia Plurinational State
새로운 데이터 세트 :
code| ISO | country
1 | AFG | Afghanistan
2 | BOL | Bolivia
나는 이런 식으로 뭔가 할 싶습니다 (의사 파이썬을?) :
iso_to_country_dict = {'AFG': 'Afghanistan', 'BOL': 'Bolivia'}
def mapCountry(iso,country):
if(iso_to_country_dict[iso] is not empty):
return iso_to_country_dict[iso]
return country
dfg = df.select(mapCountry(df['ISO'],df['country']))
그냥 단순에 대한 mapCountry는 다음과 같이 표시 될 수 있습니다.
그러나이와가 오류입니다 : ValueError: Cannot convert column into bool:
당신은 불꽃의 열을 업데이트 할 수 없습니다. 당신은 항상 하나의 데이터 프레임을 다른 적용 가능한 로직으로 변환합니다. –
예, 그게 내가하고있는 일이다. 다른 데이터 프레임 df -> dfg (더 의미있는 이름을주게되어 미안하다.) – Babu
"열을 업데이트하는 방법"에 대한 질문을 언급했다. –