2017-10-05 1 views
0

정규식을 다루는데 어려움이 있습니다.팬더에서 괄호를 두 번 제거하는 방법은 무엇입니까?

이것은 내가 작업하고있는 데이터 프레임입니다. kaggle의 데이터입니다. (url = 'https://www.kaggle.com/c/pkdd-15-predict-taxi-service-trajectory-i') 내가 원하는 것은 각 행에 대해 각 [경도, 위도]를 구분하고 각 단위를 사용하는 것입니다. 각 행 긴 & 위도 = long0, lat0] [] [] [] ...... [긴 N, 위도 N] 또는 긴 & 예를 들어

, 위도 =
내가 위도 긴 &처럼 각 단위를 추출 할 [0] = [long0, lat0] 또는 긴 & 위도 [0] = long0, lat0 나는 그것으로 어떻게 처리 할 수 ​​ 가능하다면?

나는 이런 다른 방법을 시도했다.

df_concat['POLYLINE'][0].str.split(',')[0] 
df_concat['POLYLINE'][:3].apply(pd.Series) 

하지만 어떻게 할 수 없습니까?

답변

0

df['long'] = df['long&lat'].apply(lambda x: x[0]) 
df['lat'] = df['long&lat'].apply(lambda x: x[1]) 

또는 단순히

df[['long', 'lat']]=df['long&lat'].apply(pd.Series) 

당신은

long&lat long lat 
0 [100, 50] 100  50 
1 [200, 150] 200  150 
,691,363을 얻을 사용하여 당신이 얻을 위도 긴 값 수

long&lat 
0 [100, 50] 
1 [200, 150] 

DF이 더미를 고려 210

관련 문제