pandas

1열

1답변

파이썬에서 (판다/누피). 두 개의 독립적 인 시리즈에서 최대/최소값을 가진 열을 만드는 방법은 무엇입니까?

최대 두 개의 다른 계열 (이 시리즈는 데이터 프레임에 없지만 같은 인덱스를 공유 함)로 df.column을 작성해야합니다. 그것들은 모두 동일한 열 이름을 가지기 때문에 데이터 프레임에 추가 할 수는 없으며 엉망이됩니다. 순진 첫 번째 본능은 다음과 같습니다 df['Max'] = "" df.loc[a > b, 'Max'] = a df.loc[a < b

2열

2답변

팬더가없는 두 개의 CSV 병합

병합 할 두 개의 CSV 파일이 있습니다. 팬더와 함께 내가 사용하는 것이 : 오류가 반환되기 전에 내 RAM 사용량은 4기가바이트에서 1.9 GB에서 2.2GB로 이동하지만, : pd.merge(df1,df2, how='left', left_on='ST_LOGINID', right_on='LOGINID') 그러나 팬더는이 작업 ("MemoryError의"

3열

1답변

pandas pd.cut을 사용하여 statsmodels을 사용하여 범주 형 변수 생성

pd.cut을 사용하여 연속 변수에서 범주 형 변수를 만들려고했습니다. 나는 더미 변수를 포함하여 후속 통계 모델로 정의 된 회귀 분석에서 이것을 사용하고 싶다. 이 방법으로 생성 된 범주 형 변수를 만들면 오류가 발생합니다. TypeError: data type not understood. 테스트 사례가 아래에 포함되어 있습니다. import num

4열

3답변

팬더 데이터 프레임 : 최대 값의 행 및 열 반환

모든 값이 같은 종류 (예 : 상관 행렬 - 고유 한 최대 값이 예상되는)의 데이터 프레임이 있습니다. 행렬과이 행렬의 최대 열을 반환하고 싶습니다. 내가 df.idxmax() 의 첫 번째 인수를 변경하여 행 또는 열에서 최대를 얻을 수 있습니다 그러나 나는 전체의 최대의 행/열 인덱스를 반환하는 적절한 방법을 발견하지 않았습니다 데이터 프레임. >>>

1열

1답변

(mapReduce와 비슷한) dataframe.apply를 사용하여 팬다에서 각 행을 여러 행으로 펼치십시오.

다음은 간단한 문제입니다. 여행의 시작 및 끝 위치가있는 DataFrame이 있습니다. 각 스테이션에 대한 DataFrame을 끝내기를 원합니다. 도착 횟수와 출발 횟수입니다. 은 내가 한 행 출력 여러 행, 에 걸릴 후 감소 단계에서 모든 행을 통해 집계 할 수있는 지도 상에 맵리 듀스와 같은 워크 플로우에 익숙입니다. 내가 지금 가지고있는 코드는 다음과

1열

1답변

팬더 필터링 벡터화를 사용한 데이터 프레임

df라는 x 행과 y 열이있는 데이터 프레임이 있습니다. x 행과 y-1 열 미만의 다른 데이터 파일 df2가 있습니다. 1에서 y-1까지의 df2 행과 동일한 행에 대해 df를 필터링하려고합니다. df2의 행을 반복하지 않고 벡터화 된 방식으로 수행 할 수 있습니까? df4=df[(df["ask"]==0) & (df["bid"]==0)] 가 지금은 열

0열

1답변

Python Pandas : 시리즈에서 str 가져 오기

시리즈에서 중복 된 문자열을 가져오고 싶습니다. 여기 내 샘플 코드입니다. from pandas import DataFrame,Series d = {'Sex' : Series(["Male","Male","Female","Female","Female","Male","Female","Female","Male"]), 'Rank' : Series([

0열

1답변

팬더에서 외부 조인을 사용하는 AttributeError 0.15.1

In [26]: xyz = temp_val_ns.join(temp_ref_ns, how='outer') Traceback (most recent call last): File "<ipython-input-26-e10ed4b1946b>", line 1, in <module> xyz = temp_val_ns.join(temp_re

0열

1답변

데이터 프레임 할당

데이터 프레임 df4가 있습니다. 그 중 하나부터 데이터 프레임 df_upper를 파생합니다 df_upper를 수정 한 후 df4가 동일한 수정을 보여 주지만, df4 자체는 수정하지 않았습니다. 왜 그런가, 어떻게 피하는가? 이 팬더 특정 또는 일반 파이썬 관련 있습니까? stepsize=0.1 df_upper=df4 df_upper['strike']

16열

2답변

없음 값이있는 팬더 셀 선택

blanck 셀을 사용하여 데이터베이스 쿼리에서 얻은 팬더 데이터 프레임 열이 있습니다. 빈 셀은 "없음"가없고, 나는 각 행이 아무도없는 경우 확인하려면 : In [325]: yes_records_sample['name'] Out[325]: 41055 John J Murphy Professional Building 25260 None