나는 몇 시간에 걸쳐 찍은 온도 측정 값을 표시하려고합니다. 내 데이터 파일에 시간이 밀리 초 단위로 들어 있습니다. from datetime import timedelta
from pandas import to_timedelta
import pandas as pd
import datetime DT
df = pd.read_csv('temperatur
두 팬더 데이터 프레임에 불규칙한 timeseries 데이터가 있습니다. 시간별로 두 프레임을 병합/결합하고 싶습니다. 또한 결합 프로세스를 통해 추가 된 "새로운"행에 대해 frame2의 다른 열을 채워야합니다. 어떻게해야합니까? 이 나는 시도했다 : df = pd.merge(df1, df2, on="DateTime")
그러나 이것은 단지 타임 스
목록 목록을 피벗 할 때 팬더 패키지에 어떤 문제가 있습니까? 목록 Shop paframC paramA paramB paramC \
Fruit
New Text Document.txt1 nordfggdfgmal\n Y3\n NaN NaN
file.txt1 NaN Y\n 30\n normal\n
Sho
반환되는 데이터 프레임에 대한 열 ('C', 'B', 'A')의 순서를 유지하는 자동화 된 방법이 있습니까? g = df.groupby(['people'])
g['people'].agg({'C' : len,
'B' : len,
'A' : len,
})
이 난 단지 예 아니라 AGG 기능 자체에 대한 문서를 찾
.csv 파일을 포함하는 지정된 폴더를 반복하려고합니다. 그 목적은 각 파일에 나열된 세 가지 메트릭을 수집하여 추가하고 통합 된 곧 작성 될 파이썬 CSV 파일의 행에 결과를 출력하는 것입니다. , 나는 그것이 각 파일을 통해 정확하게 계산하는 알 수 있도록 내가 콘솔의 모든 수익 항목을 인쇄 할 수 있습니다 Traceback (most recent ca
추가가 중복을 생성하지 않도록 확실히하면서 데이터 프레임 (또는 더 효율적인 경우 시리즈)에 추가해야합니다. 데이터 프레임이 커짐에 따라, drop_duplicates를 호출하는 것만으로도 비효율적 인 것처럼 보입니다. drop_duplicates를 호출하는 것은 전체 데이터 집합을 추가 할 때마다 중복을 검사해야하기 때문입니다. 데이터에는 두 개의 열만
목록을 pandas 데이터 프레임으로 변환하려고하면 전체 셀이 하나의 셀로 표시됩니다. pdlist=['From: 2012-11-07 19:16:07, To: 2012-11-07 19:21:07, Downtime: 0h 05m 00s',
'From: 2012-11-13 06:16:07, To: 2012-11-13 06:21:07, Downtime: 0h
팬더를 처음 접했고 고정 창 크기로 롤링 평균을 얻으려고합니다. 하지만 타임 스탬프 튜플과 값을 나타내는 두 개의 목록이 있습니다. 나는 후자에 대한 무게로 전자를 사용하고 싶습니다. 또한 데이터의 갭이 식별 가능한지 확인하고 싶습니다 (타임 스탬프가 반드시 연속적 일 필요는 없습니다). 예 목록 : 내가 지금 사용하고 무엇 ts = [(1415969999