나는이 멋진 도구를 배우기 시작했으며, 여러 시간 계열을로드하고이를 "마스터"날짜 벡터와 정렬하는 간단한 작업에 박혀 있습니다.정렬되지 않은 시계열을 하나의 인덱스로 DataFrame에로드 하시겠습니까?
예 : 저는 csv 파일을 가지고 있습니다 : Data.csv 여기서 첫 번째 행에는 헤더가 포함되어 있습니다 "Date1, Rate1, Date2, Rate2"
여기서 Date1은 Rate1의 날짜이고 Date2는 Rate2의 날짜입니다.
이 경우 Rate2에 더 많은 관찰이 있습니다 (시작 날짜는 Date1과 동일하지만 종료 날짜가 Date1의 종료 날짜보다 빠르며 누락 값이 적음) 모든 항목에 따라 색인을 생성해야합니다 ~ Date2.
다음 DataFrame을 얻는 방법은 무엇입니까? 나는 공식 pandas.pdf 및 인터넷 검색의 예제를 따라하는 것을 시도했다
index(Date2) Rate1 Rate2
11/12/06 1.5 1.8
12/12/06 NaN 1.9
13/12/06 1.6 1.9
etc
etc
11/10/06 NaN 1.2
12/10/06 NaN 1.1
13/10/06 NaN 1.3
(또는 비슷한 달성)하지만 아무 소용.
가 대단히 감사합니다? 이에 대한 좋은 조리법 거기 (:(난 씨 McKinney's 팬더 책의 사전 Edition은 구입하지만 장 어디 있지 아직 준비 팬더를 concering)편집 :이 개 .CSV 파일에 일련의 분리의 대답에 관하여 : 그러나 무엇 나는 매우 많은 시계열이있는 경우, 예를 들어
날짜 1 속도 1 DATE2 Rate2 ... DATEN RateN
그리고 내가 아는 건 날짜가 거의 같아야한다는 것입니다. 누락 된 값 (날짜 또는 요율 항목이없는 경우)을 포함한 일련의 예외가 있습니다 (이는 일부 금융 경제 시계열의 예가 될 것입니다. way)
모든 데이터를 별도의 .CSV로 분할하려면이 데이터 집합을로드하는 것이 가장 좋습니다.
EDIT2 아치 라이트가 완전히 맞습니다. 단지 "csv_read"를 수행하면 문제가 해결됩니다.
기본적으로 다음 졸이다 것입니다 내 질문 : 는 시리즈 자체 (엑셀에서 내 보낸 .CSV 파일)
감사에 대한 여러 정렬되지 않은 시간 각 시리즈는 날짜 열이 시리즈, 및 열 가입 방법 DATE2 날짜가있는 경우 다시 당신이 날짜 1이 날짜 2의 부분 집합이 있는지 확인하고 DATE2가 빈 값을 포함하지 않는 경우
친애하는 archlight입니다, 감사합니다. 하지만 날짜/요율 시리즈가 여러 개있는 경우에도 여전히 여러 파일로 구분되는 것이 관례입니까? (내 메인 쿼리를 업데이트했습니다.) – luffe