API에서 가능한 큰 데이터 잡이를위한 기본 지원 코드를 빌드 중입니다. 결과는 각 색인 값에 대한 dict으로 나타납니다. 즉주문이 중요 할 때 팬더 데이터 프레임을 채우는 가장 빠른 방법
[(index0, {col3:val3, col0:val0, col12:val12, ...}), (index1,{...}), ...]
그러나 색인이 순서대로 나오지는 않지만. 또한 모든 색인이 반드시 모든 색인에 대해 사용 가능한 것은 아닙니다.
이 열이 올바른 순서 col_list = [col0, col1, ...]
뿐만 아니라 index_list = [index0, index1, ...]
내 성향 그냥 dataframe에게
df = DataFrame(index=index_list, columns=col_list)
을 미리 정의하고 단지 df.loc[idx, col] = val
하여 데이터를 할당 할 수있는 모든 인덱스에 결국 중요하다 수도 데이터가 희박한 경우 가장 빠른 방법이 될 수 있습니다. 그러나 데이터는 거의 확실하게 밀도가 있습니다.
상당히 빠른 대체 생성자가 있습니까?
'pd.read_json'을 사용해 보셨습니까? (이 유효한 json입니까?) 실제/가장하지만 재생할 스 니펫을 제공하십시오. –
불행히도, 그것은 json이 아닙니다. API는 비표준이고 다소 불안정하여 위의 다소 애매한 것으로 보았습니다. API가 index0에 cols/vals의 dict을주고 index1과 cols/vals의 dict을주는 것으로 생각하십시오. – rhaskett
그리고 먼저 API에 제공 한 색인 및 색인 목록이 있습니다. – rhaskett