사용 가능한 기본 데이터 형식은 numpy를 통해 제공되는 데이터 형식입니다. 목록을 보려면 documentation을보십시오.
이 집합에 포함되지 않은 날짜/시간 형식 (예 : datetime64
)은 pandas 및 numpy 설명서에 추가 정보가 있습니다.
dask 데이터 프레임의 meta-argument는 일반적으로 빈 팬더 데이터 프레임이 열, 인덱스 및 dtyp에 대한 정의를 보유 할 것으로 기대합니다. 이러한 DataFrame를 구성하는
한 가지 방법은 다음과 같습니다
import pandas as pd
import numpy as np
meta = pd.DataFrame(columns=['a', 'b', 'c'])
meta.a = meta.a.astype(np.int64)
meta.b = meta.b.astype(np.datetime64)
그러나, 또한 팬더 dataframe의 생성자에 DTYPE를 제공 할 수있는 방법이있다, 나는 개별 열의를 제공하는 방법을 잘 모르겠습니다 마다. 보시다시피 데이터 유형에 "이름"뿐만 아니라 실제 numpy 유형도 제공 할 수 있습니다.
마지막 질문에 대해 찾고있는 데이터 유형은 "개체"입니다. 예 :
import pandas as pd
class Foo:
def __init__(self, foo):
self.bar = foo
df = pd.DataFrame(data=[Foo(1), Foo(2)], columns=['a'], dtype='object')
df.a
# 0 <__main__.Foo object at 0x00000000058AC550>
# 1 <__main__.Foo object at 0x00000000058AC358>
출처
2016-09-01 08:44:50
sim