DataFrame 생성자를 사용하여 pandas DataFrame 객체를 만듭니다. 내 데이터는 목록 및 범주 형 데이터 시리즈 개체를 나타냅니다. 생성자에 인덱스를 전달하면 내 범주 데이터 시리즈가 NaN 값으로 재설정됩니다. 무슨 일 이니? 미리 감사드립니다!Pandas DataFrame 생성자가 인덱스 인수를 포함 할 때 NaN을 도입합니다.
예 :
import pandas as pd
import numpy as np
a = pd.Series(['a','b','c'],dtype="category")
b = pd.Series(['a','b','c'],dtype="object")
c = pd.Series(['a','b','cc'],dtype="object")
A = pd.DataFrame({'A':a,'B':[1,2,3]},index=["0","1","2"])
AA = pd.DataFrame({'A':a,'B':[1,2,3]})
B = pd.DataFrame({'A':b,'C':[4,5,6]})
print("DF A:")
print(A)
print("\nDF A, without specifying an index in the constructor:")
print(AA)
print("\nDF B:")
print(B)
다른 사람들은이 문제에 대해 명시 적으로 설명합니다. "... 따라서 시리즈에 더하여 특정 색인은 pa와 일치하지 않는 모든 데이터를 버립니다. ssed 인덱스. ... "보낸 사람 : http://pandas.pydata.org/pandas-docs/stable/dsintro.html#dataframe –