하나의 열이 JSON으로 저장되는 데이터베이스 (50k + 행)에서 데이터를 읽습니다. 팬더 데이터 프레임으로 추출하고 싶습니다. 아래 스 니펫은 정상적으로 작동하지만 상당히 비효율적이며 전체 db에 대해 실행할 때 영원히 필요합니다. 모든 항목이 동일한 속성을 갖고있는 것은 아니며 JSON에 일부 중첩 된 속성이 있음에 유의하십시오.JSON 열을 Pandas 데이터 프레임으로 빨리 변환
어떻게하면 더 빨리 만들 수 있습니까?
df = pd.read_csv('http://pastebin.com/raw/7L86m9R2', \
header=None, index_col=0, names=['data'])
a = df.data.apply(json.loads).values.tolist()
print (pd.DataFrame.from_records(a))
는'df.data.apply겠습니까 설정 (람다 X : pd.Series (json.loads은 (X)))'합니까? – Zero
붙여 넣은 데이터를 다른 종류의 표준 형식으로 저장할 수 있습니까? – MaxU
@JohnGalt : 작동하지만 dict을 병합하지 않습니다. – jodoox