팬더 시리즈에서 중첩 된 키 - 값 쌍이 있습니다. 열을 개별 열로 분할하는 가장 효율적인 방법은 무엇입니까? (I는 압축을 풀고 변환을 수행하지만, 최고의 방법은 무엇 수 있습니까?)키 - 값 쌍을 DataFrame 열로 파싱
을 내가 하지 알고있다 :
- 키 이름 사전 각 레코드의 키
- 수 을
- 각 레코드의 키 순서
행은 다음과 같습니다. 유니 코드 문자열의 목록. 일단 추출되면 값은 항상 bigint가됩니다.
입력 :
parsedSeries.head()
0 [key1=774, key2=238]
1 [key1=524, key2=101, key3=848]
2 [key3=843]
3 [key1=232, key3=298, key2=457]
예상 출력 : 입력 X
가로서의 위해 필요한 규칙을 준수하는 것으로 가정된다 포맷 u"X=Y"
의 유니 코드 문자열을 포함하는리스트 이루어지는 것을
record key1 key2 key3
0 774 238 NAN
1 524 101 848
2 NAN NAN 843
3 232 457 298
참고 Python의 속성 이름 및 Y
은 항상 정수로 해석 될 수 있습니다. 예를 들어, 위의 샘플 데이터를 구성하는 데 다음을 사용할 수 있습니다.
pandas.Series([[u"key1=774", u"key2=238"],
[u"key1=524", u"key2=101", u"key3=848"],
[u"key3=843"],
[u"key1=232", u"key3=298", u"key2=457"]])
'parsedSeries.ix [0]'의 종류는 무엇입니까? 당신의 예제는'[key1 = 774, key2 = 238] '이라는 것을 보여줍니다, 그러나 이것은 무엇입니까? 그것은 목록이 될 수 없다, 그것은 'dict'인가? 각 항목이 '사전'인 시리즈가 있습니까? 또는 2-tuples 시퀀스로 구성되어 있습니까? 아니면 무엇입니까? – ely
그것은 목록입니다 ... [81]에서 : type (parsedSeries.ix [0]) Out [81] : list. df에 str.split을 적용하여 목록을 만듭니다. – Peter
그러면 'type (parsedSeries.ix [0] [0])'은 무엇입니까? – ely