첫 번째 열에 식별자와 두 번째 열과 관련된 데이터가있는 csv 파일이 있습니다. 식별자는 임의의 횟수만큼 복제되므로 파일은 다음과 같습니다.
data1,123
data1,345
data1,432
data2,654
data2,431
data3,947
data3,673파이썬 또는 numpy로 레코드 병합
내가 하나를 생성하기 위해 레코드를 병합하고 싶습니다 각 식별자에 대해 기록하고 가져 오십시오.
data1,123,345,432 data2,654,431
data3,947,673
파이썬 또는 NumPy와이 작업을 수행 할 수있는 효율적인 방법이 있나요
? 중복 키로 인해 사전이없는 것 같습니다. 현재 목록의 목록에 줄이 있고 목록에서 색인 0에있는 이전 값과의 동일성을 테스트하지만 매우 서툴 릅니다. 어떤 도움을 주셔서 감사합니다.
잘 모르겠어요 "사전 키를 복제하는 시판 될 것으로 보인다" 왜 이것이 문제인지 이해합니다. 값 목록이있는 사전이 작동하지 않습니까? 당신의 예제에서와 같이'{ 'data1': [123, 345, 432], 'data2': [654, 431], 'data3': [947, 673]으로 끝나는 것을 요리하는 것은 꽤 쉽습니다. }' –