2016-12-20 2 views
4

의 내가 종종 여러 개의 ID를 가지고있는 금융 증권의 DataFrame 있다고 가정 해 봅시다 :팬더 데이터 프레임의 인덱스로 설정할 열을 어떻게 결정합니까?

enter image description here

내가 인덱스로 설정하는 하나의 열을 선택해야합니까? 모든 잠재적 인 식별자를 인덱스로 설정해야합니까? 모든 텍스트 데이터를 인덱스로 설정하고 모든 숫자 데이터를 열로 두어야합니까? 가장 좋은 방법은 무엇입니까?

+4

제 생각에 일반적으로 가장 좋은 것은 기본 단조 색인 ('0,1,2,3, ...')이지만, 정확히 무엇이 필요한가에 달려 있습니다. 또한 고유 인덱스가 중복으로 더 좋습니다. – jezrael

+2

중복을 제거한 다음 기본 단조 색인 – MMF

+1

을 사용하십시오. 이는 수행하려는 작업에 전적으로 달려 있습니다. –

답변

0

이것은 팬더보다 데이터베이스 디자인에 관한 것입니다.

결정은 데이터 프레임의 비즈니스 의미 (관계형 데이터베이스의 테이블)와 해당 열을 기반으로 결정해야합니다. 예를 들어 '내부 보안 ID'를 사용하여 비즈니스에서 이러한 종류의 데이터를 식별하는 경우 색인으로 설정해야합니다.

그러나 확실하지 않은 경우 기본 정수 인덱스를 사용하십시오.

관련 문제