2012-11-12 4 views
4

팬던트 0.9.0의 최신 버전이 설치되어 있으면 오류가 발생했습니다. 편집 : 이것은 파이썬 2.7 언급 잊어 버렸습니다. Excel 파일을 읽는 중입니다. 그 부분은 괜찮아 보인다. 원래 id_company가 mysql 데이터베이스 (코드는 포함되지 않음)에 대해 검증되어야했기 때문에 원래 팬더 데이터 프레임의 각 행에 대해 iteritems()를 시도했습니다. 동일한/유사한 오류 메시지를 튜플에 넣는 것 (코드는 아래 참조). 오류 메시지가 나타납니다.팬다 고유 인덱스 오브젝트에서만 유효하게 다시 인덱스합니다

참고 .reindex()가 있지만 이전에는 작동하지 않았습니다. reindex()는 일종의 우박이었습니다.

해결 방법으로는 대상 SQL에서 가져 와서 조인 할 것입니다. 나는 데이터 세트의 크기 때문에 걱정이된다. 여기

import pandas as pd 
def runNow(): 
    #identify sheet 
    source = 'C:\Users\jlalonde\Desktop\startup_geno\startupgenome_w_id_xl_20121109.xlsx' 
    xls_file = pd.ExcelFile(source) 
    sd = xls_file.parse('Sheet1') 
    source_u = sd.drop_duplicates(cols = 'id_company', take_last=False) 
    source_r = source_u[['id_company','id_good','description', 'website','keyword', 'company_name','founded_month', 'founded_year', 'description']] 
    source_i = source_r.reindex() #hail mary 
    tup_r = [tuple(x) for x in source_i.values] 

오류입니다 :

Traceback (most recent call last): 
    File "<pyshell#10>", line 1, in <module> 
    sg_sql_2.runNow() 
    File "sg_sql_2.py", line 31, in runNow 
    tup_r = [tuple(x) for x in source_r.values] 
    File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 1443, in as_matrix 
    return self._data.as_matrix(columns).T 
    File "C:\Python27\lib\site-packages\pandas\core\internals.py", line 723, in as_matrix 
    mat = self._interleave(self.items) 
    File "C:\Python27\lib\site-packages\pandas\core\internals.py", line 743, in _interleave 
    indexer = items.get_indexer(block.items) 
    File "C:\Python27\lib\site-packages\pandas\core\index.py", line 748, in get_indexer 
    raise Exception('Reindexing only valid with uniquely valued Index ' 
Exception: Reindexing only valid with uniquely valued Index objects 

그래서, 오늘의 좋은 부분이에 벽에 머리를 망치 후, 사람이 버그인지 말해 경우 또는 수 I 정말로 분명한 것을 놓치고 있습니까? GitHub의에

+0

가능한 속는 : http://stackoverflow.com/questions/13292944/resample-non-unique-time-indexes-in-python. 오류를 재연하는 데 사용할 수있는 예제가 있습니까? – Garrett

+0

엑셀 파일을 게시 할 수 있습니다. 아니요, 고유 인덱스가 있고 색인이 복제 된 다른 링크가 있기 때문에 중복되지는 않습니다 ... 솔루션이 동일 할 수도 있지만 .... –

+0

github 문제가이 오류를 추적합니다 : https://github.com/pydata/pandas/issues/2236 – Garrett

답변