2017-09-26 3 views
0

저는 Python 2.7에 openpyxl을 사용하여 기존 .xlsx 파일을 열고 수정합니다. 이 Excel 파일에는 약 2,500 개의 열과 단 10 개의 행이 있습니다. 문제는 openpyxl이 파일을로드하는 데 오랜 시간이 걸렸습니다 (거의 1 분). 어쨌든 openpyxl의 로딩 프로세스 속도를 높일 수 있습니까? 다른 스레드에서는 read_only 및 write_only와 함께 몇 가지 팁을 발견했습니다. 그러나 나는 동시에 읽고 능숙하게 작성해야하므로이 팁을 적용 할 수 없습니다. 누구든지 제안을해야합니까? 대단히 감사합니다 당신에게Openpyxl 기존 Excel로드에 너무 오래 걸림

+0

실제로는 다른 파일 형식에 따라 달라질 수 있습니다. 25000 셀은 매우 빠르게로드되어야하지만로드 된 다른 항목이 파일에있을 수 있습니다. –

답변

-1

난 당신이 Excel 파일로 무엇을해야하는지 모르겠지만, 내가 팬더 DataFrame로 .xmls 파일을 열어보십시오 것이다 :

import pandas as pd 
df = pd.ExcelFile('file path') 
+0

팬더 엑셀 지원은 xlrd가 지원하는 것으로 제한되며 이는 파일 형식의 하위 집합입니다. –

+0

열기 위해 팬더를 사용하는 것이 더 빠르지 만 개봉 후에는 모든 셀 (셀 단위로)을 읽고 severals 셀 (blockwise 또는 columnwise가 아닌)에 대한 의견을 작성해야합니다. 팬더와 함께 할 수 있습니까? – leanh2

0

내가 뭘해야 할 것은 파이썬을 사용하여입니다 Excel 파일 (2k 열 이상, 약 2.5MB)을 열고 Excel의 값을 severals .xml 파일의 값과 비교하십시오. 차이점은 Excel에서 주석으로 작성됩니다. excel에는 텍스트, 숫자 및 일부 형식 (셀 배경색) 만 있습니다. Openpyxl의 로딩 속도를 향상시키는 지 여부에 관계없이 모든 형식을 제거하려고 시도 할 것입니다.

+0

나는 파이썬에서 간단한 측정을했다. xlrd로이 엑셀 파일을 열 때 openpyxl을 사용하여 22.5 초가 걸렸습니다. openpyxl이 너무 느립니다. – leanh2

관련 문제