내 질문이 너무 일반적이거나 이전에 질문 된 경우 용서해주십시오. 나는 파이썬 3의 여러 대형 데이터 세트를 조작 (예 : 여러 범위의 항목을 복사하고 붙여 넣기, 계산을 수행 한 다음 새로운 CSV 파일에 저장)해야한다는 과제를 맡았습니다.Python3에서 CSV 파일을 조작하기 위해 csv 라이브러리에서 pandas 사용
앞서 언급 한 라이브러리를 사용하는 데있어서 장점/단점은 무엇입니까?
미리 감사드립니다.
내 질문이 너무 일반적이거나 이전에 질문 된 경우 용서해주십시오. 나는 파이썬 3의 여러 대형 데이터 세트를 조작 (예 : 여러 범위의 항목을 복사하고 붙여 넣기, 계산을 수행 한 다음 새로운 CSV 파일에 저장)해야한다는 과제를 맡았습니다.Python3에서 CSV 파일을 조작하기 위해 csv 라이브러리에서 pandas 사용
앞서 언급 한 라이브러리를 사용하는 데있어서 장점/단점은 무엇입니까?
미리 감사드립니다.
저는 CSV 라이브러리를 사용하지 않았지만 많은 사람들이 팬더의 혜택을 누리고 있습니다. Pandas는 Numpy를 기반으로하는 많은 도구를 제공합니다. 모든 종류의 분석 (기계 학습의 경우 sklearn, nlp의 경우 nltk 등)을 위해 더 많은 고급 라이브러리를 쉽게 사용할 수 있습니다.
목적에 따라 다른 cdv를 쉽게 관리하고 병합하고 연결하고 원하는 것을 수행 할 수 있습니다.
퀵 가이드의 링크. 다른 많은 리소스도 있습니다.
는 팬더 파이썬 조금 도움이 http://pandas.pydata.org/pandas-docs/stable/10min.html희망으로 시작.
팬더 라이브러리 프로그래밍과 같이 다른 사람들이 이미 수행 한 작업을 가능한 한 많이 사용하려고 시도해야합니다. 이렇게하면 많은 시간을 절약 할 수 있습니다. 이러한 파일을 처리 할 때 팬더는 제공 할 것이 많기 때문에 이러한 파일을 처리하는 가장 좋은 방법이라고 생각됩니다. 질문이 매우 일반적이기 때문에 일반 답변 만 제공 할 수 있습니다 ... 팬더를 사용하면 문서에서 자세한 내용을 읽어야합니다. 그러나 나는 이것이 단점이라고 말하지 않을 것이다.