CSV 파일을 읽으려면 팬더를 사용하고 있습니다. 데이터는 숫자이지만 csv 파일에 텍스트로 저장됩니다. 값 중 일부는 잘못되었거나 누락 된 경우 숫자가 아닙니다. 어떻게 이러한 값을 걸러 내고 나머지 데이터를 정수로 변환합니까?파이썬 판다에서 csv 읽기 및 잘못된 값 처리
모든 값을 반복하고 isdigit()
을 사용하여 숫자가 아닌지 테스트하는 것이 더 빠르고 더 빠르다고 가정합니다.
팬더 또는 numpy는 판독기에서 잘못된 값을 인식하는 방법이 있습니까? 그렇지 않다면 가장 쉬운 방법은 무엇입니까? 이 작업을 수행하려면 d 유형을 구체적으로해야합니까?
좋습니다. 이것은 내가 찾고 있었던 것 같다. – Dave31415
문자열이 열 종속적 인 경우 na_values를 사용할 수 있습니까? 예를 들어, 음수 값이 나쁜 일부 열은 있지만 다른 위치는 괜찮습니다. – Shawn
@Shawn 없음. 이상적으로는 각 열에 대해 다르게 수행 할 수있는 na_values가 없습니다. 음수 값 처리는 데이터 사전 처리/정리 중에 수행해야합니다. – JKC