2016-12-18 1 views
1

1000 만 줄의 데이터가 포함 된 매우 큰 .csv 파일이 있습니다. 파일 크기는 약 250MB입니다. 각 줄은 세 가지 값을 포함하고 있으며 다음과 같습니다매우 큰 데이터 파일의 모든 X 줄을 삭제하는 방법은 무엇입니까?

-9.8199980e-03183, -4.32

나는 모든 2 라인을 삭제할

또는 예를 들어, 매 10 번째 줄마다 새로운 파일로 바로 복사하십시오. 어떤 프로그램을 사용해야 하나? 또한 코드를 게시 할 수 있습니까?

나는 Scilab과 Excel을 사용해 보았습니다. 파일을 열 수 없거나 파일의 일부만 열 수 있습니다. 메모장 ++에서 파일을 열 수 있지만 두 번째 줄을 모두 삭제하는 매크로를 기록하고 실행하려고하면 충돌이 발생합니다.

+0

을 사용하고있는 OS :

gawk "NR%2" original.csv > new.csv 

당신은 모든 10 라인을 원하는 경우를? – 2ps

답변

2

gawk/awkhere에서 설치하고이 멋진 도구의 힘을 활용하는 것이 좋습니다.

당신은 다른 모든 라인을 원하는 경우 : 당신이

gawk 'NR%10==0" original.csv > new.csv 
관련 문제