grep
명령을 사용하여 SQL 파일을 처리하는 프로그램을 작성하고 싶습니다. 작동 할 때 모든 코어를 사용할 수 있기를 바랍니다. MPI 또는 Pthreads를 사용하는 것은 중요하지 않습니다. 그러나 파일을 4 개의 파일로 나누려면 어떻게해야합니까? 만약 내가 700mb 크기의 txt 파일을 가지고 있다면, 모든 스레드가 그 파일의 1/4을 처리하는 방법을 의미합니다.grep 테스트를 병렬 작업으로 나누는 방법
필자는 필자가이 파일의 몇 줄을 쓰레드마다 다른 파일 오프셋을 설정해야하는지 알고 싶습니다. 그것은 좋은 방법이고, 전체 라인 수를 얻는 방법입니까?
아마 파일 시간이 오래 걸릴 것입니다 얼마나 많은 줄 수 :
[email protected] ~ % time wc -l lineitem.tbl
6001215 lineitem.tbl
wc -l lineitem.tbl 0.20s user 0.40s system 4% cpu 12.996 total
'wc -l'이 얼마나 오래 걸릴지 테스트하기가 어렵지 않습니다. 즉, 줄 수를 반환해야합니다 (예 : 얼마나 걸리나요?) –
[GNU 병렬] (http://en.wikipedia.org/wiki/GNU_parallel)과 같은 것을 찾고 계십니까? – Pascal
@JonasWielicki 시간이 오래 걸릴 것입니다. 내 질문을 편집하고,'wc -l '이 걸리는 시간을 추가하면된다. 감사합니다 ~ – madper