2012-10-26 6 views
0

저는 우분투를 사용하고 있으며 CSV로 다운로드/저장해야하는 known URL을 가지고 있습니다. URL은 매개 변수를 기반으로하므로 프로젝트에 자주 변경되므로 다운로드를 수행하는 스크립트를 작성하여 매번 수동으로 저장하지 않아도됩니다.wget을 사용하여 CSV를 받으십시오

wget을 사용하여 파일을 가져 오려고했지만 파일 자체가 HTML 인 반면 웹 사이트는 CSV로 내용을 표시합니다. 페이지의 콘텐츠를 순수 csv로 저장하려면 어떻게해야합니까?

wget -O my.csv [url] 

아무도 도와 줄 수 있습니까?

답변

1

파일의 유일한 HTML은 각 행의 끝에 <br /> 인 것 같습니다. 이를 제거하려면

wget -O- "$URL" | sed 's#<br />$##' > my.csv 
+0

크롬 또는 브라우저에 소스가 표시되면 올바르게 표시됩니다. wget 명령 다음에 오는 파일은 전체가 날아간 html입니다. – rgamber

+0

@rgamber : 게시 된 wget으로 코드를 테스트했습니다. – choroba

+0

왜 내가 같은 코드로 이상한 출력을 얻었는지 궁금합니다. 코드를 사용하면 파일 크기가 0 바이트가됩니다. 어떤 OS를 사용하고 있는지 알 수 있습니까? – rgamber

관련 문제