2012-10-13 2 views
-2

나는 Postgres와 Java를 사용하여 데이터베이스에 삽입해야하는 this file (경고 : 잠재적으로 안전하지 않은 파일 다운로드 사이트)이 있습니다. 다운로드하여이 파일에서 데이터를 추출하는 방법을 알려주십시오. 복사 명령을 시도했습니다. 하나 들어, 헤더 옵션을 사용하지 못했습니다. 파일에서 볼 수 있듯이 4 번째 줄부터 데이터를 복사해야합니다. 또 다른 것은 분리 문자입니다. 메모장 ++에서 파일을 읽으면 해당 열로 볼 수 있지만 구분 기호는 없습니다. 나는 이러한 도전을 시도하고 직면했다. 커스텀 질의를하도록 도와주세요. 또는 내가하고 싶은 것을 성취 할 수있는 또 다른 접근법. 감사!.out 파일을 postgresql로 복사하는 방법은 무엇입니까?

편집 : 안전한 링크를 사용하여 파일을 다운로드했습니다. 희망이 작동합니다.

+2

모두 다운로드하도록 요청하지 말고 여기에서 파일의 일부를 보여줍니다. Suuure, 누군가가 나에게 링크를 보내면이 무작위 파일을 다운로드하겠다. 이 작업을 수행하는 동안 PostgreSQL 버전을 지정하고이 신비한 ".out"파일의 출처, 즉 제작 한 항목을 지정하십시오. –

+0

추측하면이 펑키 형식의 파서를 작성해야합니다. (a) CSV로 변환하거나 (b) PostgreSQL에 직접 연결하고 추출 된 데이터를 삽입합니다. 펄 (Perl), 파이썬 (Python)과 같은 스크립팅 언어는 이런 종류의 일에 좋은 선택입니다. –

+0

네 말이 맞아. 여기에 데이터 몇 개를 넣어야했는데 포맷팅이 제대로 이루어질 지 확신 할 수 없었다. 그래서 나는 이것이 더 나을 것이라고 생각했다. .out 파일은 mesowest에서 날씨 데이터를 추출하는 스크립트를 실행 한 결과입니다. PostgreSQL 최신 버전을 사용하고 있습니다. PostgreSQL에 직접 연결하고 데이터를 삽입하면 무슨 뜻입니까? – CodingInCircles

답변

2

고정 너비 파일을 만드는 것처럼 들립니다. COPY는 이러한 문제를 처리하지 않으므로 스프레드 시트를로드하고 파일을 가져오고 (대부분 고정 폭을 처리 할 수 ​​있음) csv로 내보내는 것이 가장 좋습니다. 그런 다음 COPY를 사용할 수 있습니다.

+0

스프레드 시트를 기본 ETL 도구로 사용하는 것이 좋습니다. –

+0

Excel을 사용할 때의 문제는 Excel에서 파일을 열 때 전체 행이 하나의 셀을 차지한다는 것입니다. 그래서 나는 A1에서 A30000까지의 모든 데이터를 동일한 행에있는 다른 셀에 저장하지 않고 가지고 있습니다. :/ – CodingInCircles

+0

Excel을 사용한 지 오래되었지만 마지막으로 마법사를 열어 구분 기호 대신 고정 너비를 선택해야했습니다. http://office.microsoft.com/en-us/excel-help/text-import-wizard-HP010102244.aspx –

관련 문제