MySQL 데이터베이스를 통해 Heroku에서 호스팅하고 전용 PostgreSQL 인스턴스로 이식하는 중입니다. 헤로 쿠에 대한 초기 데이터를 얻는 방법을 알고 있습니다. 그러나 외부 회사의 데이터를 매일 가져와야 할 필요가있는 일일 "피드"가 있습니다. 그것은 FTP 서버에 올려지며 여러 다른 CSV 파일을 포함하는 zip 파일입니다. 일반적으로, 나는 Postgres 박스로 scp 할 수 있고, 데이터를 임포트하기 위해 "COPY tablename FROM path/to/file.csv"를 수행하는 크론 작업을 할 수있다. 그러나, Heroku를 사용하면이 작업을 수행하는 가장 좋은 방법에 대해 다소 당황 스럽습니다. 참고 : 데이터 가져 오기에 heroku dev article을보고 검토했습니다. 그러나 이것은 더 많은 덤프 파일입니다. 저는 CSV 파일에서 매일 가져 오기를 다루고 있습니다.Heroku에서 일일 Postgres 데이터베이스로 가져 오기
누군가가 Heroku에서 이와 비슷한 작업을 수행합니까? 그렇다면 최선의 방법에 대해 조언을 해줄 수 있습니까?
더 많은 정보 : 내 응용 프로그램은 Cedar 스택의 Python/Django 1.3.3입니다. 그리고 내 파일은 약간 클 수 있습니다. 그 중 일부는 50,000 건이 넘습니다. 따라서 루프를 돌리고 Django ORM을 사용하는 것이 다소 느릴 수 있습니다 (그러나 여전히 최선의 해결책 일 수 있습니다).
답장을 보내 주셔서 감사합니다. 대부분의 파일은 1MB 미만이지만 1 일 파일은 약 110MB이며 증가하지만 (느리게). 여기에 크기 제한은 무엇입니까? 다시 한번 감사드립니다. –
한도는 결정되지 않았지만 상당히 큽니다. 110MB 이상은 괜찮습니다. 또한 STDIN 옵션을 사용하지 않고도 (dyno의) 임시 파일을 참조하는 dyno에서'\ copy'를 직접 실행할 수 있습니다. – hgmnz
정말 훌륭합니다 ... 장고 ORM을 사용하면 정말 속도가 빨라질 것입니다. –