마무리 작업을 완료하는 데 수개월이 걸릴 수있는 루비 프로세스를 실행할 계획입니다. 가능하다면 정전이나 잘못된 버튼을 눌러 한 달 내내 비용이 들지 않도록하고 싶습니다.장시간 실행되는 루비 프로세스를 쉽게 백업합니다.
프로그램 상태를 디스크에 주기적으로 저장하는 쉬운 방법이 있습니까? (더 많은 노력이 필요한 기술은 데이터베이스와 다른 모든 것을 관리하는 코드를 추가하거나 프로세스 운영 체제의 가상 컴퓨터를 사용하는 코드를 추가하는 것을 포함합니다.) 관심있는 사람들을 위해 프로세스에 멀티 기가비트 XML 파일을 구문 분석하는 과정이 포함됩니다. 잘 알려진 웹 사이트의 일부 정보를 처리, 그리고 그것을 함께가는 같은 액티브 데이터베이스에 정보를 저장하는 회)
편집 :..이 프로젝트는 this one이며, XML 파일 페이지-articles.xml입니다 (예 : enwiki-20090306-pages-articles.xml). 독점적 인 것은 아니며 "Plz Halp"모드에 있기를 원하지 않았습니다. 첫 번째 패스는 Wikipedia 페이지 제목 목록을 가져오고, 다음 패스는 각 페이지에서 다른 페이지로의 첫 번째 링크를 결정한 다음 몇 가지 통계를 계산합니다.
일부 응답자의 제안에 따라 중단 된 부분부터 계속해서 유효한 옵션 일 수 있습니다. 첫 번째 단계에서 충돌이 발생하면 이미 실행 된 항목을 추가하지 말고 다시 실행할 수 있습니다. 두 번째 단계에서 충돌이 발생하면 링크를 계산하지 않은 페이지에 대한 링크를 작성하도록 요청해야합니다. 통계 계산 중 충돌이 발생하면 통계를 다시 계산할 수 있습니다.
다른 편집 :이 질문의 일반적인 버전은 Save a process’ memory for later use?입니다. 장시간 실행되는 프로세스를 쉽게 백업 할 수없는 것 같습니다.
xml은 무료로 제공됩니까? 아니면 간단한 샘플을 게시 할 수 있습니까? 너무 독점적이지 않은 경우 어떤 종류의 모델 구조를로드하려고합니까? –