2017-01-24 3 views
0

사람들이 그룹간에 100GB 이상의 대용량 파일을 공유 할 수있는 온라인 서비스를 제안 해 주시겠습니까? 특히 우리는 파일을 다운로드 할 필요없이 파일에 지속적으로 액세스해야하는 기계 학습 프로젝트를 진행하고 있습니다. 이 프로젝트에서 우리는 파이썬과 R로 파일을 조작 할 것입니다. Git을 사용하여 코드를 업로드하고 공유 할 수 있다는 것을 알고 있지만 온라인에 정보를 저장하고 '재생'할 수있는 서비스가 있습니까?그룹간에 큰 데이터 집합을 공유하십시오.

감사합니다.

답변

0

일반적인 연습 - 코드에는 Git을 사용하고 데이터에는 S3을 사용하십시오.

오픈 소스 도구 DVC - http://dataversioncontrol.com - 에서 S3 또는 GCP 저장소로 Git 모델링 코드를 조율 할 수도 있습니다. 그것은 ML 시나리오를 위해 설계되었습니다. 파이썬과 R 코드는 모두 DVC에서 지원됩니다.

관련 문제