2011-12-24 6 views
8

최근의 프로그래밍 프로젝트의 일환으로 나는 언젠가 다른 사람에게 사용 될 수있는 내용의 데이터베이스를 컴파일했습니다. 나는 '오픈 소스'데이터를위한 최선의 방법을 찾고있다.소스 데이터 (코드가 아닌)를 여는 가장 좋은 방법은 무엇입니까?

나는 SQL을 GitHub에 업로드 할 수 있었지만 더 많은 '데이터 중심'공유 방법을 찾았는지 궁금해했다. 아마도 사용자가 쉽게 검색/시각화/시각화 할 수있는 웹 사이트 일 것이다./그들에게 SQL의 큰 덩어리를 제공하기보다는 데이터 세트를 향상 시키십시오.

분명히하기 위해 데이터를 공유 할 수있는 형식이 아닌 이상적으로 GitHub/Sourceforge의 데이터 집합과 동일한 데이터를 공유 할 수있는 장소를 찾고 있습니다.

데이터가 비교적 작기 때문에 (수천 줄의 SQL) 볼륨이 장애물이 아니어야합니다.

+1

데이터 제목은 무엇입니까? – Paul

+0

데이터 세트의 크기는 얼마입니까? 사용자가 합리적으로 다운로드 할 수 있습니까? –

답변

2

저는 이런 물건에 대해 Amazon's S3의 큰 팬이에요. 데이터 세트가 충분히 흥미 롭다면 InfoChimps으로 게시 할 수 있습니다.

+0

둘째 - InfoChimps가 제공하는 인프라는자가 배포보다 훨씬 쉬운 방법입니다. 자체 배포를 수행하면 S3가 좋은 호스팅 옵션을 제공합니다. – Iterator

0

XML 형식으로 내보낼 수 있습니다.이 형식은 XML 형식으로 내보낼 수 있습니다. 또 다른 솔루션은 OData이지만 이는 바람직하지 않을 수있는 데이터를 제공하는 데이터 및 플랫폼 호스팅을 의미합니다.

1

다른 회사의 많은 데이터로 작업했습니다. 대부분이 데이터는 텍스트로 구분 된 데이터 형식으로되어 있습니다. 가장 인기있는 것은 물론 쉼표로 구분되거나 탭으로 표시됩니다. MySQL은 CSV를 내보내고 가져올 수 있기 때문에 쉼표를 사용하는 것이 좋은 선택입니다. 강조는 (내가 그것을 사용하지 않은, 그래서 이것은 불공평 수 있음) 시각화에있을 것처럼 보이지만,

id, first_name, last_name, address 
1, John, Smith, 11222 Stree Name 
1

Google Fusion Tables이 상자의 일부를 틱 예를 들면 다음과 같습니다. 최근에 사라진 버릇이 있기 때문에 두 번째 계층 Google 제품에 너무 많이 의존하기를 꺼립니다.

0

Sparkfun은 실시간 데이터 소스를 주로 목표로하지만 무료 스토리지를 제공하며 플랫폼은 오픈 소스이므로 사용자가 자체 서버를 호스팅 할 수 있습니다.

관련 문제