저희 회사는 많은 양의 실험실 센서 데이터를 보관하는 파일 형식을 잠시보고 있습니다. 그들은 계측을 실행할 때마다 파일을 생성하여 추세를 위해 데이터베이스에 저장하고 사용합니다. 계층 적 형식은 데이터를 "그룹화"할 수 있으므로 선호됩니다. 데이터를 데이터베이스에 저장하기 전에 중간 파일 형식입니다. 우리의 개발 환경으로 인해 이것은 우선 순위 목록입니다 :계층 적 .Net 파일 형식?
1) .Net 호환. API는 웹 서비스 및 클라이언트 응용 프로그램에서 사용됩니다. 우리는 고객의 환경을 제어 할 수 없으므로 pure.Net 솔루션이 가장 좋습니다.
2) 읽기 속도. 우리의 읽기는 순차적이 아니라 무작위입니다. 더 빠를수록 좋습니다. 우리가 C# 개발 샵이 아니라면 속도는 # 1이라고 말할 것입니다.
3) 파일 크기. 파일 자체가 크면 좋은 압축률 (86 % 이상)이 바람직합니다.
4) 읽기의 메모리 풋 프린트. 데이터의 양 때문에 단순히 읽을 수는 없습니다. 각 센서에는 시간/값 쌍이 있습니다. 이것은 4 백만 쌍이 넘는 의지를 창출 할 수 있습니다. 이로 인해 XML이 제거되었습니다.
우리는 현재 HDF5을보고 있으며 .NET 서비스 분야에서는 API가 끔찍하게 부족하고 웹 서비스를 수행 할 수 없지만 크기/속도를 찾고 있습니다. 나는 또한 JSON을 보았고 유망 해 보였지만 데이터 조각을 다시 읽으려고 시도하지 않았습니다. 필자는 웹을 검색했지만 필요한 파일 형식을 많이 찾지 못했습니다. 어떤 도움을 주셔서 감사합니다.
감사합니다. 개념 증명을 시도하고 작동 원리를 살펴 보겠습니다. 확실히 유망 해 보입니다. – mcauthorn
모든 초기 테스트 및 데모에서 HDF5와 마찬가지로 읽기 및 쓰기 속도가 빠르며 압축도되지 않지만 (10 % 적음) 압축하여 재생하면 동일한 데이터를 더 작은 파일 크기로 가져올 수있었습니다 . 추천 해 주셔서 감사합니다. – mcauthorn