1

대학의 문서 관리 시스템을 관리합니다. 이 시스템은 ERP 시스템의 역할을하는 타사 데이터베이스와 통합되는 타사입니다. 디엠에스는 상당히 clunky하고 끔찍한 버그/다양한 특징을 가지고 & 기능을 지원합니다. 호기심에서 자유 시간에 Google App Engine/Drive SDK로 놀았습니다. Google은 Google Apps for Education 고객이므로 드라이브 공간을 무제한으로 유지할 수 있으며 Google 사용자는 모두 Google Apps 사용자입니다.문서 관리 시스템 용 Google 드라이브/App Engine

드라이브 SDK를 사용하여 모든 대학 파일 (~ 6TB)을 관리하는 웹 응용 프로그램 (잠재적으로 Google App Engine으로 구동되는)을 내부적으로 구축 할 수 있습니까? 내 실험에서 필요한 모든 기능을 갖춘 것 같습니다.

+0

데이터의 크기는 중요하지 않으며 모든 것을 처리 할 수 ​​있어야합니다 (계획하고있는 것을 더 많이 알지 못함). – Ryan

+0

시스템의 범위는 주로> 특정 문서 유형에 대한 미리 정의 된 색인 필드를 기반으로 문서를 DMS> 색인 문서로 가져 오기> 문서 목록을 검색하기위한 색인 값을 가진 쿼리 데이터베이스. –

+0

이미 언급 한 도구들 사이에서 데이터 저장소와 전체 텍스트 검색을 통해 필요한 것을 수행 할 수 있습니다. https://cloud.google.com/appengine/training/fts_intro/lesson2 – Ryan

답변

0

자신 만의 소프트웨어를 제작할 것이므로 "원하는대로 할 것인가"에 대한 대답은 항상 "예, 결국"입니다.

문서 형식에 대한 결정을 내릴 필요가 있습니다. 그러면 문서 형식이 색인 메커니즘에 영향을 미칩니다. 구체적으로 두 가지 기본 옵션이 있습니다. -

  1. Google 문서 형식 (doc, 스프레드 시트 등)으로 파일을 변환하십시오. 그런 다음 Google의 자체 색인 생성 및 검색을 사용할 수 있습니다 (예 : drive.gogle.com에서와 마찬가지입니다. 단점은 가져 오기/내보내기 왕복 중에 서식이 손실 될 수 있다는 것입니다.

  2. 문서를 원시 형식 (예 : MS .docx)으로 유지하고 고유 한 색인을 수행하십시오. 이렇게하면 각 문서 유형을 파싱해야하는데 이는 사소한 문제입니다. 그러나 제 3 자 라이브러리가 도움이 될 것으로 확신합니다. 장점은 가져온 문서가 가져온 동일한 문서라는 것입니다.

위의 두 가지를 모두 수행 할 것으로 생각합니다. 따라서 파일을 DMS로 가져올 때 변환 된 파일과 변환되지 않은 파일을 Google 드라이브에 두 번 저장합니다. App Engine 데이터 저장소를 사용하여 페어링을 추적합니다. 이렇게하면 드라이브 검색을 사용하여 변환 된 문서를 찾을 수 있지만 사용자에게 다시 제공되는 파일은 변환되지 않은 쌍둥이입니다.

+0

감사합니다. pinoyyid! 나는 그것이 필요한 모든 기능을 가지고 있으며, 일부 기능을 가지고 있다고 확신했다. 단지 약간의 경험이있는 사람들로부터 그것을 되찾기를 원했다. 또한 두 문서를 모두 보관하는 것이 좋습니다. 나는 이미 서식을 유지하는 것에 대해 우려하고있었습니다. 감사! –

+0

이 답변의 일부가 잘못되었습니다. Google 드라이브 *는 MS Office 파일의 색인을 생성하므로 변환 할 필요가 없습니다. 이제 OCM이 Docs Suite에 통합되었으므로 네이티브 형식으로 변환하지 않고도 MS 파일을 편집 할 수 있습니다 (단, 멋진 Docs 기능을 사용할 수도 있습니다). @KyleMcIntire –

+0

@DanMcGrath 추가해 주셔서 감사드립니다. 이러한 기능이 상세하게 설명 된 링크를 제공 할 수 있습니까? 어느 Office 파일 형식이 인덱싱됩니까? – pinoyyid