2012-09-25 3 views
2

나는 작은 프로젝트를 무리 (약 30) Excel 스프레드 시트를 색인으로 작업하고 있습니다. 프로젝트의 주요 목표는 업로드 된 Excel 파일을 빠르게 검색하는 것입니다. 나는 해결책을 찾기 위해 봤지만 아직 쉬운 해결책을 찾지 못했습니다. 내가 고려하고인덱싱 Excel에서 파일을 Excel에서

일부 옵션 : PHPExcel와 MySQL과 메타 테이블을 사용하여 저장 열 정보를 수동으로

-do 뭔가. 테이블의 FullText 옵션을 사용하여 검색 결과를 반환하십시오.

- MongoDB와 같은 문서 저장소를 사용하여 파일을 저장하고이를 ElasticSearch/Solr과 결합하여 빠른 결과를 얻으십시오.

둘 모두의 관계는 관계형 데이터베이스에서 Solr을 사용하십시오.

두 번째 옵션은 조금 과잉이라고 생각합니다.이 문제에 많은 시간을 투자하고 싶지 않습니다. 나는 이것에 대한 의견을 듣고 싶다. 다른 제안은 환영 받는다. :)

+0

스프레드 시트가 많지 않습니다. 그들은 얼마나 큰가요? 이 문제에 많은 시간을 할애하지 않으려면 옵션 1이 가장 좋습니다. 스프레드 시트의 모든 텍스트 데이터를 전체 텍스트 색인 테이블로 덤프하고 검색에 사용하십시오. – Tchoupi

+0

그들은 그렇게 크지 않습니다. 각각 1MB. MongoDB가 과도하다는 것에 동의하십니까? 아니면 어떻게 든 커지면 편리해질 수 있습니까? – jhuiting

+0

NoSQL이 반드시 필요하지는 않습니다. 엄격한 MySQL 스키마에 Excel 파일을 저장할 수 있다면 완벽하게 작동합니다. 물론 당신이 이미 사용하고있는 것에 따라. 이미 MySQL 설정이있는 경우 사용하십시오. 성능이 문제가되는 시점에 이르면 기존의 MySQL 설치 인 Sphinx에 검색 엔진을 추가 할 수 있습니다. – Tchoupi

답변

0

나는 다른 사람들과 동의한다. 과거에는 스프레드 시트를 데이터베이스에 빨아들이는 여러 가지 시스템을 수행했습니다. 이는 프로그래밍없이 익숙한 사용자 인터페이스를 얻는 훌륭한 방법입니다. 필자는 전자 메일을 사용하여 MS Access 및 최근 몇 년 동안 PHP를 통해 MySQL 데이터베이스로 읽는 데 필요한 스프레드 시트를 읽을 수있는 중심 위치로 삼았습니다.

PHP는 메일 서버에 쉽게 연결하여 스프레드 시트를 자동으로 읽고 처리 할 수 ​​있으므로 특히 유용합니다.

+0

나는 이것을 2 주 전에 구현했지만, 관계형 데이터베이스에서는 잘 작동한다. 훨씬 큰 엑셀 시트에 몇 가지 문제점이 있지만 지금은이 문제를 해결했습니다. :) – jhuiting