나는 작은 프로젝트를 무리 (약 30) Excel 스프레드 시트를 색인으로 작업하고 있습니다. 프로젝트의 주요 목표는 업로드 된 Excel 파일을 빠르게 검색하는 것입니다. 나는 해결책을 찾기 위해 봤지만 아직 쉬운 해결책을 찾지 못했습니다. 내가 고려하고인덱싱 Excel에서 파일을 Excel에서
일부 옵션 : PHPExcel와 MySQL과 메타 테이블을 사용하여 저장 열 정보를 수동으로
-do 뭔가. 테이블의 FullText 옵션을 사용하여 검색 결과를 반환하십시오.
- MongoDB와 같은 문서 저장소를 사용하여 파일을 저장하고이를 ElasticSearch/Solr과 결합하여 빠른 결과를 얻으십시오.
둘 모두의 관계는 관계형 데이터베이스에서 Solr을 사용하십시오.
두 번째 옵션은 조금 과잉이라고 생각합니다.이 문제에 많은 시간을 투자하고 싶지 않습니다. 나는 이것에 대한 의견을 듣고 싶다. 다른 제안은 환영 받는다. :)
스프레드 시트가 많지 않습니다. 그들은 얼마나 큰가요? 이 문제에 많은 시간을 할애하지 않으려면 옵션 1이 가장 좋습니다. 스프레드 시트의 모든 텍스트 데이터를 전체 텍스트 색인 테이블로 덤프하고 검색에 사용하십시오. – Tchoupi
그들은 그렇게 크지 않습니다. 각각 1MB. MongoDB가 과도하다는 것에 동의하십니까? 아니면 어떻게 든 커지면 편리해질 수 있습니까? – jhuiting
NoSQL이 반드시 필요하지는 않습니다. 엄격한 MySQL 스키마에 Excel 파일을 저장할 수 있다면 완벽하게 작동합니다. 물론 당신이 이미 사용하고있는 것에 따라. 이미 MySQL 설정이있는 경우 사용하십시오. 성능이 문제가되는 시점에 이르면 기존의 MySQL 설치 인 Sphinx에 검색 엔진을 추가 할 수 있습니다. – Tchoupi