1 단계 : 일반 BLOB 저장소 (블록 BLOB) 및 컨테이너 (액세스 정책을 "컨테이너"로 설정)를 생성했습니다. 또한 19 개 문서 (pdf, xlsx, docx, ppt, png, jpg, txt)가 추가되었으며 모든 문서는 푸른 색 포털 -> BLOB 저장소에 표시됩니다.Azure Blob 저장소 검색이 작동하지 않습니다.
2 단계 : Azure 검색 (기본 계층)을 생성하고이 문서를 따라 다음을 수행했습니다.
단계 3 : 생성 된 소스
POST https://anysearch.search.windows.net/datasources?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "blob-datasource",
"type" : "azureblob",
"credentials" : { "connectionString" : "DefaultEndpointsProtocol=https;AccountName=mystorage;AccountKey=givenkey==" },
"container" : { "name" : "containername"}
}
4 단계 : 작성된 인덱스
POST https://anysearch.search.windows.net/indexes?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "my-target-index",
"fields": [
{ "name": "id", "type": "Edm.String", "key": true, "searchable": false },
{ "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "sortable": false, "facetable": false }
]
}
5 단계 : 인덱서를 만들었다.
POST https://anyearch.search.windows.net/indexers?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "blob-indexer",
"dataSourceName" : "blob-datasource",
"targetIndexName" : "my-target-index",
"schedule" : { "interval" : "PT5M" }
}
6 단계 : 실행 인덱스 통계 및 아래의 결과를 얻었다 - DOCUMENTCOUNT = 0
GET https://anysearch.search.windows.net/indexes/my-target-index/stats?api-version=2015-02-28-Preview
api-key: [admin key]
{
"@odata.context": "https://mydocsearch.search.windows.net/$metadata#Microsoft.Azure.Search.V2015_02_28_Preview.IndexStatistics",
"documentCount": 0,
"storageSize": 1728
}
7 단계 : 단어 "과정"에 대한 검색과 아래의 결과를 얻었다
GET https://anysearch.search.windows.net/indexes/my-target-index/docs?api-version=2015-02-28&search=process
{
"@odata.context": "https://mydocsearch.search.windows.net/indexes('my-target-index')/$metadata#docs(id,content)",
"value": []
}
여기에 무슨 문제가 있습니까? 왜 문서 수는 0입니까? 왜 "프로세스"라는 단어 또는 다른 검색 단어가 결과를 반환하지 않는지?
도와주세요.
감사합니다.
바 누입니다.
매력처럼 작동했습니다! 정말 고마워. 지원되지 않는 파일은 인덱서에 의해 무시 될 것이라고 생각했습니다. 그것을 지적 주셔서 감사합니다. BLOB에서 jpeg 및 png 파일을 삭제하고 인덱서를 다시 실행했습니다. 그것은 효과가 있었다. – Bhanu
듣기 좋네. 인덱서에서 지원되지 않는 형식의 텍스트 추출을 자동으로 건너 뛰어도되지만 (일부 저장 메타 데이터는 계속 추출 함)이 [UserVoice suggestion] (https://feedback.azure.com/forums/263029-azure-search/)에 투표하십시오. 제안/15094944-blob-indexer-should-continue-indexing-documents-af) –