2012-05-07 2 views
7

TREC 형식의 사양을 찾고 있습니다. 나는 많은 인터넷 검색을하고 있었지만 단서를 찾지 못했습니다.TREC 형식이란 무엇입니까?

아무도 정보를 찾을 수있는 위치를 알고 있습니까?

답변

3

AFAIK TREC는 NIST의 텍스트 검색 컨퍼런스의 약어입니다. 인덱서가 파일 내에서 문서 경계가있는 위치를 알기 위해서는 각 문서에 시작 문서와 끝 문서 태그가 있어야합니다. 이 태그는 HTML 또는 XML 태그와 유사하며 실제로 TREC 문서의 형식입니다.

TrecParser :이 파서는 TEXT, HL, HEAD, HEADLINE, TTL 및 LP 필드의 텍스트를 인식합니다.

출처 : TREC Wikipedia

출처 : Lemur Guide

0

IBM Watson에서 지식 처리를 위해 사용하는 파일 형식이기도합니다.

관련 문제