나는 GATE NLP
을 처음 사용합니다. 총알이 들어있는 문서가 있습니다. GATE
에로드 할 때. 불릿은
으로 인쇄되는 알려지지 않은 유형 기호로 감지됩니다. 또한 인코딩을 UTF-8
으로 설정하려고했습니다. 또한 프로그래밍 방식으로 문서를로드하려고 시도하면 글 머리 기호가 ?
으로 감지됩니다.GATE NLP에서 물음표로 표시되는 글 머리 기호
누구나 설명 할 수 있습니까?
예 : 여기
Promoted to Senior Member Technical in 2.5 years of experience.
GATE DEVELOPER UI
에 내가 "프로그램"을 한 때
?
기호가 표시되는 상징이다.
그렇지 않으면 질문에 대한 답변을 드릴 수 없습니다 ... 예 : 어떤 종류의 파일 (txt, pdf, doc, docx)을로드하고 계십니까? 프로그래밍 방식으로로드하는 것은 무엇을 의미합니까? 소스 코드의 관련 부분을 게시 할 수 있습니까? – dedek
'pdf '의 경우 이것은 관련 될 수 있습니다 : _In WinAnsiEncoding, 040보다 큰 사용되지 않는 코드는 글 머리 기호 문자에 매핑됩니다. https://issues.apache.org/jira/browse/PDFBOX-1713 – dedek
pdf, doc, Docx. 프로그래밍 방식으로 말하자면, 임베디드 게이트를 사용하여 문서를로드하고 파이프 라인으로 실행합니다. 실행하면 어떻게됩니까? 거기 있어요 . – ganesh