2014-11-02 5 views
3

내가이 명령을 사용하여 각 라인에 새로운 문장 파일에 스탠포드 NLP 심리 분석을 사용하기 위해 노력하고있어 새로운 라인의 문장 : 불행하게도 그것은을 인식하지 못하는스탠포드 NLP 심리,

C:\Users\alonr\IdeaProjects\stanford-corenlp-full-2014-08-27>java -cp "*" -mx2g 
edu.stanford.nlp.sentiment.SentimentPipeline -input TEXT -output PROBABILITIES -file 
my_file.txt 

을 문장 브레이크로서 파일의 라인 브레이크. 어떻게 그렇게 할 수 있습니까?

+0

은 어쩌면 '(줄 바꿈 인식하지 못하는 \ 연구 \ n ') 2 문자입니다. 예를 들어, NotePad ++와 같은 고급 텍스트 편집기로이 파일을 열어 '\ r \ n'을 '\ n'으로 바꿀 수 있습니다. – cheseaux

답변

0

메인 프로그램 SentimentPipeline이 문장 분리기를 변경할 수 있도록 설정되어 있지 않습니다. 당신은 스탠포드 CoreNLP를 사용하는 경우, 그러나 : 대신 -ssplit.eolonly 플래그 주요 CoreNLP 파이프 라인을 통해 실행할 수 있습니다 : 파일이 윈도우 줄 바꿈을 사용하기 때문에

java -cp "*" -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP \ 
    -annotators tokenize,ssplit,pos,parse,sentiment -ssplit.eolonly \ 
    -inputFile my_input.txt -outputFormat text -outputFile my_file.txt 
관련 문제