스탠포드 coreNLP를 사용하여 문장을 단어로 분할하려고합니다. 아포스트로피가 포함 된 단어에 문제가 있습니다.스탠포드 coreNLP - 아포스트로피를 무시한 단어 분할
예를 들어, 문장 : 나는 24 세입니다. 이 같은
분할 : [I] [ 'm] [24] [년] [세]
이 가능이 사용 스탠포드 coreNLP? 처럼 분할하는 것입니다 [난] [24 ] [years] [old]
tokenize.whitespace를 사용해 보았지만 '?'와 같은 다른 구두점을 사용하지 않았습니다. ','
나는 문장에서도 단어를 분리하려고합니다. 어떻게 그 일을 처리 했습니까? 그것은 그들의 API의 javadocs에 의해 혼란스러워진다. – Tim