opennlp

    1

    1답변

    저는 영화 리뷰 데이터 세트에서 애스펙트 식별 (명시 적 및 암시 적 애스펙트) 작업을하고 있습니다. 여기에는 배우, 감독, 제작사, 음악, 음모, 영화 형식 등이 포함될 수 있습니다. 많은 검색을 했음에도 불구하고 영화 리뷰 데이터 세트에 NER (이름 엔티티 인식)이 필요하다는 사실을 알게되었습니다. 아쉽게도 내 데이터 집합에 사용할 수있는 NER이 없

    0

    1답변

    CoreNLP 주위에 작성된 Java 시스템을 상속합니다. 즉, 시스템 클래스는 CoreNLP 파서를 사용하는 것 외에도 일부 장소에서 CoreNLP 클래스를 필드로 사용합니다. 다른 파서를 사용하여 시스템의 정확성을 테스트하고 싶습니다. 따라서 CoreNLP API와 특정 파서 구현 사이에 필요한 브리징을 수행해야하는 일반 파서 어댑터를 사용하도록 코드를

    2

    1답변

    현재 공백을 발견 할 때마다 문장을 토큰 화하는 OpenNLP의 공백 토큰 화 도구를 사용하고 있습니다. 내가 좋아하는 문장이있는 경우 그래서, : 그 문장의 취미를 얻으려면 지금 My hobbies are reading books, magazines, Roller skating and playing football. 을 나는하지 공백의 기초하지만 쉼표

    0

    3답변

    명사 및 명사 이외에 영어로도 명사로 사용할 수있는 다른 구문이 있습니다. 예를 들어 Gerundive는 명사로 사용할 수 있습니다. "정중함"과 같은 좋은 습관이 필요합니다. 개발중인 앱에서 명사로 작동하는 모든 구성 요소를 찾아야합니다. 다양한 청킹 도구 (NLTK 등)를 사용해 보았지만 모두 명사와 명사 만 인식하는 것으로 보입니다. 이 덩어리는 NP

    1

    1답변

    OpenNLP를 처음 사용하고 일부 구문 분석 문장을 얻는 데 사용했습니다. 나는 Google Tensor에서 Penn Treebank가 오래되었고 일종의 구식 인 YouTube 동영상을 보았습니다. 그들은 SyntaxNet이라는 다른 구문 분석 모델을 오픈 소스로 사용할 수 있습니다. 제 질문은 Apache OpenNLP 라이브러리에서 SyntaxNet

    0

    1답변

    일부 음성 태그 지정에는 Apache OpenNLP 라이브러리가 사용됩니다. 생성자가 POSModel(URL) 인 POSModel을 만들려고했으나 모델이 올바르게 초기화되지 않았습니다. 누구든지 POSModel(URL) 생성자가 전혀 작동하는지 알고 있습니까? 아니면 그냥 InputStream 메서드를 만드는 전통적인 경로를 사용해야합니까? P. POSMo

    5

    2답변

    누구나 OpenNLP 라이브러리에서 SimpleLemmatizer() 클래스를 사용하는 방법을 어디서 찾을 수 있는지, 어디서 샘플 영어 사전을 찾을 수 있는지 알고 있습니까? 문서에서 누락 된 것으로 보입니다.

    10

    1답변

    자바에서 재귀 신경 텐서 네트워크 (RNTN)를 구현하고 싶습니다. 단어의 코퍼스를 벡터화하기 위해 word2vec 파이프 라인에 Deeplearning4j를 사용했습니다. 는 NLP 파이프 라인을 위해 내가 Opennlp을 사용했습니다. (토큰 화, POStaging 및 분석을 위해) 지금, 나는 내가 내 삶의 목적에 대한 RNTN이 필요하다는 것을 알아

    2

    1답변

    현재 UIMA와 OpenNLP를 사용하여 문장의 단어에 레이블을 지정합니다. 한 단어에 두 번 이상 레이블을 지정할 수 있어야합니다. 예를 들어 David Cronenberg은 director 및 person으로 표시되어야합니다. 사용자 지정 모델 파일이 있고 레이블 중 하나가 포함 된 모든 문장이 모델 파일에서 제거되어 다른 레이블이 검색되면 교육 과정이

    3

    0답변

    문자열을 토큰으로 변환하기 위해 OpenNLP java를 사용하고 있습니다. 그러나, 나는 둥근 괄호가 제대로 식별 할 수없는 것으로 나타났습니다. 코드 내가 사용 : 예를 들어 ` InputStream is = new FileInputStream("en-token.bin"); TokenizerModel model = new TokenizerModel(i