nlp

    3

    4답변

    자연어 사용을위한 좋은 API와 공용 데이터 세트 (사전, 구문)가 있습니까? 특히 영어와 한국어 간 번역 작업에 좋은 단어가 있습니까?

    3

    5답변

    콘텐츠를 기준으로 텍스트의 카테고리를 자동으로 찾는 방법은 무엇입니까?

    13

    2답변

    "긍정적"대 "부정적인"산업별 문장 (즉, 영화 리뷰)을 분석하는 최선의 방법을 결정하는 데 도움이 필요합니다. 전에 OpenNLP와 같은 라이브러리를 보았습니다.하지만 너무 저급입니다. 기본적인 문장 구성 만 제공합니다. 내가 필요로하는 것은 상위 레벨의 구조입니다 : - 잘하면 단어 목록으로 - 내 데이터 집합에 희망적으로 훈련 가능합니다 고마워요!

    13

    6답변

    며칠 전, 저자가 .NET을 사용하는 일반적인 자연 언어 DSL 파서에 대한 아이디어를 토론하는 블로그 항목 (http://ayende.com/Blog/archive/2008/09/08/Implementing-generic-natural-language-DSL.aspx)을 읽었습니다. 필자 생각으로는 텍스트가 구문 분석되고 문장과 동일한 이름을 사용하는 클

    9

    2답변

    도시/지역 또는 원산지와 함께 텍스트에 자동으로 레이블을 지정하는 좋은 알고리즘은 무엇입니까? 블로그가 뉴욕에 관한 것이라면, 어떻게 프로그래밍 방식으로 말할 수 있습니까? 어느 정도 확실하게이를 수행한다고 주장하는 패키지/논문이 있습니까? 나는 tfidf 기반의 접근 방식, 적절한 명사 교차점을 살펴 보았지만 지금까지 성공하지 못했고 아이디어를 감상 할

    4

    8답변

    나는 "어휘 인코딩"이라는 단어를 사용하여 더 나은 언어를 찾지 못했습니다. Word는 틀림없이 Letter와는 달리 의사 소통의 기본 단위입니다. 유니 코드는 알려진 모든 알파벳의 각 문자에 숫자 값을 할당하려고합니다. 한 언어에 대한 편지는 무엇인가, 다른 언어에 대한 문양입니다. 유니 코드 5.1은 현재이 글리프에 100,000 개 이상의 값을 할당합

    25

    4답변

    간단하지만 "충분히 좋은"명명 된 엔티티 인식 라이브러리 (및 사전)를 Java 용으로 찾고 있는데 전자 메일 및 문서를 처리하고 다음과 같은 일부 "기본 정보"를 추출하려고합니다. 이름 , 장소, 주소 및 날짜 나는 주변을 둘러 보았고, 대부분 무거운 쪽과 전체 NLP 프로젝트에있는 것처럼 보입니다. 어떤 권장 사항이 있습니까?