저는 텍스트 분류를위한 피쳐 엔지니어링을 연구하고 있습니다. 나는 기능을 선택하는 것에 집중했다. 대부분의 문학에서 텍스트를 토큰 화하고 기능으로 사용합니다 (정지 단어, 문장 부호 제외). 그러나 폐암이나 구문과 같은 여러 단어로 나눠 씁니다. 그렇다면 문제는 ngram 순서를 결정하고이를 기능으로 처리하는 방법입니다.피규어 엔지니어링을위한 Ngram 주문 선택
0
A
답변
0
관련 2g (이 경우 폐암)이 빈도로 표시됩니다.
내가 폐암이있는 사람을 알고 : 폐암이 무서운 질병입니다
다음과 같은 텍스트를 상상해보십시오.당신이 먼저 폐암 겁니다 2 그램의 목록을 작성하는 경우
; 및 다른 조합 ('폐를가집니다', '증오 폐') 등이 있습니다.
단어의 특정 그룹은 무엇인가를 나타내고 반복적으로 호출되기 때문에 다른 그룹은 단지 2 그램의 '환경 적'을 형성하는 커넥터 ('has'또는 'hate') 일 뿐이 기 때문입니다. 열쇠는 주파수로 필터링하는 것입니다.
n 그램을 생성하는 데 문제가있는 경우 잘못된 라이브러리/도구 모음을 사용하고있는 것 같습니다.
관련 문제
- 1. 포인트 앤 피규어 - 구현
- 2. 캡션으로 피규어 정렬
- 3. Ngram 구현
- 4. SQLite : 선택 결과 주문
- 5. 주문 문만을 선택 취소
- 6. AngularJS 선택 옵션 주문
- 7. 이클립스에서 부모와 자식 피규어 GEF
- 8. Ngram Tokenizer 및 Ngram 필터를 사용하면 ElasticSearch에서 색인 크기가 증가합니까?
- 9. ES 부분 검색 - ngram?
- 10. 파이썬 빈도가있는 Ngram 목록
- 11. 문구가 일치하는 가장자리 NGram
- 12. Ngram 모델과 NLTK에서의 괴로움
- 13. NGram 순차 검색
- 14. Solr Ngram 동의어 Dismax
- 15. Google Ngram 정렬 중입니까?
- 16. 데이터베이스 리버스 엔지니어링을위한 프레임 워크가 있습니까?
- 17. 카테고리별로 주문 모든 제품 선택
- 18. 몽고 저장 및 선택 주문
- 19. html 주문 선택 메뉴 총
- 20. 장고 관리자 선택 상자 주문
- 21. VBA로 표 선택 및 주문
- 22. 선택 항목이있는 필드로 주문 모델
- 23. ASP 데이터 소스 주문 선택
- 24. sql 복수 주소가있는 주문 선택
- 25. Magento : 최고 주문 제품 선택
- 26. 복잡한 쿼리와 편안한 엔지니어링을위한 안드로이드 데이터베이스 프레임 워크
- 27. 포즈/리깅 피규어 용 JavaScript 라이브러리
- 28. 피규어 내에서 오이 피쳐를 실행 하시겠습니까?
- 29. 웹상의 여러 Matplotlib 피규어 간의 간섭을 피하십시오.
- 30. ngram 생성을 향상시키는 방법은 무엇입니까?