2
텍스트 세트 (책, 기사, 문서 등)가 주어질 때 각 텍스트에 대한 관련 키워드를 어떻게 찾을 수 있습니까? 상식에 제안 :텍스트의 키워드를 찾는 알고리즘
- 분할 단어
- 는
- 카운트 단어
- 이 줄 어떤 주파수 ("A는, 는,,에 대한 방법"과 같은라고도 스톱 단어) 일반적인 단어 제외 문서 및 다른 문서의 각 단어의 빈도, 문서의 단어 수 및 모든 문서의 총 단어 수를 고려한 수식으로 각 단어의 점수를 계산합니다.
질문은 : 그것은 좋은 수식입니까?
레이아웃 정보 (제목, 나누기, 글꼴 크기 및 스타일 ...)에 액세스 했습니까? –