'comment_text'
이라는 열이있는 'ticket_diary_comment'
이라는 테이블이 있습니다. 이 열은 텍스트 데이터로 채워집니다. 이 전체 열에서 발생하는 모든 단어의 빈도를 얻고 싶습니다. 예 :SQL Server 2008에서 열에 나타나는 모든 단어의 단어 수
Comment_Text
I am a good guy
I am a bad guy
I am not a guy
내가 원하는 무엇 : 나는 또한 출력에 정지 단어를 제거한
Word Frequency
I 3
good 1
bad 1
not 1
guy 3
알 수 있습니다. 특정 단어의 빈도를 계산하는 것이 어렵지는 않지만 중지 단어를 제거하는 열에 나타나는 모든 단어를 계산하는 무언가를 찾고 있습니다.
이 문제에 대한 도움을 주시면 감사하겠습니다. big-ish 데이터 세트 (약 1TB)에이 쿼리를 적용해야하므로 성능이 중요하다는 점을 말씀 드리고 싶습니다.