주어진 단어 주위의 단어를 어떻게 생각할 수 있습니까? 예 : "오늘 날씨가 좋으며 걷기를 좋아합니다."라는 문장이있는 경우지정된 단어를 중심으로 여러 단어 가져 오기
- 오늘의 날씨 (중앙 : "오늘") 날씨는
- 오늘 (센터 "은") 창 크기가 5이면 다음, 나는 다음을 좀하고 싶습니다
- 날씨가 괜찮과 :
- 오늘 날씨가 좋은 ("날씨"센터)입니다 (센터 "입니다")
- 날씨는 괜찮 우리 (중앙 : "벌금")
- 괜찮 및 우리는 사랑한다 (중심 : "and")
등등.
bigrams = [p for s in corpus_lemm for p in nltk.bigrams(w for w in s)] #take bigrams inside of each sentence
그러나이 어떻게 주어진 윈도우 크기의 말씀을 고려할 수 : 고려 bigrams 아무 문제 없다?
도움을 주셔서 감사합니다.
내가 미안하지만, 그 문자열이 발생하는 이유 창 크기가 첫 번째 예를 들어, 5 – rassar
잘 때 이해가 안가, 센터는 "오늘"입니다 후에 "the"와 "weather"가 있습니다. 두 번째 예에서 중심은 "the"입니다. 앞에 2 단어는 "Today"이고 2 뒤에는 "weather"와 "is"가 있습니다. 세 번째 예에서 중심은 "날씨"입니다. 두 번째 단어는 "오늘"과 "그 다음에 2": "is"와 "fine"이됩니다. 4 번째 예 : "is", 2 단어 앞에 : "the"와 "weather", 2 after : "fine "and"and ". 기타 – JohnD
목록 분할은 가장 간단한 방법입니다. 연습으로 세부 정보를 남깁니다. –