LSTM 모델의 입력 벡터에 대해 혼란 스럽습니다. 사용중인 데이터는 텍스트 데이터입니다 (예 : 1,000 문장.Keras의 LSTM 입력
1. 벡터에 문장을 토큰 화하면 (문장 벡터라고 부를 수 있음) Keras에서 문서가 주어진 문장 벡터를 만드는 방법이 있습니까? 단어 수준일까요?
2. 두 번째 질문은 LSTM의 3D 텐서 유형입니다. LSTM이 매 시간 단계마다 하나의 문서를 읽으려는 경우 1,000 문장 (샘플)과 time_step이 1이됩니다. 맞습니까? 마지막 것은 입력 차원입니다.이 입력 차원은 각 문장의 단어 dimension (100) 또는 각 시간 단계 (10)에서 관찰 된 단어 수입니다.
따라서 LSTM 텐서 같아야 (1000, 1, 10) 또는 (1000, 1, 100)