2016-07-29 2 views
1

문장 경계를 넘지 않는 반복 언어 모델 (예 : LSTM)을 만드는 가장 좋은 방법은 무엇입니까? 또는 더 일반적으로, 모델에 배치를 제시하면 각 문장에 여러 문장이 들어 있습니다. 각 문장을보고 나면 상태를 어떻게 재설정 할 수 있습니까? 모델에 지정할 수있는 특별한 토큰이 있습니까?일괄 처리 중 TensorFlow 재설정 상태 = 문장 수준 언어 모델

감사합니다.

답변

0

문장이 독립적 인 경우 일괄 처리의 각 행에 문장이 하나만 포함되도록하는 것이 더 깔끔합니다. 그런 다음 this question에 대한 응답에서 설명한 것처럼 각 배치 후에 LSTM의 상태를 재설정 할 수 있습니다.