TensorFlow 사이트의 Language Modeling에 대한 자습서를 따르려고합니다. 나는 그것이 실행되고 비용이 내려 가고 위대한 일을하고 있지만 실제로 모델로부터 예측을 얻는 방법이 전혀 없음을 알 수 있습니다. 나는 this answer에 지시에 따라 노력했지만 session.run에서 반환 된 tensors는 0.017842259와 같은 부동 소수점 값이며, 사전은 단어를 정수로 매핑하므로 작동하지 않습니다.TensorFlow에서 "de-embed"단어를 사용하는 방법
텐서 흐름 모델로부터 예측 된 단어를 얻으려면 어떻게해야합니까?
편집 :이 검색 explanation 주위를 검색 한 후,이 예제의 컨텍스트에서 x와 y가 무엇인지 확실하지 않습니다. 그들은 설명에서와 같이이 예제에 대해 동일한 규칙을 사용하는 것 같지 않습니다.
100 % 확신하지 못했습니다. 'session.run'의 결과는 다음과 같은 요소를 갖는 3 요소 목록입니다. cost : 모델의 평균 비용이라고 가정하는 float32, eval_op : 모델을 평가하는 데 사용되는 함수, final_state : 목록 LSTMStateTuples – jbird
그 중 어느 것이 확률을 포함합니까? – jbird
한 가지 더 언급할만한 점은 이러한 LSTMStateTuples에 음수 값이 포함되어있어 확률이 높지 않다고 가정하기 때문입니다 (또한 무언가 어떻게 음의 손실을 가져올 지 확신 할 수 없음) – jbird