2017-01-13 1 views
0

우리는 Tensorflow와 협력하고 있습니다. 우리는 단어, 상표 등의 매우 큰 데이터 세트를 가지고 있습니다. 우리는 단어에 대한 접미사를 생성하려고합니다. 예를 들어 'real'은 'realtor', 'really', 'realestate'를 줄 수 있습니다. 데이터 세트에서 각 단어는 \ n으로 구분됩니다.Tensorflow를 사용하여 단어 접미사를 생성하는 방법은 무엇입니까?

지금까지 여러 가지 시도를했지만 적절한 결과를 얻지 못했습니다. 이것은 매우 간단한 작업으로 해결해야 할 것 같습니다.

우리가 작업하고있는 기본 아이디어는 char-rnn-tensorflow입니다. 캐리지 리턴이 샘플링 될 때까지 단순히 샘플링을 가중치 임의 확률로 샘플로 변경했습니다. 우리는 rnn_decoder와 sequence_loss_by_example을 사용하여 원래 구현을 유지하고 rnn을 모델로 사용했습니다.

지금까지 우리는 좋은 표본, 거의 무작위 표본 및 때로는 접미사를 얻지 못했지만 단어의 시작과는 관계가 없습니다 (실제 -> 현실). 이 구현이 단어를 분리하지 않는다는 사실에서 오는 것이므로 더 간단한 것이 필요할 것입니다.

그런 작업에 어떤 기술을 사용합니까?

답변

0

마지막으로 네트워크 매개 변수를 신중하게 조정하고 결과에 온도를 적용하여 좋은 결과를 얻을 수있었습니다. 시퀀스 길이는 훈련 중 매우 중요했습니다.

관련 문제