우리는 Tensorflow와 협력하고 있습니다. 우리는 단어, 상표 등의 매우 큰 데이터 세트를 가지고 있습니다. 우리는 단어에 대한 접미사를 생성하려고합니다. 예를 들어 'real'은 'realtor', 'really', 'realestate'를 줄 수 있습니다. 데이터 세트에서 각 단어는 \ n으로 구분됩니다.Tensorflow를 사용하여 단어 접미사를 생성하는 방법은 무엇입니까?
지금까지 여러 가지 시도를했지만 적절한 결과를 얻지 못했습니다. 이것은 매우 간단한 작업으로 해결해야 할 것 같습니다.
우리가 작업하고있는 기본 아이디어는 char-rnn-tensorflow입니다. 캐리지 리턴이 샘플링 될 때까지 단순히 샘플링을 가중치 임의 확률로 샘플로 변경했습니다. 우리는 rnn_decoder와 sequence_loss_by_example을 사용하여 원래 구현을 유지하고 rnn을 모델로 사용했습니다.
지금까지 우리는 좋은 표본, 거의 무작위 표본 및 때로는 접미사를 얻지 못했지만 단어의 시작과는 관계가 없습니다 (실제 -> 현실). 이 구현이 단어를 분리하지 않는다는 사실에서 오는 것이므로 더 간단한 것이 필요할 것입니다.
그런 작업에 어떤 기술을 사용합니까?