나는 this 링크를 통해 textsum을 (를) 팔로우하고 있습니다. 제공된 명령을 사용하여 모델을 교육했습니다. 하지만 'textsum/log_root /'디렉토리에 'train'폴더가 표시되지 않습니다. 샘플 파일에 대한 교육이 이루어지기 때문에 모델이 실시간 테스트 데이터에서 작동 할 수 있습니까? 그렇지 않은 경우 교육 데이터를 만들고 모델을 교육하려면 어떻게해야합니까? 그리고 가장 중요한 것은 어떻게 결과 요약을보기 위해 모델을 테스트/사용할 수 있습니까?textsum 사용 방법?
답변
올바르게 모든 매개 변수를 전달한 경우 열차 폴더가 log_root 디렉토리에 표시되지 않는 이유에 대해 솔직히 대답 할 수 없습니다. 한 가지주의 할 점은 충분히 오랫동안 기다리는 것입니다. 따라서 Textsum을 사용하여 교육을 실행하면 파일 목록이 없거나 무언가 같은 오류가 있다는 자세한 로그가 보입니까? 그렇다면 매개 변수 중 하나에 전달되는 경로가 아마도 해제되어있을 것입니다. 이 경로는 호출하는 경로와 관련이 있으므로 작업 영역 파일이있는 루트 경로에 있는지 확인해야합니다.
또 다른 것은 CPU 또는 GPU를 사용하고 있습니까? CPU를 사용하고 있다면 모델이 데이터를 쓸 수있는 지점까지 오래 걸립니다. 이제 GPU를 사용하는 경우 훨씬 빠르지 만 "average_loss"로그가 화면에 인쇄되기 시작할 때까지 기다려야합니다. 일단 그것들을 발견하면 데이터가있는 "열차"폴더를 볼 수있는 좋은 기회입니다.
"실시간"테스트 데이터에 관해서도 필자는 여전히이 데이터를 스스로 조사하고 있으며 현재 모델에서 훈련 된 현재 데이터가 있으므로 앞으로도이를 시작할 예정입니다. 내가 지금까지 이해하고있는 방향은 모델을 훈련하고 피클 파일이나 기타 티를 가지고 있으면 다음 정보를 사용하여 "봉사"할 수 있다는 것입니다. https://tensorflow.github.io/serving/
그 시점에서 모델이 훈련되었습니다 , 당신은 그것에 대해 질의를하고 새로운 응답으로 피드 할 수 있으므로 시간이 지남에 따라 모델은 더 똑똑 해집니다. 다시 한 번 예를 들어 아직 입증하지는 않았지만 곧 여기에서 시작할 방법입니다.
"모델 테스트"와 관련하여 textsum git의 지침을 따르고 vocab 파일을 다시 생성 한 다음 교육을 수행 할 수 있습니다. 그런 다음 평균 손실을 작은 분수로 얻은 다음 데이터에 대해 디코딩을 실행할 수 있습니다. 그런 다음 log_root 디코드 폴더에서 생성 된 헤드 라인과 관련 참조 파일 (실제 헤드 라인 내용)을 볼 수 있습니다. 희망이 도움과 행운을 빕니다!
- 1. Tensorflow - TextSum 모델 : 자체 트레이닝 데이터를 만드는 방법
- 2. textsum 빔 검색 디코더 모두 제공 결과
- 3. 잠자리 사용/사용/사용 방법
- 4. 사용 방법
- 5. 사용 방법
- 6. 사용 방법 무효 방법
- 7. 변수 사용 쿼리 사용 방법
- 8. 사용 가능한 b64encode 사용 방법
- 9. 목표 C 방법 사용 방법
- 10. 방법 최대 사용 방법 PostgreSQL
- 11. 인쇄 방법, JavaScript 사용 방법
- 12. 사용 방법 Insert .. select에서 조건부 변수 사용
- 13. 이미지 폴더 경로에 사용 변수 사용 방법
- 14. 동적으로 대화보기를 사용/사용 중지하는 방법
- 15. 위치 사용 방법 : 절대 스크롤 사용
- 16. AWK 사용 방법 IF 조건 사용
- 17. 사용 방법 Mathematica의 ContourPlot을 내부에 사용 하시겠습니까?
- 18. onclick 이미지를 사용 또는 사용 중지하는 방법
- 19. qooxdoo에서 사용 가능한 최대 공간 사용 방법
- 20. pimcore : 사용 방법 젠드의
- 21. gzip 사용 방법
- 22. 자바 : Thread.join 사용 방법
- 23. ExtJS TreeEditor 사용 방법
- 24. "SHFILEOPSTRUCT"사용 방법
- 25. glDrawTex * 사용 방법
- 26. Microsoft Agent 사용 방법
- 27. 데코레이터 사용 방법?
- 28. plist 사용 방법
- 29. Freebase 사용 방법
- 30. NSCoder 사용 방법
안녕하세요 xtreeme, 1million 레코드를 넘는 모델을 교육했지만 참조 파일의 모델로 디코딩 된 요약을 생성하지 않습니다. – Wazzzy
안녕하세요 @ Wazzzy ... 품질은 대개 훈련에 사용한 데이터의 청결성을 기반으로합니다. 이 모델은 추상적 모델이기 때문에 훈련 된 데이터를 기반으로 모델이 문자 그대로 자체적으로 무언가를 생성하기 때문에 엄청나게 큰 데이터 세트가 필요한 이유는 정확히 일치하지 않을 것입니다. 즉, 결과가 가까워 야한다고 말했다. 그렇지 않은 경우 입력 한 데이터를보고이를 정리하려고 할 수 있습니다. vocab 파일을보고 거기에있는 내용을 보면서 데이터가 얼마나 좋은지 쉽게 알 수 있습니다. – xtr33me