2016-08-29 2 views
7

나는 this 링크를 통해 textsum을 (를) 팔로우하고 있습니다. 제공된 명령을 사용하여 모델을 교육했습니다. 하지만 'textsum/log_root /'디렉토리에 'train'폴더가 표시되지 않습니다. 샘플 파일에 대한 교육이 이루어지기 때문에 모델이 실시간 테스트 데이터에서 작동 할 수 있습니까? 그렇지 않은 경우 교육 데이터를 만들고 모델을 교육하려면 어떻게해야합니까? 그리고 가장 중요한 것은 어떻게 결과 요약을보기 위해 모델을 테스트/사용할 수 있습니까?textsum 사용 방법?

답변

2

올바르게 모든 매개 변수를 전달한 경우 열차 폴더가 log_root 디렉토리에 표시되지 않는 이유에 대해 솔직히 대답 할 수 없습니다. 한 가지주의 할 점은 충분히 오랫동안 기다리는 것입니다. 따라서 Textsum을 사용하여 교육을 실행하면 파일 목록이 없거나 무언가 같은 오류가 있다는 자세한 로그가 보입니까? 그렇다면 매개 변수 중 하나에 전달되는 경로가 아마도 해제되어있을 것입니다. 이 경로는 호출하는 경로와 관련이 있으므로 작업 영역 파일이있는 루트 경로에 있는지 확인해야합니다.

또 다른 것은 CPU 또는 GPU를 사용하고 있습니까? CPU를 사용하고 있다면 모델이 데이터를 쓸 수있는 지점까지 오래 걸립니다. 이제 GPU를 사용하는 경우 훨씬 빠르지 만 "average_loss"로그가 화면에 인쇄되기 시작할 때까지 기다려야합니다. 일단 그것들을 발견하면 데이터가있는 "열차"폴더를 볼 수있는 좋은 기회입니다.

"실시간"테스트 데이터에 관해서도 필자는 여전히이 데이터를 스스로 조사하고 있으며 현재 모델에서 훈련 된 현재 데이터가 있으므로 앞으로도이를 시작할 예정입니다. 내가 지금까지 이해하고있는 방향은 모델을 훈련하고 피클 파일이나 기타 티를 가지고 있으면 다음 정보를 사용하여 "봉사"할 수 있다는 것입니다. https://tensorflow.github.io/serving/

그 시점에서 모델이 훈련되었습니다 , 당신은 그것에 대해 질의를하고 새로운 응답으로 피드 할 수 있으므로 시간이 지남에 따라 모델은 더 똑똑 해집니다. 다시 한 번 예를 들어 아직 입증하지는 않았지만 곧 여기에서 시작할 방법입니다.

"모델 테스트"와 관련하여 textsum git의 지침을 따르고 vocab 파일을 다시 생성 한 다음 교육을 수행 할 수 있습니다. 그런 다음 평균 손실을 작은 분수로 얻은 다음 데이터에 대해 디코딩을 실행할 수 있습니다. 그런 다음 log_root 디코드 폴더에서 생성 된 헤드 라인과 관련 참조 파일 (실제 헤드 라인 내용)을 볼 수 있습니다. 희망이 도움과 행운을 빕니다!

+0

안녕하세요 xtreeme, 1million 레코드를 넘는 모델을 교육했지만 참조 파일의 모델로 디코딩 된 요약을 생성하지 않습니다. – Wazzzy

+0

안녕하세요 @ Wazzzy ... 품질은 대개 훈련에 사용한 데이터의 청결성을 기반으로합니다. 이 모델은 추상적 모델이기 때문에 훈련 된 데이터를 기반으로 모델이 문자 그대로 자체적으로 무언가를 생성하기 때문에 엄청나게 큰 데이터 세트가 필요한 이유는 정확히 일치하지 않을 것입니다. 즉, 결과가 가까워 야한다고 말했다. 그렇지 않은 경우 입력 한 데이터를보고이를 정리하려고 할 수 있습니다. vocab 파일을보고 거기에있는 내용을 보면서 데이터가 얼마나 좋은지 쉽게 알 수 있습니다. – xtr33me