독일어 교통 표지 탐지 벤치 마크 데이터베이스를 사용하여 교통 표지 인식 작업을하고 있습니다. 각 클래스에는 최소 400 개의 이미지가있는 43 개의 클래스가 있습니다. 이미지에는 최대 3 개의 교통 표지가있을 수 있습니다.길쌈 신경 네트워크에 대한 훈련 및 유효성 집합을 선택하면 테스트 정확도에 큰 영향을 미침
교육 및 검증을 위해 무작위로 이미지를 선택하면 네트워크의 테스트 정확도가 크게 달라집니다. 두 데이터 세트를 만들었습니다. 하나는 75 %의 교육 이미지와 25 %의 유효성 검사 이미지를 가지고 있습니다. 다른 하나는 70 %의 훈련 이미지와 30 %의 검증 이미지를 가지고 있습니다.
30 개의 신기원을 포함하여 교육용 하이퍼 매개 변수가 동일한 GoogLeNet을 사용하고 있습니다.
교육을 마친 후 테스트 용으로 설계된 이미지 세트를 테스트합니다. 첫 번째 데이터 세트를 사용하면 두 번째 데이터보다 정확도가 거의 10 % 낮아집니다. 어떤 사람이 이것을 설명 할 수 있을까요?
교육용으로 "쉽게"이미지를 무작위로 선택했기 때문에 결과가 더 낮아질 수 있습니까?
P. 두 데이터 세트 모두 동일한 이미지를 사용하고 있으며 백분율로 다르게 나누었습니다. 데이터 세트에
링크 : http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset
10 % 또는 10 % 포인트? 두 데이터 세트를 여러 번 시도한 적이 있습니까? –
질문을 다시 말하면 설정과 결과를 이해하는 것은 어렵습니다. – Shai
정확하게 이해한다면 ** 한 세트의 ** 이미지 세트를 사용하여 하나의 데이터 세트를 무작위로 나누어 테스트하고 테스트하여 훈련하고 유효성을 검사합니까? – Shai