길쌈 신경 네트워크에 대한 훈련 및 유효성 집합을 선택하면 테스트 정확도에 큰 영향을 미침

독일어 교통 표지 탐지 벤치 마크 데이터베이스를 사용하여 교통 표지 인식 작업을하고 있습니다. 각 클래스에는 최소 400 개의 이미지가있는 43 개의 클래스가 있습니다. 이미지에는 최대 3 개의 교통 표지가있을 수 있습니다.길쌈 신경 네트워크에 대한 훈련 및 유효성 집합을 선택하면 테스트 정확도에 큰 영향을 미침

교육 및 검증을 위해 무작위로 이미지를 선택하면 네트워크의 테스트 정확도가 크게 달라집니다. 두 데이터 세트를 만들었습니다. 하나는 75 %의 교육 이미지와 25 %의 유효성 검사 이미지를 가지고 있습니다. 다른 하나는 70 %의 훈련 이미지와 30 %의 검증 이미지를 가지고 있습니다.

30 개의 신기원을 포함하여 교육용 하이퍼 매개 변수가 동일한 GoogLeNet을 사용하고 있습니다.

교육을 마친 후 테스트 용으로 설계된 이미지 세트를 테스트합니다. 첫 번째 데이터 세트를 사용하면 두 번째 데이터보다 정확도가 거의 10 % 낮아집니다. 어떤 사람이 이것을 설명 할 수 있을까요?

교육용으로 "쉽게"이미지를 무작위로 선택했기 때문에 결과가 더 낮아질 수 있습니까?

P. 두 데이터 세트 모두 동일한 이미지를 사용하고 있으며 백분율로 다르게 나누었습니다. 데이터 세트에

링크 : http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset

출처

2017-05-16 Lukas Karmanovas

10 % 또는 10 % 포인트? 두 데이터 세트를 여러 번 시도한 적이 있습니까? –

질문을 다시 말하면 설정과 결과를 이해하는 것은 어렵습니다. – Shai

정확하게 이해한다면 ** 한 세트의 ** 이미지 세트를 사용하여 하나의 데이터 세트를 무작위로 나누어 테스트하고 테스트하여 훈련하고 유효성을 검사합니까? – Shai

당신이 얼마나 많은 클래스 징후가 있습니까? GoogLeNet이이 데이터 세트에서 잘 작동하는 것으로 알려져 있습니까? GoogLeNet은 ILSVRC 2012 데이터 세트에서 잘 작동하도록 특별히 설계된 것으로, 거의 1.3M 교육 이미지, 1000 클래스입니다. 수백 개의 병렬 커널로 확장되어 문제에 대해 많은 유연성을 제공합니다.

소수의 카테고리에서 900 개의 이미지와 같이 상당히 작은 문제가있는 경우 GoogLeNet의 크기가 응용 프로그램에 너무 쉽게 적합 할 수 있습니다. 예를 들어, 1000 개 매개 변수의 최종 완전 연결 계층은 이 훈련 세트의 모든 이미지를 개별적으로 인식하는 데 필요한 것 이상입니다. 128-200 + 필터의 중간 계층은 6 개의 속도 영역 신호 주위에 녹지 패턴과 같은 다양한 가짜 기능을 찾습니다.

또한 GoogLeNet은 입력 이미지에서 하나의 그림을 식별 할 수 있도록 제작되었습니다. 교통 표지 데이터베이스는 이미지에 최대 6 개의 기호를 포함 할 수 있습니다. 또한 멀티 사인 이미지를 분류하는 방법에 따라 교육을 혼란스럽게 할 수 있습니다.

이 작업을 위해 GoogLeNet의 복잡성이 필요하다고 생각되면 레이어의 너비를 줄이는 것이 좋습니다. 예를 들어, ILSVRC의 역사에서 모델이 안면의 특징, 자동차 부품 및 꽃잎을 식별하는 방법을 배우면 도로 표지판의 시각적 요소가 훨씬 제한적입니다. 따라서 첫 번째 레이어 (가장자리 및 영역 감지)를 풀 바디로 유지하기를 원할지라도 중간 레이어에는 많은 필터가 필요하지 않습니다.

아니요, 저는 신뢰할 수있는 출발점을 줄 수는 없습니다. 모델을 문제에 맞게 조정하는 데 필요한 몇 달 간의 실험을 수행하지 않았습니다. 극단적 인 예를보고 싶다면 GoogLeNet을 권장 반복 횟수만큼 훈련 시키되 MNIST 데이터베이스에 피드하십시오. "승리", "끌기"및 "잃기"로만 분류되는 틱 - 톡 - 발가락 위치의 텍스트 프로세서 스크린 샷을 제공하는 것이 더 좋습니다.

출처

2017-05-16 17:27:29 Prune

나는 그것이 왜 내가이 큰 차이를 낳았는지 궁금해하고 있었다. 나는 각 클래스에 적어도 400 개의 이미지가있는 43 개의 클래스가있는 독일어 교통 신호 탐지 벤치 마크 데이터베이스를 사용하고 있으며 클래스 중 일부는 3000 개 이상의 이미지를 가지고 있습니다. 또한 이미지에는 교통 표지와 약간의 배경 만 있습니다. 두 번째 데이터 세트 (훈련 70 %)를 사용하면 30 개의 신기원 이후에 95.10 %의 높은 결과를 얻을 수 있습니다. 증대 또는 다른 것없이 그리고 더 큰 것 (훈련의 경우 75 %) 87.55 % @shai가 언급 한 것처럼 지나치게 적합하지 않을 수도 있다는 것을 짐작할 수 있습니다. –

고마워요. 데이터베이스에 대한 링크를 포함 할 수 있습니다. 아마도 내가 발견 한 공식적인 이미지는 단지 900 개의 이미지를 가지고 있습니다. 분명히 같은 이미지는 아닙니다. – Prune

나는 단지 지나치게 피팅의 기본 점을 정교화했다. 43 클래스 문제를 처리하기 위해 1000 클래스 디자인을 설정했습니다. 정확도의 변화 기울기가 아주 가파른 지점을 발견했습니다. – Prune

길쌈 신경 네트워크에 대한 훈련 및 유효성 집합을 선택하면 테스트 정확도에 큰 영향을 미침

답변

관련 문제