0

기계 학습을위한 소프트웨어 프로세스/아키텍처 설정과 관련하여 개념적 질문이 있습니다. 나는 웹 응용 프로그램을 가지고 있으며 페이스 북의 얼굴 인식과 같은 알고리즘 학습 도구를 통합하려고합니다 (일반적으로 개체 제외). 그래서이 모델은 특정 이미지를 내 서비스에 업로드하는 방식으로 분류됩니다 (fb가 특정 인물을 어떻게 분류 할 수 있는지 등).사용자 이미지 태깅을 사용한 이미지 분류 모델의 특수화

거친 개요는 다음과 같습니다

event:  User uploads image; image attempts to be classified 
if failure: draw a bounding box on object in image; return image 
interaction: user tags object in box; send image back to server with tag 
????:  somehow this new image/label pair will fine tune the image classifier 

내가 마지막 단계에 도움이 필요합니다. 일반적으로 전송 학습이나 일반적으로 교육에서 프로그래머는 이미지로 가득 찬 커다란 데이터베이스를 가지고 있습니다. 내 경우에는 사전 모델 (Google의 시작 - v3)이 있지만 사용자가 콘텐츠 업로드를 시작할 때까지는 미세 조정 데이터베이스가 존재하지 않습니다.

그렇다면 특수 데이터베이스를 구축하는 데 어떻게 태그 지정 방법을 사용할 수 있습니까? FB가이 문제에 부딪쳐 해결했다고 확신하지만 해결책을 찾을 수 있습니다. 몇 가지 생각 (그리고 결정적 연구) 후, 내가 생각할 수있는 유일한 전략 중 하나입니다 :

A) stockpile tagged images and do a big batch train 

B) somehow incrementally input a few tagged images as they get 
    uploaded, and slowly over days/weeks, specialize the image classifier. 

적으로는, 내가 옵션 A를 피하기 위해 싶지만, 어떻게 현실 B입니다 확실하지 않은 I, 나이있는 경우 이 작업을 수행하는 다른 방법. 감사!

+0

하나의 학습자를 모든 사람 또는 한 명의 학습자를 사용자별로 전문화하려고합니까? 어떤 경우에는, 새로운 라벨 이미지 (들)을 복용하고 그들이 와서 네트워크 확률 그라데이션 하강의 몇 반복 (또는 다른 간단한 방법을) 실행에 문제가 있나요? [온라인 학습] (https://en.wikipedia.org/wiki/Online_machine_learning)을 참조하십시오. – user3658307

+0

예, 전체 시스템에 대해 한 명의 학습자. 그래, 온라인 학습은 제한된 동적 데이터로 모델을 '순차적으로'업데이트 할 수있는 전략 인 것 같다. –

답변

2

예, 이것은 일반적인 예로는 online learning입니다.

특히 새로운 변환 데이터의 경우, 확률 적으로 그래디언트 디센트 반복을 실행할 수 있습니다. 필요한 경우 학습 속도를 조정하는 것이 좋습니다 (예를 들어 자신의 신뢰도에 따라 주어진 샘플의 중요성을 조정할 수 있도록). 위에서 언급 한 것처럼이 작업을 수행 할 수있는 "미니 배치"를 저장할 수도 있습니다 (설정에 따라 다름). 당신이 당신의 학습자와 좀 더 전문화를 허용 할 경우에도

, (예를 들어, 사용자 간), domain adaptation를 찾아보십시오.