Nové NN je. Na CNN môže byť vyškolení na detekciu jedného objektu v obraze. Avšak, čo ak je akýkoľvek obrázok dataset môže obsahovať ľubovoľné n # objektov. To nepredstavuje problém CNNs ako výstup hustá vrstva musí byť pevnej veľkosti? Ako by ste tento problém vyriešiť?
Napríklad: Povedzme, že som náhodne zachytených 2 obrázky z tohto súboru. Obrázok 1 má 2 objekty a obrázok 2 má 5 predmetov. Y označenie pre img1 by obsahovať ohraničenie súradnice pre 2 objekty; y označenie pre img2 by obsahovať súradnice pre 5 predmetov -- oveľa väčší y vektor ako img1.
Možné riešenie? :
Potreboval by som nájsť obrázok s najväčším # objektov (označenie tejto hodnoty ako M). Poďme sa tiež povedať, objekt má 4 súradníc. Ak M = 5, potreboval by som y vektor z 20. Ak obrázok má 1 objekt, v y vektor by obsahovať 4 non-nulové hodnoty A 16 nulové hodnoty. 4 non-nulové hodnoty by predstavujú súradnice a 16 nulové hodnoty by predstavujú súradnice iné neexistujúce objekty.