
Bu iki terimi birbirinin yerine kullanan pek çok insan var. Bunlar aynı şey değildir. Aradaki farkın ne olduğuna bakalım.
Görüntü Sınıflandırma
Bu, bir görüntüyü girdi olarak alma ve bir sınıf grubundan bir sınıf etiketi çıkarma işlemidir.
Giriş – Bir Görüntü.
Çıktı – Resmin ait olduğu sınıf etiketi.
Örneğin; 3 sınıf etiketimiz olsun – Aslan, Laptop, Telefon. Şimdi algoritmaya bir görüntü verirsek, bu görüntünün bir Aslan, bir Laptop ya da bir telefon mu yoksa hiçbir şey mi olduğunu söyleyecektir.

Yerelleştirme ile Görüntü Sınıflandırma
Bu işlem bir görüntüyü girdi olarak alır, bir sınıf etiketi çıkarır ve ayrıca görüntüyü bulmak için nesnenin çevresine sınırlayıcı bir kutu çizer.
Giriş – Bir Görüntü
Çıktı – Bir sınıf etiketi ve bir sınırlayıcı kutu

Nesne Algılama
Bu işlemde, Görüntü yerelleştirmesi Görüntüdeki tüm nesnelere uygulanmalıdır, bu da birden fazla sınırlayıcı kutuya neden olur.
Giriş – Bir Görüntü
Çıktı – Sınıf etiketleri + Tüm nesneler için sınırlayıcı kutular
Bu nesneler farklı sınıflara ait olabilir. Açıkçası sadece modelin eğitildiği sınıfları belirleyecektir.

Bu, nesne algılamanın tipik bir sonucunun nasıl göründüğüdür. Dizüstü bilgisayar ile birlikte bir Kalem ve Telefon tanımladığını görebilirsiniz. Artık Görüntü Sınıflandırma, Görüntü Yerelleştirme ve Nesne Algılama arasındaki farkı biliyoruz.