Yüz tanıma algoritmaları milyonlarca yüz söz konusu olduğunda yanılabiliyor

Facebook‘ta işlerin nasıl başladığını hatırlarsınız.

Önce yüklediğiniz fotoğraflarda kimler olduğunu etiketlememizi istedi. Biz de genelde fotoğraflardaki yüzlerin üzerine tıklayıp ilkokul arkadaşlarımızı, kuzenlerimizi etiketlemeye başladık.


Sonra biz zahmet etmeyelim diye yüzleri kendi işaretleyip bunların kime ait olduğunu belirtmemizi istedi. Biz de “vaay yüzleri algıladı!”  diye sevinip arkadaşlarımızı, akrabalarımızı etiketlemeye devam ettik.

Daha sonra bütün zahmeti sadece bir tıklamaya indirgeyip “bu falanca mı?”, “bu resimdeki şu mu?”, “bu sen misin?” diye fotoğraflardaki bütün yüzleri etiketleyip sadece bizden onay vermemizi isteyince anladık ki Facebook artık bizi -kapşon kullansak bile- nerde görse tanıyacak hale geldi.

Yüz tanıma sistemlerindeki ilerleme kişisel güvenlik/mahremiyet sorunlarını da beraberinde getiriyor. Pek çok teknoloji firması bu konuda tepkiler alıyor. Örneğin Google’ın Street View uygulaması’nın Hindistan’da yasaklandığından bahsetmiştik.

Yüz tanıma iki taraflı çalışabilen bir mekanizma.. “Bu fotoğrafta kimler var?” diyebileceğiniz gibi “Bu şahıs hangi fotoğraflarda var?” sorusunu sormak da mümkün. Video kayıtlarının birbiri ardınca devam eden yüzlerce fotoğraf karesinden ibaret olduğunu bildiğimize göre aslında “bu şahıs hangi videolarda var?” diye de sorulabilir.

Sadece görüntü tanıma değil, ses tanıma da günümüzde oldukça ilerlemiş bir teknoloji. Radyoda çalan bir müziğin adını bulmak için kullandığımız uygulamalar bunun en basit örneği. İnsan yüzü ayrıştırıcı birer anahtar gibi kullanıldığı kadar insan sesi de bu şekilde anahtar olarak kullanılabilir. Yukarıdaki örnekte bahsettiğimiz “bu şahıs hangi videolarda var?” sorusu “bu ses geçtiği zaman beni uyar” şeklinde sorulabilir. Soruyu nerde sorduğunuz da önemli. Mesela bütün dijital ses trafiğinin geçtiği bir ağın üzerinde bu soruyu sorduğunuzu düşünün.

Bu teknolojiler hem teorik hem de pratik olarak pekala güvenlik sistemlerinde kullanılabilir. Konuyu fütüristik bir temayla işleyen CBS dizisi Person of Interest oldukça beğeniliyordu (8.5/10 IMDB). İki gün önce 5. sezonda final yapan dizide bütün güvenlik kameralarına erişebilen, yapay zeka yetenekleri olan bir yazılım işlediği görüntülerden durum değerlendirmesi yapıp olabilecek tehlikeleri önlemeleri için yöneticilerine bilgi veriyordu.

Fütüristik: Kendi zamanına göre ileriyi görebilen.

Yüz tanıma algoritmaları kabaca bahsettiğimiz nedenlerden ötürü ürkütücü görünse de aslında milyonlarca yüz söz konusu olduğunda bu algoritmaların o kadar da başarılı olmadıkları ortaya çıktı.

Washington Üniversitesi’nde yüz tanıma algoritmalarının gerçek dünyadaki milyonlarca yüz arasında nasıl bir performans sergilediklerini test etmek amacıyla geçtiğimiz yıldan beri MegaFace Challenge isimli bir organizasyonda yüz tanıma algoritmaları yarıştırıldı.

Araştırmacılar önceden etiketlenmiş kişilere ait fotoğraf setleriyle başladı. Bir sette  farklı açılarda çekilmiş ünlü fotoğrafları, diğerinde farklı yaşlarda kişilere ait fotoğraflar kullanıldı.

Testler çalıştırılıp 10 dikkat dağıtıcı fotoğrafdan, 1 milyon dikkat dağıtıcı fotoğrafa kadar çeşitli seviyeler arasında yüz tanıma işlemleri yapılması sağlandı.

Sonuçlar bu inatçı algoritmalar için biraz sürpriz oldu. Değişken yaşlarda kişilere ait fotoğraflar içeren sette Google’ın FaceNet‘i açık bir zafer elde ederken ünlüler setinde Rusların N-TechLab‘ı ile başabaş bir performans sergiledi. Çin’in Shenzhen eyaletinden SIAT MMLab onur ödülü aldı.

Facebook’un DeepFace teknolojisi iyi bir rakip olurdu mutlaka fakat bu yarışmaya katılmak zoraki olmadığından ve Facebook henüz DeepFace’i halka açmadığından onun MegaFace’deki performansı sır olarak kaldı.

Grafikler gösteriyor ki dikkat dağıtıcı fotoğraf sayısı logaritmik olarak arttıkça her iki lider istikrarlı bir düşüş gösterdi. Google’ın FaceNet’i 10 bin’den sonra tutunamadı.

Bu veriler gösteriyor ki yüz tanıma algoritmaları henüz güvenlik sistemlerinde etkin olarak kullanmak için daha çok yol kat etmeleri gerekiyor.

Kaynak: TechCrunch

 

Hasan Civelek

BT Magazin'in kurucusu. Kitapi kurucu ortağı. Elektronik Mühendisi. 2001'den beri PHP üzerine çalışıyor. Ubit AŞ.'de Ar-Ge direktörü ve PHP/iOS uygulama geliştiricisi olarak görev yapıyor. 2010'dan beri blogger.

Recent Posts

Power BI Eğitim

Power BI, iş dünyasında veri görselleştirme ve iş zekası çözümleri sunan en popüler araçlardan biri…

2 ay ago

Togg T10X’in yeni rengi Ayder ile tanışın

Togg T10X modelinin seri üretimden çıkışının 2. yıl dönümünde yeni rengi duyurdu: Ayder. Karadeniz'in eşsiz…

3 ay ago

Bayiden çıkan CAR MEKAN’da: Araç Koruma Sanatı

Araç sahipleri için otomobillerini dış etkenlerden koruma ihtiyacı, her geçen gün dahafazla önem kazanıyor. Bu…

3 ay ago

Togg T10X’lere ADAS özellikleri geliyor

Togg T10X araçlara yeni sürümle birlikte ADAS (Advanced Driver Assistant System / Gelişmiş Sürücü Asistan…

3 ay ago

Peşinatsız Araba

Birçok insan için araba sahibi olmak büyük bir hayaldir. Ancak, peşinat gerekliliği, bu hayalin gerçekleşmesini…

3 ay ago

JBL, Xiaomi ve Bluetooth Kulaklık İncelemesi: Hangi Model Size Uygun?

Kulaklık seçimi, müzik tutkunları ve gün içinde sıkça görüşme yapanlar için oldukça önemli bir konu.…

3 ay ago