Facebook Sahte Hesapları Tespit Etmek İçin Makine Öğrenmesini Nasıl Kullanıyor

2019'da Facebook, her yılın her çeyreğinde ortalama 2 milyar civarında sahte hesap kapattı. Dolandırıcılar bu sahte hesapları spam, kimlik avı bağlantıları gönderme veya kötü amaçlı yazılım yaymak için kullanıyor. Bu tuzaklar masum kullanıcılar için yıkıcı olabilecek kazançlı bir iştir.

Facebook şimdi bu zorluğun üstesinden gelmek için kullandığı makine öğrenme sistemi hakkında ayrıntılar yayınlıyor. Teknoloji devi iki tür sahte hesap arasında ayrım yapıyor. Birincisi, “kullanıcı tarafından yanlış sınıflandırılmış hesaplar”, bunlar Sayfa olarak açılmış olması gereken işletmelere ait veya evcil hayvanlar açılmış kişisel hesaplardır. Bunlarla başa çıkmak nispeten kolaydır; sadece bu hesapları Sayfalara dönüştürmek yeterlidir. “İhlal hesapları” ise daha ciddidir. Bunlar, dolandırıcılık ve spam ile uğraşan veya platformun hizmet şartlarını başka şekilde ihlal eden kişisel hesaplardır. İhlal eden hesaplar, çok geniş bir ağ oluşturmadan ve gerçek hesapları tuzağa düşürmeden mümkün olduğu kadar çabuk kaldırılmalıdır.

Bunu yapmak için, Facebook sahte bir hesabı oluşturulmadan önce veya aktif hale gelmeden önce engellemek için elle kodlanmış kurallar ve makine öğrenimi kullanır. Başka bir deyişle, gerçek kullanıcılara zarar vermeden önce işlem yapılır. Son aşama sahte bir hesap açıldıktan sonradır. Bu, algılamanın çok daha karmaşık hale geldiği ve Derin Varlık Sınıflandırması (Deep Entity Classification - DEC) olarak bilinen yeni makine öğrenme sisteminin devreye girdiği zamandır.

Derine inmek

DEC, sahte ve gerçek kullanıcıları ağdaki bağlantı düzenleriyle ayırt etmeyi öğrenir. Bu “derin özellikler” olarak adlandırılır ve kullanıcının arkadaşlarının ortalama yaşı veya cinsiyet dağılımı gibi şeyleri içerir. Facebook, her bir hesabı karakterize etmek için 20.000'den fazla derin özellik kullanıyor ve her profilin, nasıl davrandığına dair bir anlık görüntü sağlıyor buda saldırganların taktikleri değiştirerek sistemle oynamasını zorlaştırıyor.

Sistem, makinede üretilen çok sayıda düşük hassasiyetli etiket kullanarak başlar. Bunlar, kullanıcıların gerçek veya sahte olup olmadığını tahmin eden kurallar ve diğer makine öğrenme modelleri karışımı ile üretilir. Bu veriler bir sinir ağını eğitmek için kullanıldığında, model daha sonra dünya çapında yerel kültürel normları anlayan insanlar tarafından üretilen küçük bir yüksek hassasiyetli elle etiketlenen veri grubu ile ince ayar yapıyor.

Son sınıflandırma sistemi dört tür sahte profilden birini belirleyebilir: kişiyi temsil etmeyen gayri meşru hesaplar, saldırganlar tarafından ele geçirilen gerçek kullanıcıların güvenliği ihlal edilmiş hesaplar, tekrar tekrar gelir getiren mesajlar gönderen spam gönderici hesaplar ve kullanıcıları manipüle ederek kişisel bilgilerin açıklanmasını sağlayan hesaplar. Facebook, DEC uygulamasından bu yana, aylık aktif kullanıcıların yaklaşık %5'i kadar sahte hesapların hacmini platformda tuttuğunu belirtiyor.

Facebook’un temizleme çabalarının ayrıntıları, yaklaşmakta olan ABD başkanlık seçimlerinde, özellikle de deepfake konularında, manipülasyon konusundaki endişelerin ortaya çıkmasıyla bildirildi. Aralık ayında, New York Times, ikna edici profil resimleriyle birlikte sahte hesapları artırmak için deepfake kullanan koordineli bir dezenformasyon kampanyası olduğunu bildirdi.

Seçimlerin korunması

Facebook ekibi, bu konunun bildirilme zamanlamasının sadece bir tesadüf olduğunu söyledi. “Bu sadece genel olarak ihlalleri tespit etmekle ilgili; özellikle herhangi bir seçim konusunu hedeflemiyor” diyor Facebook’un Topluluk Bütünlüğü ekibinin mühendislik müdürü Daniel Bernhardt. Ancak DEC, platformun seçim tahrifatını azaltma çabalarını tamamlayıcı nitelikte olacaktır. Sistem, her profili kategorilere ayırmak için derin özelliklere dayandığı için, örneğin, deepfake profil görüntüleri tarafından insanların aldantılmasına karşı esnek olup kendini geliştirecektir.

Kâr amacı gütmeyen Düşünce Teknoloji Projesi'ni (Thoughtful Technology Project) kuran ve platform tasarımı ve yönetimini inceleyen Aviv Ovadya, Facebook'un temizleme prosedürleriyle daha şeffaf olma çabasının övgüye değer olduğunu söylüyor. “Güvenlik sistemlerinin çalışma şekilleri hakkında mimari karar sistemi diğer şirketler tarafından taklit edilebileceği için bu konuda dikkatlice konuşmak gerçekten yararlı ve güçlü olabilir” diyor. “Facebook gibi şirketlerin yatırım yapmak için küçük şirketlere göre çok daha fazla kaynağı olduğundan, bu bilgi paylaşımına sahip olmak faydalıdır.”

Ancak temizleme çabalarının da uzun bir yolu var. Aylık 2,5 milyar aktif kullanıcısıyla %5'i hala 125 milyon sahte hesaptır. Makine öğrenimi de şu ana kadar devam edecek: Bir modelin ne kadar veri eğitimi alırsa alsın, her kötü hesabı mükemmel bir hassasiyetle yakalayamaz. Platformu geliştirmek için muhtemelen diğer insan ve makine kombinasyonlarını kullanması gerekecektir.


HABERLER