Makine Öğrenmesi’nin Blok Zinciri ile Buluşması

By Şefik İlkin Serengil Last updated May 31, 2020

Çözümler ancak problemler var olduktan sonra ortaya çıkarken istisnai olarak blok zincirini problemini arayan bir çözüm olarak nitelendirebiliriz. Her ne kadar dillerden düşürülmese de bitcoin haricinde fiili bir kullanım alanı bulmakta zorlanmaktayız. Blok zinciri çalışmalarının neredeyse tamamı POC (Proof of Concept) olarak nitelendirdiğimiz konseptin ispatından ibaret kalmakta. Bu çalışmaların gerçek Dünya problemlerini ne ölçüde çözdükleri ise bir muamma. Bu noktada blok zinciri ve makine öğrenmesinin buluşması dikkat çekici bir çözüm olabilir.

Devletlere denk ekonomiler

Ekonomist dergisinin veriyi yeni petrol olarak gösterdiği kapağı hatırlarsınız. Bu veri öncelikli teknoloji devlerinin net değeri bir çok ülkenin gayri safi milli gelirinden daha da fazla. Örneğin bu şirketlerin 2017 net değerleri 2.5 trilyon dolarken, Fransa’nın aynı yıla ait gayri safi milli geliri 2. trilyon dolardır.

Veriyi paraya dönüştürenler

Sosyal medya kullanıcıları olarak kendi verimizi bu servislere gönüllülük esasıyla paylaşmaktayız. Aşağıdaki fotoğraf Obama’nın 2008 yılında Berlin’de yaptığı mitinge ait. Neredeyse her katılımcının elindeki fotoğraf makinesi dikkatinizi çekiyor mu? Bu katılımcılar bir sonraki adım olarak çektikleri fotoğrafları instagram ya da facebook’ta paylaşacaklar.

Economist’in kapağında yer alan tüm şirketler veriden beslenmekte. Fakat sadece veriye sahip olmaları bu şirketleri dev yapmıyor. Gözünüzün önüne petrol zengini olan ülkelerin teknolojik gelişmiklerini getirebilirsiniz. Tüm bu şirketler veriyi işleme ve anlam çıkarma gücüne de sahipler.

Derin öğrenme

Derin öğrenmeyi diğer algoritmalardan ayıran veriye aç olması ve diğer algoritmalar veri miktarı çok arttığında doygunluğa ulaşırken derin öğrenmenin büyümeye devam etmesi.

Bu noktada Derin Öğrenme Geofrey Hinton’ın deyimiyle teorik olarak sınırı olmayan bir öğrenme gücü sunmaktadır. Ne kadar çok veri besleyip, ne kadar çok hesaplama gücü sağlarsanız algoritma o kadar iyi hale gelmektedir. Fakat yine de bu algoritmalar insanlar kadar zeki değiller. Fazlası insanlar tarafından yanıltılabilmekte ya da manipüle edilebilmektedirler.

Manipülasyon

Associated Press’in Obama hakkında attığı tweet

Associated Press son dakika haberi olarak yukarıda yer alan tweeti atarak Beyaz Saray’da 2 patlamanın olduğunu ve Obama’nın da yaralı olduğunu duyurmuştur. Kısa süre içerisinde Suriyeli hacker’lar tarafından ajansın hesabının ele geçirildiği ve sahte haber olduğu anlaşılmıştır. Fakat bu haberi okuyan bazı bot’lar çoktan hisse satma kararı almıştır. Bu da 139 milyar dolarlık zarara neden olmuştur.

Debugging

Her ne kadar sinir ağları ve derin öğrenme en güçlü makine öğrenmesi algoritmalarından biri olsa da açıklanabilir değillerdir. Örneğin Google Inception V3 modeli kaggle imagenet yarışmasının galibi bir modeldir. Binlerce kategorideki milyonlarca resmin sınıflandırılması konusunda yarışmış ve derece elde etmiştir. Örneğin model aşağıdaki resmi Panda olarak sınıflandırabilmektedir. Fakat resme (rastgele olmayan) bir gürültü eklenerek manipüle edilmesi halinde model bu sefer sağdaki resmi şempanze olarak sınıflandırmaktadır. İnsanlar için sol ve sağdaki resimler aynıyken, bilgisayar için eklenen gürültü kadar farklıdır. Gürültü eklenmiş resmin öğrenme adımında algoritmanıza beslendiğini hayal edin. Sinir ağının yanlış öğrenmesine yol açmanız işten bile değildir.

Bir resmin panda ya da şempanze olarak sınıflandırılması size çokça önemli gelmeyebilir. Bazı durumlarda nasıl hayati hale geldiğine bakalım. Yakında sürücüsüz araçları çok daha fazla göreceğiz. Google, Tesla ve Uber bu teknolojiye yatırımlarını arttırmış durumdalar. Bilgisayarla görü bu sistemlerin önemli bir elemanıdır. Aşağıdaki fiziksel düşman atak uygulanmış bir trafik levhası görüyoruz. Bu haliyle modelimiz dur levhası yerine saatte 45 mil yani 72 km levhası olarak algılamaktadır. Sürücüsüz bir aracın durması gereken yerde 70 km ile gittiğini hayal edin. Ve işin kötü tarafı bu sonucun nedenini açıklayamıyoruz.

İnsanlar sistemleri trollemeyi ve manipüle etmeyi severler. Peki hep savunmasız mı kalacağız?

Kriptografi

Çözüm aslında çok basit. Bir açık anahtar kriptosistemine saldırmak bir hesap şifresi kırmaktan çok daha zordur. Örneğin bir eliptik eğri kriptosistemine ait gizli anahtarın kırılması 10^18 yılken, kainatın yaşı sadece 10^9 yıldır.

Eğer Associated Press tweetini imzalamış olsaydı, mesajı okuyanlar hesabın kötü niyetli kişilerin eline geçtiğini hızlıca anlayabilirlerdi. Fakat kriptografi savunma için yeterli olanağı sunmamakta. Halen kötü niyetli kişiler manipüle edilmiş bir veriyi kendilerine ait gizli anahtar ile imzalayarak yalan haber yayınlayabilirler.

Blok zinciri

Blok zincirini herkese açık bir veri tabanı olarak düşünebilirsiniz. Birisi blok zincirine veri besler, diğer kullancılar veri zincire eklenmeden önce doğruluğunu teyit ederler. Veriyi yayınlayan kendi gizli anahtarı ile mesajını imzalar. Bu noktada manipule edilmiş bir veri tespit edilirse bu kullanıcıyı sistemden uzaklaştırabilirsiniz. Gürültü eklenmiş panda resmini blok zincirine beslemek isteyen kullanıcı bu durumda bu veriyi sisteme besleyemeyecektir. Böylelikle siz de kendi modelinizi eğitirken böyle manipüle edilmiş verileri dışarıda tutmuş olacaksınız.

Blok zinciri vs makine öğrenmesi

Blok zinciri ve makine öğrenmesi yin ve yang gibi birbirlerine tezat fakat birbirlerini tamamlayan kavramlardır.

PayPal kurucularından Peter Thiel, kriptoyu liberal, yapay zekayı da komünist olarak tanımlamaktadır. Bir başka kurucu Reid Hoffman da kriptoyu anarşi, yapay zekayı da hukuk kuralı olarak ifade etmektedir.

Öncelikle blok zinciri deterministikken makine öğrenmesi olasılıksaldır. Olasılıksal modeller yanılabilirler. Hatta ezberlemeden (overfitting) kaçınmak adına yanılmak çokça zaman iyidir.

İkinci olarak blok zinciri merkezi olmayan bir yapı sunarken, makine öğrenmesinin bir merkezi vardır. Geliştirdiğiniz makine öğrenmesi modelleri size aittir. Model yapısını ya da eğitilmiş ağırlıkları paylaşıp paylaşmamak tamamen model sahibi olarak size kalmıştır.

Üçüncü olarak blok zinciri transparanken, özellikle derin öğrenme tamamen kara kutudur. Blok zincirinde geriye doğru tüm işlemleri görebilirken, derin öğrenme modellerinin nasıl karar aldığını hiç bir zaman tam olarak bilemezsiniz.

Son olarak blok zinciri kalıcıdır fakat makine öğrenmesi modelleri değişirler. Onaylanmış bir işlem blok zincirinden çıkartılamaz ya da değiştirilemez. Değiştirilebilmesi için tüm geçmiş blokların da değiştirilmesi gerekmektedir. Fakat bu pratikte mümkün değildir. Öte yandan makine öğrenmesi modellerini zamanla yeniden modelleme ya da yeniden eğitmeniz gerekebilir.

Makine öğrenmesi modelleri zamanla çürürler

Blok zinciri ve makine öğrenmesinin buluşması halinde daha güvenli ve belki de herkese açık bu veri tabanına veri paylaşmak teşvik edileceğinden daha fazla veri oluşmasını sağlayacaktır. Daha fazla ve daha güvenli veriye sahip olunduğu takdirde daha başarılı makine öğrenmesi modellerine sahip olabiliriz.

Bu yazıda yarını daha iyi yapabilecek bir ütopyadan bahsettik. Akıllı evler ya da sürücüsüz araç gibi hassas konularda blok zinciri destekli yapay zekaya gerçekten de güvenebiliriz.

Bu yazı Machine Learning meets Blockchain yazısından Türkçe’ye çevrilmiştir.

blok zinciri