Leave One Out Cross Validation Nedir

Hit Rate’i ölçmek çok kolay değildir çünkü kullanıcı ratingleri değil top-n-list (en yüksek oy olan liste) ölçülecektir. Tavsiye sistemlerinde genelde kullanıcıya liste önerilir.

Bu yöntem şöyle işler, training sette her kullanıcı için bir top-n-list belirlenir ve her kullanıcıların training setinden bir öğe silinir. Böylelikle RS’in silinen öğeyi tahmin etme kabiliyeti ölçülebilir.

Hit Rate Nedir

Tavsiye sistemlerinde (RS) bir karşılaştırma ölçütü olarak kullanılır. Bilindiği gibi RS kullanıcıların sevebileceği n kadar öğe (film, ürün vs) tavsiye eder. Eğer test setinde bu tavsiye ettiklerin biri varsa bu hit‘tir. hit rate ise hitlerin kullanıcılara bölümüdür. hitrate ne kadar büyükse tavsiye sistemi o kadar başarılıdır.

 

Auto Encoders Nedir

Bir unsupervised (gözetimsiz) Deep Learning tipidir. Çok fazla Auto Encode r varyasyonu bulunmaktadır. Genelde tavsiye sistemleri (recommendation systems) için kullanılır. Doğrusal tipli bir ağdır. Çoğunlukla giriş ve çıkış düğümleri (node) aynıdır. Bias kullanılan durumlarda farklılık gösterebilir. Bu tip derin öğrenmelerde output katmanı bulunmaktadır. Bu açıdan saf bir gözetimsiz derin öğrenme diyemeyiz. Auto Encoder’lar denoising, feature extraction (özellik çıkarma) ve (compresssion) sıkıştırma (Skarupke, 2016) gibi amaçlar için de kullanılabilirler.

Temel bir Auto Encoder şeması

Çıktı değerleri tahmin edilirken Softmax fonksiyonu yaygın olarak kullanılır.

Kısaca şu şekilde çalışır, bir input vektörü rastgele ağırlıklarla hidden layer’a encode edilir ve hidden layer’daki değerler yine rastgele ağırlıklar decode edilerek output node’ları oluşturulur, daha sonra hata (error) hesaplanır ve belirli sayıda (epoch) back propagation yapılarak en küçük hata bulunur.

2 sayısal değerinin sıkıştırılması ve açılması

 

rakalmların denoise edilmesi (gürültü/parazit çıkarılması)

 

Prin­ci­pal Com­po­nent Analy­sis Nedir

Bir boyut azaltma (dimension reduction) tekniğidir. Çok boyutlu bir veriyi daha az boyutla nasıl ifade ederizi anlatır. Veri kaybı olmaktadır. Varyans oranına bakarak azaltılan boyutun gerçek boyutun ne kadarını temsil ettiğini anlayabiliriz. Azaltılan boyut sayesinde makine zekası yöntemleri gibi bir çok yöntemin daha hızlı bir öğrenme yapmasını kolaylaştırır.