SİU’13 programı belli oldu. Kurultayda “Çok-öbekli Veri için Aradeğerlemeci Ayrışım” isimli çalışmamızı  sunacağım. Çalışmanın PDF’ine anasayfamdaki yayınlar bölümünden, özetçesine ise bu yazının devamından erişebilirsiniz. $K$-ortanca algoritması ve kullanım alanı için güzel bir kaynak olabilir. SİU’ya gelenlerle Kıbrıs’ta görüşmek dileğiyle.

Özetçe

Aradeğerlemeci Ayrışım (AA) veri matrisini kendi sütunlarından oluşan bir alt-küme ile ifade etmeyi hedefleyen bir matris ayrışımıdır. Seçilen sütunların veriyi ifade edecek öznitelikleri içerdiği düşüncesine dayanır. Literatürdeki yaygın AA yöntemi önem örneklemeye dayalıdır. Bu yöntemde her sütun için bir istatistiksel önem değeri hesaplanır ve bu değerlerle orantılı olarak rasgele $K$ adet sütun seçilir. Rassal yöntemlerdeki amaç matrisin değer kümesini en iyi ifade edecek sütunları seçerek daha iyi bir düşük-mertebeli matris yaklaştırımıdır. Seçilen sütunlar gerçek noktalar olduğu ve seyrek veride seyrekliği koruduğu için AA, Tekil Değer Ayrışımı’na iyi bir alternatif olarak görülmektedir. Fakat, veri birden çok öbek içerdiğinde en iyi düşük-mertebeli yaklaştırımı veren sütunlar betimleyici özelliği en yüksek sütunlar olmayabilir. Bu çalışmada, öbeklemeye dayalı yeni bir AA yöntemi geliştirdik. Daha yüksek betimleyicilik ve yorumlanabilirlik hedefiyle $K$-ortanca yöntemini kullandık. AA’yı elle-yazılmış rakam tanıma problemine uyguladık ve önerilen yöntemi literatürde en çok kabul gören yaklaşımla karşılaştırdık. Önerilen yöntemin veriyi betimlemede daha üstün olduğunu gösterdik. Verinin çok büyük bir kısmının atılması durumunda dahi başarının korunduğunu ortaya koyduk.

Not: Sunumu bitirince onu da yayınlar bölümüne koymayı istiyorum.