Proje Başlığı: Akan Veri Uygulamalarında Sapan Verilerin Tespiti Üzerine Bir Araştırma
Proje Yürütücüsü: Dr. Öğr. Üyesi Ali ŞENOL
Mühendislik Fakültesi
Bilgisayar Mühendisliği Bölümü
Araştırma Yapılacak Kurum: Arizona State University (ASU)
Amerika Birleşik Devletleri
Proje Süresi: 12 Ay
Teknolojik gelişmeler sonucunda bilgisayar, telefon ve tablet gibi teknolojik ürünlere akıllı saatler, akıllı bileklikler ve akıllı TV’ler de eklenmiştir. Bunların yanında cep telefonlarının akıllanması ile Twitter, Facebook, Instagram ve Youtube gibi sosyal ağlar da hayatımızın ayrılmaz parçaları haline gelmiştir. Bu ağların kullanıcı sayıları milyarlarla ifade edilmektedir. Bütün bu teknolojik gelişmeler inanılmaz veri miktarlarının anlık olarak üretilmesine neden olmaktadır. Bu tür verileri klasik veri madenciliği yöntemleri ile işlemek çoğu uygulama için mümkün değildir. Çünkü bu tür verileri kaydederek tekrar tekrar işleme imkânı yoktur. Dolayısıyla bu tür verileri kaydetmeden, verileri özetleri üzerinden işleyebilecek uygulamalara ihtiyaç duyulmaktadır. Bu da akan veri madenciliği ve akan veri analizi kavramlarının ortaya çıkmasına neden olmuştur. Akan veri uygulamaları verileri kaydetmeye gerek duymadan, özetleri üzerinden işleyebilen ve hem veriyi gerçek zamanlı işleyen, hem de sonucu gerçek zamanlı olarak sunan uygulamalardır. Bu tür uygulamalar sağlık, güvenlik, mühendislik, bilim ve teknoloji gibi gerçek zamanlı akan verinin olduğu her alanda kullanılmaya uygun verimli yaklaşımlardır. Bu tür uygulamalar pek çok açıdan başarılı sonuçlar verseler de verinin sapan veri içermesi durumunda başarısı düşmektedir. Bu proje kapsamında akan veri uygulamalarında sapan verilerin tespit edilerek elemine edilmesi suretiyle modellerin başarısını arttırmaya yönelik bir araştırma yapılacaktır. Bu amaçla gerçek zamanlı olarak verileri izleyecek bir algoritmanın geliştirilmesi planlanmaktadır. Bunun için W genişliğinde bir veri sayısı penceresi kullanılacak ve bu pencere içerisindeki veriler üzerinde K-boyutlu ağaç ve alan arama ile mikro-kümeler tanımlanacaktır. Bu mikro kümelerin içinde kalan veriler sapan veri olmayan veriler anlamına gelirken, dışında kalan veriler ise sapan veriler olarak tanımlanacaktır. Bununla birlikte araştırma süreci boyunca daha etkin ve başarılı olmasını sağlayabilecek eklemelerin yapılması da planlanmaktadır. Önerilen yöntem tarafımızdan önerilmiş olan özgün ve yeni bir yaklaşım olacaktır. Proje kapsamına ait çalışmalar; Arizona Eyalet Üniversitesi (Arizona State University - ASU), Ira Fulton Mühendislik Okulları (Ira Fulton Schools of Engineering), Bilgisayar ve Artırılmış Zekâ Okulu (School of Computing and Augmented Intelligence - SCAI)’nda gerçekleştirilecektir.
--