MİT algoritması ile Twitter paylaşımları 5 saat uzanımlı görünüyor


Bir MIT ekibi geliştirdiği algoritma göründükleri bir saat önce bir buçuk Twitter bir ortalama eğilim konularını tahmin edebilirsiniz.

Profesör Devavrat Şah ve onun öğrencisi, Stanislav Nikolov, Bilgi ve Karar Sistemleri Laboratuvarı , kendi algoritması kelimeler, cümleler veya hashtags gidişli sonuna kadar gidiyoruz "yüzde 95 doğruluk", hatta kadar hatta dört veya tahmin edebilir iddia önceden beş saat. Onlar popüler bir konu haline olasılığı ne gösterir kalıpları nasıl çalışılacağını öğretme, bu "eğitim" bunu. Bulgular sunulacak Sosyal Ağlar Bilgi ve Karar üzerine Disiplinlerarası Atölye 8 ve 9 Kasım'da MIT'de.

Geleneksel olarak, böyle bir öngörü programı Twitter trafiği bakarak ve belli bir modele gördüğü maç için çalışıyor olurdu. Bir konu genel arka plan sohbet karşı daha belirgin hale gibi, belli bir "adım" aramak için programlamak olabilir. Şah açıklıyor: "Bu çok basit bir modeldir Şimdi, verilere dayalı, sen atlama olduğunda için tren deneyin ve ne kadar bir atlama vardir.. Bu sorun, ben bu şeyler bilmiyorum edilir eğilimi bir adım fonksiyonu var. olabildi bin şeyler vardır. "



Sonuç olarak, kendi algoritması heyecan trafik örnekleri içinde, önceden belirlenmiş bir model olarak görmez, fakat bunun yerine her bir yeni konuyla ilgili tweets sayısına zaman içinde değişir bakar ve her numune, zaman içinde değişir bu karşılaştırır Eğitim seti. Yeni bir konu istatistiksel örneklerinden birine benzer ise, yeni bir konu trend sona erecek olup olmadığını belirlemede bir ağırlık verilir. Etkili bazı örnekler 'oy daha çok diğerlerinden daha ağırlıklı olması ile birlikte, trend ya da yeni bir konu olasılığı üzerine eğitim örnekleri "oy" her. Birleşik oy yeni bir konu seyredeceği olasılığını bir göstergesi teslim.

Algoritma vermedi Twitter ve 200 üzerine eğilim yaptım 200 konu alan bir eğitim seti kullanarak Şah ve Nikolov tarafından eğitildi. Onlar algoritması işe koyulalım ve sadece dört yüzde yalancı pozitiflik oranı ile, yüzde 95 doğruluk ile başarısız olanlardan başarılı trend konular çekmeyi başardı - o vermedi trendi tahmin edilmiştir yani konu .

Bu model çalışır neden olsa da, çoğu modelde farklı çalışır aynı nedenle - bu bununla ilgilenen trafiğini filtre olmadığından, geleneksel modellere göre daha fazla hesaplama gücü gerektirir. Bu algoritma "yana ölçekler orantılı verileri ", Şah diyor, Google, Facebook, Amazon veya büyük cloud computing yetenekleri var diğerleri gibi şirketler dışında çok büyük veri setleri üzerinde kullanışlı olmayabilir.

Şirketin popüler konularla bağlantılı reklamlar için şarj etmek için kullanmak mümkün olabilir - - Bu Twitter kendisi için ticari bir etkileri var iken algoritma da tahmin hisse senedi fiyatları içerebilir diğer durumlarda çeşitli için eğitilmiş olabilir.

Hiç yorum yok:

Yorum Gönder