Yeni Taciz Filtresinin varlığı, Android Authority tarafından yapılan APK incelemesi sırasında keşfedildi ve bu filtrenin varlığı, Android için resmi Reddit uygulamasının 2024.10.0 sürümünde tespit edildi. Resmi Android Reddit uygulamasının bu sürümü çeşitli resmi olmayan çevrimiçi kaynaklarda göründü, ancak Google Play Store hala mevcut en yeni sürüm olarak 2024.08.0’ı gösteriyor.
Uygulama, moderatörlere taciz edici gönderilerin yayınlanmasını önleme konusunda yardımcı olmak üzere eğitilmiş büyük bir dil modeline atıfta bulunan kod satırları içeriyor ve yeni aracın varlığını yansıtan, geçen hafta güncellenen bir Reddit yardım sayfası tarafından destekleniyor.
Yardım sayfasında “Taciz Filtresi, moderatörlerin taciz edici olarak kabul edilmesi muhtemel gönderileri ve yorumları otomatik olarak filtrelemesine olanak tanıyan isteğe bağlı bir topluluk güvenliği ayarıdır.” ifadesi yer alıyor. “Filtre, moderatör eylemleri ve Reddit’in dahili araçları ve yaptırım ekipleri tarafından kaldırılan içerik konusunda eğitilmiş bir Büyük Dil Modeli (LLM) tarafından desteklenmektedir.“
Filtre, Reddit topluluğunun mod araçlarında etkinleştirilebilir; ancak bireysel moderatörlerin bunu etkinleştirmek için alt düzenleme ayarlarını değiştirme izinlerine sahip olmaları gerekir.
Taciz filtresi düşük (“en az içeriği filtreler ancak en doğru sonuçları verir“) ve yüksek (“en fazla içeriği filtreler ancak daha az doğru olabilir“) olarak ayarlanabilir ve ayrıca yapay zekayı taciz etmeye zorlamak için açık bir izin verilenler listesi içerir. En fazla 15 tanesi eklenebilecek belirli anahtar kelimeleri gözardı edin.
Etkinleştirildiğinde filtre, moderatörlerin doğruluk açısından inceleyebileceği “potansiyel taciz” adı verilen moderasyon kuyruğunda yeni bir etiket oluşturur.
Reddit’in yardım sayfasında, özelliğin artık masaüstünde ve resmi Reddit uygulamalarında mevcut olduğu belirtiliyor ancak özelliğin ne zaman eklendiği belli değil.