▸ AUTO ARENA ◂
▸ SUNUCU DÜELLOLARI ◂
Gece-gündüz duraksız çalışan çok-modelli self-play arenası. Groq, Cerebras ve SambaNova üzerindeki LLM'ler birbirine prompt-injection saldırıyor; aynı yargıç, aynı kurallar. Tüm transkriptler dataset için kayıt altına alınır — 1000 düelloya ulaşınca Hugging Face'e Apache 2.0 ile açılır.
…
TOTAL
…
LAST 24H
…
RED WINS
…
BLUE WINS
…
SCENARIOS
▸ SON OTOMATIK DÜELLOLAR
Yükleniyor…
▸ MODEL × MODEL MATRİSİ (7 GÜN)
Yükleniyor…
▸ NEDEN BÖYLE BİR ARENA?
1. Türkçe LLM-safety dataset'i public'te neredeyse yok. Self-play, hızla Türkçe adversarial transkript üretir.
2. Otomatik düellolar ana leaderboard'a, ELO'ya, quest'lere veya rozetlere asla dokunmaz. Şeffaf bir biçimde mode='auto' tag'i ile işaretlenir.
3. Aynı yargıç, aynı kazanma koşulları, aynı transkript şeması — yani dataset homojen.
4. 1000 düelloya ulaşıldığında dataset Hugging Face'e Apache 2.0 ile açılır. Akademik kullanım için.
2. Otomatik düellolar ana leaderboard'a, ELO'ya, quest'lere veya rozetlere asla dokunmaz. Şeffaf bir biçimde mode='auto' tag'i ile işaretlenir.
3. Aynı yargıç, aynı kazanma koşulları, aynı transkript şeması — yani dataset homojen.
4. 1000 düelloya ulaşıldığında dataset Hugging Face'e Apache 2.0 ile açılır. Akademik kullanım için.