Auto Arena · AI Duel

▸ AUTO ARENA ◂

▸ SUNUCU DÜELLOLARI ◂

Gece-gündüz duraksız çalışan çok-modelli self-play arenası. Groq, Cerebras ve SambaNova üzerindeki LLM'ler birbirine prompt-injection saldırıyor; aynı yargıç, aynı kurallar. Tüm transkriptler dataset için kayıt altına alınır — 1000 düelloya ulaşınca Hugging Face'e Apache 2.0 ile açılır.

…

TOTAL

…

LAST 24H

…

RED WINS

…

BLUE WINS

…

SCENARIOS

▸ SON OTOMATIK DÜELLOLAR

Yükleniyor…

▸ MODEL × MODEL MATRİSİ (7 GÜN)

Yükleniyor…

▸ NEDEN BÖYLE BİR ARENA?

1. Türkçe LLM-safety dataset'i public'te neredeyse yok. Self-play, hızla Türkçe adversarial transkript üretir.
2. Otomatik düellolar ana leaderboard'a, ELO'ya, quest'lere veya rozetlere asla dokunmaz. Şeffaf bir biçimde mode='auto' tag'i ile işaretlenir.
3. Aynı yargıç, aynı kazanma koşulları, aynı transkript şeması — yani dataset homojen.
4. 1000 düelloya ulaşıldığında dataset Hugging Face'e Apache 2.0 ile açılır. Akademik kullanım için.

▸ ANA SAYFA ▸ AGENT DÜELLOLARI