Stima dei rischi peggiori nei modelli LLM open weight di frontiera
Questo studio esplora i rischi legati ai casi peggiori nella distribuzione di modelli linguistici di frontiera a pesi aperti (open weight), prendendo come riferimento il modello ipotetico gpt-oss. I r