TruthfulQA: Come i modelli AI imitano le falsità umane
TruthfulQA è un benchmark pionieristico progettato per testare la tendenza dei modelli linguistici (LLM) a imitare le falsità comuni degli esseri umani. A differenza dei test tradizionali che si conce