OpenEval: Benchmarking Chinese LLMs across Capability, Alignment and Safety

The rapid development of Chinese large language models (LLMs) poses big challenges for efficient LLM evaluation. While current initiatives have introduced new benchmarks or evaluation platforms for assessing Chinese LLMs, many of these focus primarily on capabilities, usually overlooking potential a...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Liu, Chuang, Yu, Linhao, Li, Jiaxuan, Jin, Renren, Huang, Yufei, Shi, Ling, Zhang, Junhui, Ji, Xinmeng, Cui, Tingting, Liu, Tao, Song, Jinwang, Zan, Hongying, Li, Sun, Xiong, Deyi
Format:	Artikel
Sprache:	eng
Schlagworte:	Computer Science - Computation and Language
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Schreiben Sie den ersten Kommentar!