Suchergebnisse - NI YUANSHENG | OPAC THWS

1

Evaluating the Robustness to Instructions of Large Language Models von Ni, Yuansheng, Jiang, Sichao, wu, Xinyu, Shen, Hui, Zhou, Yuli

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

GenAI Arena: An Open Evaluation Platform for Generative Models von Jiang, Dongfu, Ku, Max, Li, Tianle, Ni, Yuansheng, Sun, Shizhuo, Fan, Rongqi, Chen, Wenhu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark von Yue, Xiang, Zheng, Tianyu, Ni, Yuansheng, Wang, Yubo, Zhang, Kai, Tong, Shengbang, Sun, Yuxuan, Yu, Botao, Zhang, Ge, Sun, Huan, Su, Yu, Chen, Wenhu, Neubig, Graham

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

MEGA-Bench: Scaling Multimodal Evaluation to over 500 Real-World Tasks von Chen, Jiacheng, Liang, Tianhao, Siu, Sherman, Wang, Zhengqing, Wang, Kai, Wang, Yubo, Ni, Yuansheng, Zhu, Wang, Jiang, Ziyan, Lyu, Bohan, Jiang, Dongfu, He, Xuan, Liu, Yuan, Hu, Hexiang, Yue, Xiang, Chen, Wenhu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

EasyEdit: An Easy-to-use Knowledge Editing Framework for Large Language Models von Wang, Peng, Zhang, Ningyu, Tian, Bozhong, Xi, Zekun, Yao, Yunzhi, Xu, Ziwen, Wang, Mengru, Mao, Shengyu, Wang, Xiaohan, Cheng, Siyuan, Liu, Kangwei, Ni, Yuansheng, Zheng, Guozhou, Chen, Huajun

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation von He, Xuan, Jiang, Dongfu, Zhang, Ge, Ku, Max, Soni, Achint, Siu, Sherman, Chen, Haonan, Chandra, Abhranil, Jiang, Ziyan, Arulraj, Aaran, Wang, Kai, Do, Quy Duc, Ni, Yuansheng, Lyu, Bohan, Narsupalli, Yaswanth, Fan, Rongqi, Lyu, Zhiheng, Lin, Yuchen, Chen, Wenhu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark von Wang, Yubo, Ma, Xueguang, Zhang, Ge, Ni, Yuansheng, Chandra, Abhranil, Guo, Shiguang, Ren, Weiming, Arulraj, Aaran, He, Xuan, Jiang, Ziyan, Li, Tianle, Ku, Max, Wang, Kai, Zhuang, Alex, Fan, Rongqi, Yue, Xiang, Chen, Wenhu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Evaluating the Robustness to Instructions of Large Language Models von Ni, Yuansheng, Jiang, Sichao, wu, Xinyu, Shen, Hui, Zhou, Yuli

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

II-Bench: An Image Implication Understanding Benchmark for Multimodal Large Language Models von Liu, Ziqiang, Fang, Feiteng, Feng, Xi, Du, Xinrun, Zhang, Chenhao, Wang, Zekun, Bai, Yuelin, Zhao, Qixuan, Fan, Liyang, Gan, Chengguang, Lin, Hongquan, Li, Jiaming, Ni, Yuansheng, Wu, Haihong, Narsupalli, Yaswanth, Zheng, Zhigang, Li, Chengming, Hu, Xiping, Xu, Ruifeng, Chen, Xiaojun, Yang, Min, Liu, Jiaheng, Liu, Ruibo, Huang, Wenhao, Zhang, Ge, Ni, Shiwen

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

GenAI Arena: An Open Evaluation Platform for Generative Models von Jiang, Dongfu, Ku, Max, Li, Tianle, Ni, Yuansheng, Sun, Shizhuo, Fan, Rongqi, Chen, Wenhu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

A Comprehensive Study of Knowledge Editing for Large Language Models von Zhang, Ningyu, Yao, Yunzhi, Tian, Bozhong, Wang, Peng, Deng, Shumin, Wang, Mengru, Xi, Zekun, Mao, Shengyu, Zhang, Jintian, Ni, Yuansheng, Cheng, Siyuan, Xu, Ziwen, Xu, Xin, Gu, Jia-Chen, Jiang, Yong, Xie, Pengjun, Huang, Fei, Liang, Lei, Zhang, Zhiqiang, Zhu, Xiaowei, Zhou, Jun, Chen, Huajun

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI von Yue, Xiang, Ni, Yuansheng, Zhang, Kai, Zheng, Tianyu, Liu, Ruoqi, Zhang, Ge, Stevens, Samuel, Jiang, Dongfu, Ren, Weiming, Sun, Yuxuan, Wei, Cong, Yu, Botao, Yuan, Ruibin, Sun, Renliang, Yin, Ming, Zheng, Boyuan, Yang, Zhenzhu, Liu, Yibo, Huang, Wenhao, Sun, Huan, Su, Yu, Chen, Wenhu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark von Yue, Xiang, Zheng, Tianyu, Ni, Yuansheng, Wang, Yubo, Zhang, Kai, Tong, Shengbang, Sun, Yuxuan, Yu, Botao, Zhang, Ge, Sun, Huan, Su, Yu, Chen, Wenhu, Neubig, Graham

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

EasyEdit: An Easy-to-use Knowledge Editing Framework for Large Language Models von Wang, Peng, Zhang, Ningyu, Tian, Bozhong, Xi, Zekun, Yao, Yunzhi, Xu, Ziwen, Wang, Mengru, Mao, Shengyu, Wang, Xiaohan, Cheng, Siyuan, Liu, Kangwei, Ni, Yuansheng, Zheng, Guozhou, Chen, Huajun

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

MEGA-Bench: Scaling Multimodal Evaluation to over 500 Real-World Tasks von Chen, Jiacheng, Liang, Tianhao, Sherman, Siu, Wang, Zhengqing, Wang, Kai, Wang, Yubo, Ni, Yuansheng, Wang, Zhu, Jiang, Ziyan, Lyu, Bohan, Jiang, Dongfu, He, Xuan, Liu, Yuan, Hu, Hexiang, Yue, Xiang, Chen, Wenhu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark von Wang, Yubo, Ma, Xueguang, Zhang, Ge, Ni, Yuansheng, Chandra, Abhranil, Guo, Shiguang, Ren, Weiming, Arulraj, Aaran, He, Xuan, Jiang, Ziyan, Li, Tianle, Ku, Max, Wang, Kai, Zhuang, Alex, Fan, Rongqi, Yue, Xiang, Chen, Wenhu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation von He, Xuan, Jiang, Dongfu, Zhang, Ge, Ku, Max, Soni, Achint, Sherman, Siu, Chen, Haonan, Chandra, Abhranil, Jiang, Ziyan, Arulraj, Aaran, Wang, Kai, Quy Duc Do, Ni, Yuansheng, Lyu, Bohan, Narsupalli, Yaswanth, Fan, Rongqi, Lyu, Zhiheng, Lin, Yuchen, Chen, Wenhu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

A Comprehensive Study of Knowledge Editing for Large Language Models von Zhang, Ningyu, Yao, Yunzhi, Tian, Bozhong, Wang, Peng, Deng, Shumin, Wang, Mengru, Xi, Zekun, Mao, Shengyu, Zhang, Jintian, Ni, Yuansheng, Cheng, Siyuan, Xu, Ziwen, Xu, Xin, Jia-Chen, Gu, Jiang, Yong, Xie, Pengjun, Huang, Fei, Liang, Lei, Zhang, Zhiqiang, Zhu, Xiaowei, Zhou, Jun, Chen, Huajun

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

II-Bench: An Image Implication Understanding Benchmark for Multimodal Large Language Models von Liu, Ziqiang, Fang, Feiteng, Feng, Xi, Du, Xinrun, Zhang, Chenhao, Wang, Zekun, Bai, Yuelin, Zhao, Qixuan, Fan, Liyang, Gan, Chengguang, Lin, Hongquan, Li, Jiaming, Ni, Yuansheng, Wu, Haihong, Narsupalli, Yaswanth, Zheng, Zhigang, Li, Chengming, Hu, Xiping, Xu, Ruifeng, Chen, Xiaojun, Yang, Min, Liu, Jiaheng, Liu, Ruibo, Huang, Wenhao, Zhang, Ge, Ni, Shiwen

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI von Yue, Xiang, Ni, Yuansheng, Zhang, Kai, Zheng, Tianyu, Liu, Ruoqi, Zhang, Ge, Stevens, Samuel, Jiang, Dongfu, Ren, Weiming, Sun, Yuxuan, Cong, Wei, Yu, Botao, Yuan, Ruibin, Sun, Renliang, Yin, Ming, Zheng, Boyuan, Yang, Zhenzhu, Liu, Yibo, Huang, Wenhao, Sun, Huan, Su, Yu, Chen, Wenhu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

1
2
3
4
5
6
Nächster
[6]