Suchergebnisse - Zong, Zhuofan

1

Self-slimmed Vision Transformer von Zong, Zhuofan, Li, Kunchang, Song, Guanglu, Wang, Yali, Qiao, Yu, Leng, Biao, Liu, Yu

Volltext
Buchkapitel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

DETRs with Collaborative Hybrid Assignments Training von Zong, Zhuofan, Song, Guanglu, Liu, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models von Ma, Bingqi, Zong, Zhuofan, Song, Guanglu, Li, Hongsheng, Liu, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object Detection von Zong, Zhuofan, Cao, Qianggang, Leng, Biao

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM von Zong, Zhuofan, Jiang, Dongzhi, Ma, Bingqi, Song, Guanglu, Shao, Hao, Shen, Dazhong, Liu, Yu, Li, Hongsheng

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

MoVA: Adapting Mixture of Vision Experts to Multimodal Context von Zong, Zhuofan, Ma, Bingqi, Shen, Dazhong, Song, Guanglu, Shao, Hao, Jiang, Dongzhi, Li, Hongsheng, Liu, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching von Jiang, Dongzhi, Song, Guanglu, Wu, Xiaoshi, Zhang, Renrui, Shen, Dazhong, Zong, Zhuofan, Liu, Yu, Li, Hongsheng

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Visual CoT: Advancing Multi-Modal Language Models with a Comprehensive Dataset and Benchmark for Chain-of-Thought Reasoning von Shao, Hao, Qian, Shengju, Xiao, Han, Song, Guanglu, Zong, Zhuofan, Wang, Letian, Liu, Yu, Li, Hongsheng

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping von Shao, Hao, Wang, Shulun, Zhou, Yang, Song, Guanglu, He, Dailan, Qin, Shuo, Zong, Zhuofan, Ma, Bingqi, Liu, Yu, Li, Hongsheng

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths von Xue, Zeyue, Song, Guanglu, Guo, Qiushan, Liu, Boxiao, Zong, Zhuofan, Liu, Yu, Luo, Ping

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Temporal Enhanced Training of Multi-view 3D Object Detector via Historical Object Prediction von Zong, Zhuofan, Jiang, Dongzhi, Song, Guanglu, Xue, Zeyue, Su, Jingyong, Li, Hongsheng, Liu, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

DETRs with Collaborative Hybrid Assignments Training von Zong, Zhuofan, Song, Guanglu, Liu, Yu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

Large-batch Optimization for Dense Visual Predictions von Xue, Zeyue, Liang, Jianming, Song, Guanglu, Zong, Zhuofan, Chen, Liang, Liu, Yu, Luo, Ping

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models von Ma, Bingqi, Zong, Zhuofan, Song, Guanglu, Li, Hongsheng, Liu, Yu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

Self-slimmed Vision Transformer von Zong, Zhuofan, Li, Kunchang, Song, Guanglu, Wang, Yali, Qiao, Yu, Leng, Biao, Liu, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM von Zong, Zhuofan, Jiang, Dongzhi, Ma, Bingqi, Song, Guanglu, Shao, Hao, Shen, Dazhong, Liu, Yu, Li, Hongsheng

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching von Jiang, Dongzhi, Song, Guanglu, Wu, Xiaoshi, Zhang, Renrui, Shen, Dazhong, Zong, Zhuofan, Liu, Yu, Li, Hongsheng

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

Visual CoT: Advancing Multi-Modal Language Models with a Comprehensive Dataset and Benchmark for Chain-of-Thought Reasoning von Shao, Hao, Qian, Shengju, Han, Xiao, Song, Guanglu, Zong, Zhuofan, Wang, Letian, Liu, Yu, Li, Hongsheng

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

MoVA: Adapting Mixture of Vision Experts to Multimodal Context von Zong, Zhuofan, Ma, Bingqi, Shen, Dazhong, Song, Guanglu, Shao, Hao, Jiang, Dongzhi, Li, Hongsheng, Liu, Yu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths von Xue, Zeyue, Song, Guanglu, Guo, Qiushan, Liu, Boxiao, Zong, Zhuofan, Liu, Yu, Luo, Ping

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

Self-slimmed Vision Transformer von Zong, Zhuofan, Li, Kunchang, Song, Guanglu, Wang, Yali, Qiao, Yu, Leng, Biao, Liu, Yu

DETRs with Collaborative Hybrid Assignments Training von Zong, Zhuofan, Song, Guanglu, Liu, Yu

Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models von Ma, Bingqi, Zong, Zhuofan, Song, Guanglu, Li, Hongsheng, Liu, Yu

RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object Detection von Zong, Zhuofan, Cao, Qianggang, Leng, Biao

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM von Zong, Zhuofan, Jiang, Dongzhi, Ma, Bingqi, Song, Guanglu, Shao, Hao, Shen, Dazhong, Liu, Yu, Li, Hongsheng

MoVA: Adapting Mixture of Vision Experts to Multimodal Context von Zong, Zhuofan, Ma, Bingqi, Shen, Dazhong, Song, Guanglu, Shao, Hao, Jiang, Dongzhi, Li, Hongsheng, Liu, Yu

CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching von Jiang, Dongzhi, Song, Guanglu, Wu, Xiaoshi, Zhang, Renrui, Shen, Dazhong, Zong, Zhuofan, Liu, Yu, Li, Hongsheng

Visual CoT: Advancing Multi-Modal Language Models with a Comprehensive Dataset and Benchmark for Chain-of-Thought Reasoning von Shao, Hao, Qian, Shengju, Xiao, Han, Song, Guanglu, Zong, Zhuofan, Wang, Letian, Liu, Yu, Li, Hongsheng

VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping von Shao, Hao, Wang, Shulun, Zhou, Yang, Song, Guanglu, He, Dailan, Qin, Shuo, Zong, Zhuofan, Ma, Bingqi, Liu, Yu, Li, Hongsheng

RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths von Xue, Zeyue, Song, Guanglu, Guo, Qiushan, Liu, Boxiao, Zong, Zhuofan, Liu, Yu, Luo, Ping

Temporal Enhanced Training of Multi-view 3D Object Detector via Historical Object Prediction von Zong, Zhuofan, Jiang, Dongzhi, Song, Guanglu, Xue, Zeyue, Su, Jingyong, Li, Hongsheng, Liu, Yu

DETRs with Collaborative Hybrid Assignments Training von Zong, Zhuofan, Song, Guanglu, Liu, Yu

Large-batch Optimization for Dense Visual Predictions von Xue, Zeyue, Liang, Jianming, Song, Guanglu, Zong, Zhuofan, Chen, Liang, Liu, Yu, Luo, Ping

Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models von Ma, Bingqi, Zong, Zhuofan, Song, Guanglu, Li, Hongsheng, Liu, Yu

Self-slimmed Vision Transformer von Zong, Zhuofan, Li, Kunchang, Song, Guanglu, Wang, Yali, Qiao, Yu, Leng, Biao, Liu, Yu

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM von Zong, Zhuofan, Jiang, Dongzhi, Ma, Bingqi, Song, Guanglu, Shao, Hao, Shen, Dazhong, Liu, Yu, Li, Hongsheng

CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching von Jiang, Dongzhi, Song, Guanglu, Wu, Xiaoshi, Zhang, Renrui, Shen, Dazhong, Zong, Zhuofan, Liu, Yu, Li, Hongsheng

Visual CoT: Advancing Multi-Modal Language Models with a Comprehensive Dataset and Benchmark for Chain-of-Thought Reasoning von Shao, Hao, Qian, Shengju, Han, Xiao, Song, Guanglu, Zong, Zhuofan, Wang, Letian, Liu, Yu, Li, Hongsheng

MoVA: Adapting Mixture of Vision Experts to Multimodal Context von Zong, Zhuofan, Ma, Bingqi, Shen, Dazhong, Song, Guanglu, Shao, Hao, Jiang, Dongzhi, Li, Hongsheng, Liu, Yu

RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths von Xue, Zeyue, Song, Guanglu, Guo, Qiushan, Liu, Boxiao, Zong, Zhuofan, Liu, Yu, Luo, Ping

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle