Suchergebnisse - Ji Shengpeng

1

Generating Neural Networks for Diverse Networking Classification Tasks via Hardware-Aware Neural Architecture Search von Xie, Guorui, Li, Qing, Shi, Zhenning, Fang, Hanbin, Ji, Shengpeng, Jiang, Yong, Yuan, Zhenhui, Ma, Lianbo, Xu, Mingwei

Veröffentlicht in IEEE transactions on computers

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

MobileSpeech: A Fast and High-Fidelity Framework for Mobile Zero-Shot Text-to-Speech von Ji, Shengpeng, Jiang, Ziyue, Wang, Hanting, Zuo, Jialong, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

LLaVA-MR: Large Language-and-Vision Assistant for Video Moment Retrieval von Lu, Weiheng, Li, Jian, Yu, An, Chang, Ming-Ching, Ji, Shengpeng, Xia, Min

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

MuVi: Video-to-Music Generation with Semantic Alignment and Rhythmic Synchronization von Li, Ruiqi, Zheng, Siqi, Cheng, Xize, Zhang, Ziang, Ji, Shengpeng, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Unlocking the Potential of Multimodal Unified Discrete Representation through Training-Free Codebook Optimization and Hierarchical Alignment von Huang, Hai, Xia, Yan, Ji, Shengpeng, Wang, Shulei, Wang, Hanting, Zhu, Jieming, Dong, Zhenhua, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

Language-Codec: Reducing the Gaps Between Discrete Codec Representation and Speech Language Models von Ji, Shengpeng, Fang, Minghui, Jiang, Ziyue, Zheng, Siqi, Chen, Qian, Huang, Rongjie, Zuo, Jialung, Wang, Shulei, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

OmniSep: Unified Omni-Modality Sound Separation with Query-Mixup von Cheng, Xize, Zheng, Siqi, Wang, Zehan, Fang, Minghui, Zhang, Ziang, Huang, Rongjie, Ma, Ziyang, Ji, Shengpeng, Zuo, Jialong, Jin, Tao, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

TextrolSpeech: A Text Style Control Speech Corpus With Codec Language Text-to-Speech Models von Ji, Shengpeng, Zuo, Jialong, Fang, Minghui, Jiang, Ziyue, Chen, Feiyang, Duan, Xinyu, Baoxing Huai, Zhou, Zhao

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling von Fang, Minghui, Ji, Shengpeng, Zuo, Jialong, Huang, Hai, Xia, Yan, Zhu, Jieming, Cheng, Xize, Yang, Xiaoda, Liu, Wenrui, Wang, Gang, Dong, Zhenhua, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

ControlSpeech: Towards Simultaneous Zero-shot Speaker Cloning and Zero-shot Language Style Control With Decoupled Codec von Ji, Shengpeng, Zuo, Jialong, Wang, Wen, Fang, Minghui, Zheng, Siqi, Chen, Qian, Jiang, Ziyue, Huang, Hai, Wang, Zehan, Cheng, Xize, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

WavChat: A Survey of Spoken Dialogue Models von Ji, Shengpeng, Chen, Yifu, Fang, Minghui, Zuo, Jialong, Lu, Jingyu, Wang, Hanting, Jiang, Ziyue, Zhou, Long, Liu, Shujie, Cheng, Xize, Yang, Xiaoda, Wang, Zehan, Yang, Qian, Li, Jian, Jiang, Yidi, He, Jingzhen, Chu, Yunfei, Xu, Jin, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

MobileSpeech: A Fast and High-Fidelity Framework for Mobile Zero-Shot Text-to-Speech von Ji, Shengpeng, Jiang, Ziyue, Wang, Hanting, Zuo, Jialong, Zhou, Zhao

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling von Ji, Shengpeng, Jiang, Ziyue, Wang, Wen, Chen, Yifu, Fang, Minghui, Zuo, Jialong, Yang, Qian, Cheng, Xize, Wang, Zehan, Li, Ruiqi, Zhang, Ziang, Yang, Xiaoda, Huang, Rongjie, Jiang, Yidi, Chen, Qian, Zheng, Siqi, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

Mega-TTS 2: Boosting Prompting Mechanisms for Zero-Shot Speech Synthesis von Jiang, Ziyue, Liu, Jinglin, Ren, Yi, He, Jinzheng, Ye, Zhenhui, Ji, Shengpeng, Yang, Qian, Zhang, Chen, Wei, Pengfei, Wang, Chunfeng, Yin, Xiang, Ma, Zejun, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

Mega-TTS: Zero-Shot Text-to-Speech at Scale with Intrinsic Inductive Bias von Jiang, Ziyue, Ren, Yi, Ye, Zhenhui, Liu, Jinglin, Zhang, Chen, Yang, Qian, Ji, Shengpeng, Huang, Rongjie, Wang, Chunfeng, Yin, Xiang, Ma, Zejun, Zhao, Zhou

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs von An, Keyu, Chen, Qian, Deng, Chong, Du, Zhihao, Gao, Changfeng, Gao, Zhifu, Gu, Yue, He, Ting, Hu, Hangrui, Hu, Kai, Ji, Shengpeng, Li, Yabin, Li, Zerui, Lu, Heng, Luo, Haoneng, Lv, Xiang, Ma, Bin, Ma, Ziyang, Ni, Chongjia, Song, Changhe, Shi, Jiaqi, Shi, Xian, Wang, Hao, Wang, Wen, Wang, Yuxuan, Xiao, Zhangyu, Yan, Zhijie, Yang, Yexin, Zhang, Bin, Zhang, Qinglin, Zhang, Shiliang, Zhao, Nan, Zheng, Siqi

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

LLaVA-MR: Large Language-and-Vision Assistant for Video Moment Retrieval von Lu, Weiheng, Li, Jian, Yu, An, Ming-Ching, Chang, Ji, Shengpeng, Xia, Min

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

MuVi: Video-to-Music Generation with Semantic Alignment and Rhythmic Synchronization von Li, Ruiqi, Zheng, Siqi, Cheng, Xize, Zhang, Ziang, Ji, Shengpeng, Zhou, Zhao

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Unlocking the Potential of Multimodal Unified Discrete Representation through Training-Free Codebook Optimization and Hierarchical Alignment von Huang, Hai, Xia, Yan, Ji, Shengpeng, Wang, Shulei, Wang, Hanting, Zhu, Jieming, Dong, Zhenhua, Zhou, Zhao

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Language-Codec: Reducing the Gaps Between Discrete Codec Representation and Speech Language Models von Ji, Shengpeng, Fang, Minghui, Jiang, Ziyue, Zheng, Siqi, Chen, Qian, Huang, Rongjie, Zuo, Jialung, Wang, Shulei, Zhou, Zhao

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

Generating Neural Networks for Diverse Networking Classification Tasks via Hardware-Aware Neural Architecture Search von Xie, Guorui, Li, Qing, Shi, Zhenning, Fang, Hanbin, Ji, Shengpeng, Jiang, Yong, Yuan, Zhenhui, Ma, Lianbo, Xu, Mingwei

MobileSpeech: A Fast and High-Fidelity Framework for Mobile Zero-Shot Text-to-Speech von Ji, Shengpeng, Jiang, Ziyue, Wang, Hanting, Zuo, Jialong, Zhao, Zhou

LLaVA-MR: Large Language-and-Vision Assistant for Video Moment Retrieval von Lu, Weiheng, Li, Jian, Yu, An, Chang, Ming-Ching, Ji, Shengpeng, Xia, Min

MuVi: Video-to-Music Generation with Semantic Alignment and Rhythmic Synchronization von Li, Ruiqi, Zheng, Siqi, Cheng, Xize, Zhang, Ziang, Ji, Shengpeng, Zhao, Zhou

Unlocking the Potential of Multimodal Unified Discrete Representation through Training-Free Codebook Optimization and Hierarchical Alignment von Huang, Hai, Xia, Yan, Ji, Shengpeng, Wang, Shulei, Wang, Hanting, Zhu, Jieming, Dong, Zhenhua, Zhao, Zhou

Language-Codec: Reducing the Gaps Between Discrete Codec Representation and Speech Language Models von Ji, Shengpeng, Fang, Minghui, Jiang, Ziyue, Zheng, Siqi, Chen, Qian, Huang, Rongjie, Zuo, Jialung, Wang, Shulei, Zhao, Zhou

OmniSep: Unified Omni-Modality Sound Separation with Query-Mixup von Cheng, Xize, Zheng, Siqi, Wang, Zehan, Fang, Minghui, Zhang, Ziang, Huang, Rongjie, Ma, Ziyang, Ji, Shengpeng, Zuo, Jialong, Jin, Tao, Zhao, Zhou

TextrolSpeech: A Text Style Control Speech Corpus With Codec Language Text-to-Speech Models von Ji, Shengpeng, Zuo, Jialong, Fang, Minghui, Jiang, Ziyue, Chen, Feiyang, Duan, Xinyu, Baoxing Huai, Zhou, Zhao

ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling von Fang, Minghui, Ji, Shengpeng, Zuo, Jialong, Huang, Hai, Xia, Yan, Zhu, Jieming, Cheng, Xize, Yang, Xiaoda, Liu, Wenrui, Wang, Gang, Dong, Zhenhua, Zhao, Zhou

ControlSpeech: Towards Simultaneous Zero-shot Speaker Cloning and Zero-shot Language Style Control With Decoupled Codec von Ji, Shengpeng, Zuo, Jialong, Wang, Wen, Fang, Minghui, Zheng, Siqi, Chen, Qian, Jiang, Ziyue, Huang, Hai, Wang, Zehan, Cheng, Xize, Zhao, Zhou

WavChat: A Survey of Spoken Dialogue Models von Ji, Shengpeng, Chen, Yifu, Fang, Minghui, Zuo, Jialong, Lu, Jingyu, Wang, Hanting, Jiang, Ziyue, Zhou, Long, Liu, Shujie, Cheng, Xize, Yang, Xiaoda, Wang, Zehan, Yang, Qian, Li, Jian, Jiang, Yidi, He, Jingzhen, Chu, Yunfei, Xu, Jin, Zhao, Zhou

MobileSpeech: A Fast and High-Fidelity Framework for Mobile Zero-Shot Text-to-Speech von Ji, Shengpeng, Jiang, Ziyue, Wang, Hanting, Zuo, Jialong, Zhou, Zhao

Mega-TTS 2: Boosting Prompting Mechanisms for Zero-Shot Speech Synthesis von Jiang, Ziyue, Liu, Jinglin, Ren, Yi, He, Jinzheng, Ye, Zhenhui, Ji, Shengpeng, Yang, Qian, Zhang, Chen, Wei, Pengfei, Wang, Chunfeng, Yin, Xiang, Ma, Zejun, Zhao, Zhou

Mega-TTS: Zero-Shot Text-to-Speech at Scale with Intrinsic Inductive Bias von Jiang, Ziyue, Ren, Yi, Ye, Zhenhui, Liu, Jinglin, Zhang, Chen, Yang, Qian, Ji, Shengpeng, Huang, Rongjie, Wang, Chunfeng, Yin, Xiang, Ma, Zejun, Zhao, Zhou

LLaVA-MR: Large Language-and-Vision Assistant for Video Moment Retrieval von Lu, Weiheng, Li, Jian, Yu, An, Ming-Ching, Chang, Ji, Shengpeng, Xia, Min

MuVi: Video-to-Music Generation with Semantic Alignment and Rhythmic Synchronization von Li, Ruiqi, Zheng, Siqi, Cheng, Xize, Zhang, Ziang, Ji, Shengpeng, Zhou, Zhao

Unlocking the Potential of Multimodal Unified Discrete Representation through Training-Free Codebook Optimization and Hierarchical Alignment von Huang, Hai, Xia, Yan, Ji, Shengpeng, Wang, Shulei, Wang, Hanting, Zhu, Jieming, Dong, Zhenhua, Zhou, Zhao

Language-Codec: Reducing the Gaps Between Discrete Codec Representation and Speech Language Models von Ji, Shengpeng, Fang, Minghui, Jiang, Ziyue, Zheng, Siqi, Chen, Qian, Huang, Rongjie, Zuo, Jialung, Wang, Shulei, Zhou, Zhao

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle