Xize Cheng（成曦泽）

引用次数

	总计	2019 年至今
引用	67	67
h 指数	5	5
i10 指数	1	1

2023202450 17

开放获取的出版物数量

查看全部

2 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Zhou ZhaoZhejiang University在 zju.edu.cn 的电子邮件经过验证
Linjun LiZhejiang University在 zju.edu.cn 的电子邮件经过验证
Wang LinZhejiang University在 zju.edu.cn 的电子邮件经过验证
Rongjie HuangZhejiang University在 zju.edu.cn 的电子邮件经过验证
Ye WangZhejiang University在 zju.edu.cn 的电子邮件经过验证
Zehan WangZhejiang University在 zju.edu.cn 的电子邮件经过验证
Yi Ren (任意)Research Scientist, Tiktok在 bytedance.com 的电子邮件经过验证
Luping Liu (刘路平)Zhejiang University在 zju.edu.cn 的电子邮件经过验证
Huadai LiuZhejiang University在 zju.edu.cn 的电子邮件经过验证

关注

Xize Cheng（成曦泽）

Zhejiang University

在 zju.edu.cn 的电子邮件经过验证 - 首页

Audio-Visual Speech Processing


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Mixspeech: Cross-modality self-learning with audio-visual stream mixup for visual speech translation and recognition X Cheng, T Jin, R Huang, L Li, W Lin, Z Wang, Y Wang, H Liu, A Yin, ... Proceedings of the IEEE/CVF International Conference on Computer Vision …, 2023	12	2023
Connecting multi-modal contrastive representations Z Wang, Y Zhao, H Huang, J Liu, A Yin, L Tang, L Li, Y Wang, Z Zhang, ... Advances in Neural Information Processing Systems 36, 22099-22114, 2023	9	2023
Opensr: Open-modality speech recognition via maintaining multi-modality alignment X Cheng, T Jin, L Li, W Lin, X Duan, Z Zhao arXiv preprint arXiv:2306.06410, 2023	6	2023
Av-transpeech: Audio-visual robust speech-to-speech translation R Huang, H Liu, X Cheng, Y Ren, L Li, Z Ye, J He, L Zhang, J Liu, X Yin, ... arXiv preprint arXiv:2305.15403, 2023	6	2023
Diffusion denoising process for perceptron bias in out-of-distribution detection L Liu, Y Ren, X Cheng, R Huang, C Li, Z Zhao arXiv preprint arXiv:2211.11255, 2022	6	2022
TAVT: Towards Transferable Audio-Visual Text Generation W Lin, T Jin, W Pan, L Li, X Cheng, Y Wang, Z Zhao Proceedings of the 61st Annual Meeting of the Association for Computational …, 2023	5	2023
Distilling coarse-to-fine semantic matching knowledge for weakly supervised 3d visual grounding Z Wang, H Huang, Y Zhao, L Li, X Cheng, Y Zhu, A Yin, Z Zhao Proceedings of the IEEE/CVF International Conference on Computer Vision …, 2023	5	2023
3drp-net: 3d relative position-aware network for 3d visual grounding Z Wang, H Huang, Y Zhao, L Li, X Cheng, Y Zhu, A Yin, Z Zhao arXiv preprint arXiv:2307.13363, 2023	4	2023
Contrastive token-wise meta-learning for unseen performer visual temporal-aligned translation L Li, T Jin, X Cheng, Y Wang, W Lin, R Huang, Z Zhao Findings of the Association for Computational Linguistics: ACL 2023, 10993-11007, 2023	4	2023
Weakly-supervised spoken video grounding via semantic interaction learning Y Wang, W Lin, S Zhang, T Jin, L Li, X Cheng, Z Zhao Proceedings of the 61st Annual Meeting of the Association for Computational …, 2023	3	2023
Semantic-conditioned dual adaptation for cross-domain query-based visual segmentation Y Wang, T Jin, W Lin, X Cheng, L Li, Z Zhao Findings of the Association for Computational Linguistics: ACL 2023, 9797-9815, 2023	2	2023
Wav2sql: Direct generalizable speech-to-sql parsing H Liu, R Huang, J He, G Sun, R Shen, X Cheng, Z Zhao arXiv preprint arXiv:2305.12552, 2023	2	2023
Exploring group video captioning with efficient relational approximation W Lin, T Jin, Y Wang, W Pan, L Li, X Cheng, Z Zhao Proceedings of the IEEE/CVF International Conference on Computer Vision …, 2023	2	2023
Rethinking missing modality learning from a decoding perspective T Jin, X Cheng, L Li, W Lin, Y Wang, Z Zhao Proceedings of the 31st ACM International Conference on Multimedia, 4431-4439, 2023	1	2023
Molecule-Space: Free Lunch in Unified Multimodal Space via Knowledge Fusion Z Wang, Z Zhang, X Cheng, R Huang, L Liu, Z Ye, H Huang, Y Zhao, T Jin, ... arXiv preprint arXiv:2405.04883, 2024		2024
TransFace: Unit-Based Audio-Visual Speech Synthesizer for Talking Head Translation X Cheng, R Huang, L Li, T Jin, Z Wang, A Yin, M Li, X Duan, Z Zhao arXiv preprint arXiv:2312.15197, 2023		2023
Chat-3D v2: Bridging 3D Scene and Large Language Models with Object Identifiers H Huang, Z Wang, R Huang, L Liu, X Cheng, Y Zhao, T Jin, Z Zhao arXiv preprint arXiv:2312.08168, 2023		2023
Out-of-distribution Detection with Diffusion-based Neighborhood L Liu, Y Ren, X Cheng, Z Zhao		2022
NaturalSigner: Diffusion Models are Natural Sign Language Generator A Yin, J Xun, X Cheng, T Jin, S Zhang, Z Zhao, S Tang, F Wu
Listen to Motion: Robustly Learning Correlated Audio-Visual Representations Z Wang, X Cheng, L Tang, L Liu, Y Zhao, T Jin, C Cai, W HongFa, W Liu, ...

系统目前无法执行此操作，请稍后再试。

文章 1–20

每年引用数

重复的引用

合并的引用

添加合著者合著作者

关注

引用次数

合著作者