Kaiyue Wen

引用次数

	总计	2019 年至今
引用	223	223
h 指数	5	5
i10 指数	5	5

140

105

20222023202413 129 81

合著作者

Xiaozhi WangTsinghua University在 mails.tsinghua.edu.cn 的电子邮件经过验证
Zhiyuan LiuAssociate Professor, Tsinghua University在 tsinghua.edu.cn 的电子邮件经过验证
Tengyu MAStanford University在 stanford.edu 的电子邮件经过验证
Zhiyuan LiAssistant Professor, Toyota Technological Institute at Chicago在 ttic.edu 的电子邮件经过验证
Zhengyan ZhangTsinghua University在 mails.tsinghua.edu.cn 的电子邮件经过验证
Bingbin LiuPhD Student in Machine Learning Department, Carnegie Mellon University在 cs.cmu.edu 的电子邮件经过验证
Andrej RisteskiCarnegie Mellon University在 andrew.cmu.edu 的电子邮件经过验证
Yuchen LiCarnegie Mellon University在 cs.cmu.edu 的电子邮件经过验证
Jiaye TengTsinghua University在 mails.tsinghua.edu.cn 的电子邮件经过验证
Jingzhao ZhangIIIS, Tsinghua University在 mit.edu 的电子邮件经过验证
Tengyao WangAssociate Professor in Statistics at London School of Economics在 lse.ac.uk 的电子邮件经过验证
Eric JiangUndergraduate Student, Tsinghua University在 mails.tsinghua.edu.cn 的电子邮件经过验证
Yilei ChenTsinghua University在 mail.tsinghua.edu.cn 的电子邮件经过验证
Yuhao Wang | 王禹皓Institute for Interdisciplinary Information Sciences, Tsinghua University在 tsinghua.edu.cn 的电子邮件经过验证

关注

Kaiyue Wen

Undergraduate, Tsinghua University

在 mails.tsinghua.edu.cn 的电子邮件经过验证 - 首页

Machine Learning Natural Language Processing


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
On transferability of prompt tuning for natural language processing Y Su, X Wang, Y Qin, CM Chan, Y Lin, H Wang, K Wen, Z Liu, P Li, J Li, ... arXiv preprint arXiv:2111.06719, 2021	93	2021
How Sharpness-Aware Minimization Minimizes Sharpness? K Wen, T Ma, Z Li International Conference on Learning Representations, 0	54*
Finding Skill Neurons in Pre-trained Transformer-based Language Models X Wang, K Wen, Z Zhang, L Hou, Z Liu, J Li arXiv preprint arXiv:2211.07349, 2022	45	2022
Transformers are uninterpretable with myopic methods: a case study with bounded Dyck grammars K Wen, Y Li, B Liu, A Risteski Advances in Neural Information Processing Systems 36, 2024	11*	2024
Sharpness minimization algorithms do not only minimize sharpness to achieve better generalization K Wen, Z Li, T Ma Advances in Neural Information Processing Systems 36, 2024	10	2024
Benign overfitting in classification: Provably counter label noise with larger models K Wen, J Teng, J Zhang arXiv preprint arXiv:2206.00501, 2022	5*	2022
Residual permutation test for high-dimensional regression coefficient testing K Wen, T Wang, Y Wang arXiv preprint arXiv:2211.16182, 2022	4	2022
RNNs are not Transformers (Yet): The Key Bottleneck on In-context Retrieval K Wen, X Dang, K Lyu arXiv preprint arXiv:2402.18510, 2024	1	2024
Practically Solving LPN in High Noise Regimes Faster Using Neural Networks H Jiang, K Wen, Y Chen arXiv preprint arXiv:2303.07987, 2023		2023

系统目前无法执行此操作，请稍后再试。

文章 1–9

每年引用数

重复的引用

合并的引用

添加合著者合著作者

关注

引用次数

合著作者