‪Dong Li‬ - ‪Google Scholar‬

Get my own profile

Cited by

	All	Since 2019
Citations	95	95
h-index	5	5
i10-index	4	4

0

70

35

2022202320244 25 66

Public access

1 article

0 articles

available

not available

Based on funding mandates

Dong Li

Dong Li

Shanghai AI Lab

Verified email at pjlab.org.cn - Homepage

Multimodal Efficient Transformer LLM


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Toeplitz neural network for sequence modeling Z Qin, X Han, W Sun, B He, D Li, D Li, Y Dai The Eleventh International Conference on Learning Representations 8, 2023	22	2023
Scaling TransNormer to 175 Billion Parameters Z Qin, D Li, W Sun, W Sun, X Shen, X Han, Y Wei, B Lv, F Yuan, X Luo, ... arXiv preprint arXiv:2307.14995, 2023	16	2023
Neural Architecture Search on Efficient Transformers and Beyond Z Liu, D Li, K Lu*, Z Qin, W Sun, J Xu, Y Zhong arXiv preprint arXiv:2207.13955, 2022	15	2022
HGRN2: Gated Linear RNNs with State Expansion Z Qin, S Yang, W Sun, X Shen, D Li, W Sun, Y Zhong arXiv preprint arXiv:2404.07904, 2024	13	2024
Fine-grained Audible Video Description X Shen, D Li, J Zhou*, Z Qin, B He, X Han, A Li, Y Dai, L Kong, M Wang, ... CVPR 2023, 2023	9	2023
Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths in Large Language Models Z Qin, W Sun, D Li, X Shen, W Sun, Y Zhong arXiv preprint arXiv:2401.04658, 2024	4	2024
Linear Video Transformer with Feature Fixation K Lu, Z Liu, J Wang, W Sun, Z Qin, D Li, X Shen, H Deng, X Han, Y Dai, ... arXiv preprint arXiv:2210.08164, 2022	4	2022
TransNormerLLM: A Faster and Better Large Language Model with Improved TransNormer Z Qin, D Li, W Sun, W Sun, X Shen, X Han, Y Wei, B Lv, X Luo, Y Qiao, ...	3	2023
Unlocking the Secrets of Linear Complexity Sequence Model from A Unified Perspective Z Qin, X Shen, W Sun, D Li, S Birchfield, R Hartley, Y Zhong arXiv preprint arXiv:2405.17383, 2024	2	2024
CO2: Efficient Distributed Training with Full Communication-Computation Overlap W Sun, Z Qin, W Sun, S Li, D Li, X Shen, Y Qiao, Y Zhong arXiv preprint arXiv:2401.16265, 2024	2	2024
You Only Scan Once: Efficient Multi-dimension Sequential Modeling with LightNet Z Qin, Y Mao, X Shen, D Li, J Zhang, Y Dai, Y Zhong arXiv preprint arXiv:2405.21022, 2024	1	2024
Various Lengths, Constant Speed: Efficient Language Modeling with Lightning Attention Z Qin, W Sun, D Li, X Shen, W Sun, Y Zhong arXiv preprint arXiv:2405.17381, 2024	1	2024
Linear Attention Sequence Parallelism W Sun, Z Qin, D Li, X Shen, Y Qiao, Y Zhong arXiv preprint arXiv:2404.02882, 2024	1	2024
MAP: Low-data Regime Multimodal Learning with Adapter-based Pre-training and Prompting W Li, D Li, W Li, Y Wang, H Jie, Y Zhong Proceedings of the 2023 CLASP Conference on Learning with Small Data (LSD …, 2023	1	2023
Steganographic Capacity of Deep Learning Models L Zhang, D Li, O Jurečková, M Stamp arXiv preprint arXiv:2306.17189, 2023	1	2023
Scaling Laws for Linear Complexity Language Models X Shen, D Li, R Leng, Z Qin, W Sun, Y Zhong arXiv preprint arXiv:2406.16690, 2024		2024

The system can't perform the operation now. Try again later.

Articles 1–16