Esther Derman

Citée par

	Toutes	Depuis 2019
Citations	224	224
indice h	6	6
indice i10	6	6

2019202020212022202320243 23 30 52 79 37

Accès public

Tout afficher

1 article

0 article

disponibles

non disponibles

Sur la base des exigences liées au financement

Coauteurs

Shie MannorProfessor of Electrical Engineering @ Technion & Researcher @ Nvidia ResearchAdresse e-mail validée de technion.ac.il
Matthieu GeistCohere (ex Google, on leave of Professor, Université de Lorraine)Adresse e-mail validée de univ-lorraine.fr
Timothy A MannMetaAdresse e-mail validée de fb.com
Daniel J. MankowitzGoogle DeepmindAdresse e-mail validée de google.com
Gal DalalSr. Research Scientist, NvidiaAdresse e-mail validée de nvidia.com

Suivre

Esther Derman

Mila - Quebec AI Institute

Adresse e-mail validée de mila.quebec

Artificial Intelligence Reinforcement Learning


Titre Trier par citations Trier par année Trier par titre	Citée par Citée par	Année
Soft-Robust Actor-Critic Policy-Gradient E Derman, DJ Mankowitz, TA Mann, S Mannor AUAI press for Association for Uncertainty in Artificial Intelligence, 208-218, 2018	58	2018
A bayesian approach to robust reinforcement learning E Derman, D Mankowitz, T Mann, S Mannor Uncertainty in Artificial Intelligence, 648-658, 2020	48	2020
Distributional Robustness and Regularization in Reinforcement Learning E Derman, S Mannor ICML Workshop on Theoretical Foundations of Reinforcement Learning, 2020	41	2020
Twice regularized MDPs and the equivalence between robustness and regularization E Derman, M Geist, S Mannor Advances in Neural Information Processing Systems 34, 22274-22287, 2021	35	2021
Acting in Delayed Environments with Non-Stationary Markov Policies E Derman, G Dalal, S Mannor International Conference on Learning Representations (ICLR), 2021	23	2021
Policy Gradient for Rectangular Robust Markov Decision Processes N Kumar, E Derman, M Geist, K Levy, S Mannor Advances in Neural Information Processing Systems 36, 2024	14	2024
Clustering and model selection via penalized likelihood for different-sized categorical data vectors E Derman, EL Pennec arXiv preprint arXiv:1709.02294, 2017	3	2017
Solving non-rectangular reward-robust MDPs via frequency regularization U Gadot, E Derman, N Kumar, MM Elfatihi, K Levy, S Mannor Proceedings of the AAAI Conference on Artificial Intelligence 38 (19), 21090 …, 2024	1	2024
Robustness and Regularization in Reinforcement Learning E Derman, Y Men, M Geist, S Mannor NeurIPS 2023 Workshop on Generalization in Planning, 2023	1*	2023
Targeted Uncertainty Reduction in Robust MDPs U Gadot, K Wang, E Derman, N Kumar, K Levy, S Mannor NeurIPS 2023 Workshop on Generalization in Planning, 2023		2023
Tree Search-Based Policy Optimization under Stochastic Execution Delay D Valensi, E Derman, S Mannor, G Dalal The Twelfth International Conference on Learning Representations, 2023		2023

Le système ne peut pas réaliser cette opération maintenant. Veuillez réessayer plus tard.

Articles 1–11

Nombre de citations par an

Citations en double

Citations fusionnées

Ajouter les coauteursCoauteurs

Suivre

Citée par

Coauteurs