[1]

L. Meng, A. Yazidi, M. Goodwin, and P. Engelstad, “Expert Q-learning: Deep Reinforcement Learning with Coarse State Values from Offline Expert Examples”, nldl, vol. 3, Mar. 2022.