(1)

Meng, L.; Yazidi, A.; Goodwin, M.; Engelstad, P. Expert Q-learning: Deep Reinforcement Learning with Coarse State Values from Offline Expert Examples. nldl 2022, 3.