刘全金:男,1971年生,教授,博士,研究方向为机器学习、无线Р deep reinforcement learning[J]. IEEE Transactions onР 通信、图像处理等.Р Vehicular Technology, 2022, 71(3): 3020–3029. doi: 10.1109/Р 吴建岚:女,1997年生,硕士生,研究方向为无线通信,强化学习.Р TVT.2022.3143839.Р 杨 瑞:女,1999年生,硕士生,研究方向为信号与信息处理.Р[25] WATKINS C J C H and DAYAN P. Q-learning[J]. 王 宏:男,1984年生,本科,研究方向为信号与信息处理.Р Machine Learning, 1992, 8(3/4): 279–292. doi: 10.1007/Р BF00992698. 责任编辑: 余 蓉