
-
生物通官微
陪你抓住生命科技
跳动的脉搏
高斯-牛顿时序差分学习与非线性函数逼近
《IEEE Transactions on Neural Networks and Learning Systems》:Gauss–Newton Temporal Difference Learning With Nonlinear Function Approximation
【字体: 大 中 小 】 时间:2026年02月27日 来源:IEEE Transactions on Neural Networks and Learning Systems 8.9
编辑推荐:
提出基于高斯-牛顿迭代的GNTD学习方法,优化非线性Q函数近似,通过目标网络避免双采样,分析不精确步长确保高效计算,推导全局最优收敛性,样本复杂度提升至O(ε^{-1.5}),实验验证优于传统TD方法。
生物通微信公众号