Self-Predictive Representation for Autonomous UAV Object-Goal Navigation<br>面向自主无人机目标导向导航的自我预测表征<br>[摘要](abstracts/2604.21130.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

自主无人机凭借其在空中监视、搜索救援、农业和物流等领域的广泛应用,已彻底改变了多个行业。其自主能力带来了独特优势,例如能够在大型开放空间环境中运行。强化学习使无人机能够学习复杂的导航策略,从而自主优化飞行行为。然而,其主要挑战之一是在数据样本利用效率低下,难以获得良好的策略。在目标导向导航场景中,目标识别构成了额外的挑战。大多数无人机相关方法使用相对或绝对坐标从初始位置移动到预定位置,而非直接寻找目标。本研究解决了三维目标导向导航问题中的数据样本效率问题,并将未知目标位置设置形式化为马尔可夫决策过程。实验分析了不同状态表征学习方法与无模型强化学习算法在自主导航系统中规划的交互作用。本研究的主要贡献在于开发了感知模块,其中包含一种名为AmelPred的新型自我预测模型。实验结果表明,其随机版本AmelPredSto在与演员-评论家强化学习算法结合时,是性能最佳的状态表征学习模型。所得结果显示,使用AmelPredSto解决目标导向导航问题时,强化学习算法的效率得到了显著提升。

← Back