厦门渊亭申请复杂场景的机器人智能体强化学习训练专利,提高智能体在复杂场景中的性能表现和泛化能力
金融界2024年12月18日消息,国家知识产权局信息显示,厦门渊亭信息科技有限公司申请一项名为“复杂场景的机器人智能体强化学习训练方法及系统”的专利,公开号CN 119129642 A,申请日期为2024年11月。
专利摘要显示,本发明公开了一种复杂场景的机器人智能体强化学习训练方法,其通过构建包含障碍物、动态目标以及环境约束等复杂场景、适用于多智能体系统的强化学习算法环境、状态转移模型,并采用强化学习算法构建为每个机器人智能体构建独立的神经网络;将智能体的给定状态、时序信息、历史状态信息的向量作为所述状态转移模型的输入,输出预测状态的状态转移概率和奖励信息;所述神经网络输出的动作策略和动作价值通过所述状态转移模型中执行并产生新的预测状态和奖励信息;通过调整神经网络的超参数,利用大规模分布式训练架构对所述决策网络和所述评估网络进行协作训练,实现多智能体的并行学习和协同决策,提高智能体在复杂场景中的性能表现和泛化能力。
本文源自:金融界
作者:情报员