罗伯特·博世有限公司申请用于使用模仿学习来训练行为规划器模型专利,提供训练数据训练行为规划器模型

金融界2025年4月19日消息,国家知识产权局信息显示,罗伯特·博世有限公司申请一项名为“用于使用模仿学习来训练行为规划器模型的方法和系统”的专利,公开号CN119849587A,申请日期为2024年10月。

专利摘要显示,本发明涉及一种用于在使用模仿学习的情况下训练行为规划器模型的方法,所述行为规划器模型至少包括:主干网络,用于从输入状态中提取潜在特征;和规划器网络,用于基于潜在特征来预测动作,其中,所述方法具有如下步骤:提供(S1)训练数据,所述训练数据使输入状态与相对应的动作相关联;借助于所述主干网络,从所述训练数据的输入状态中提取(S2)潜在特征;通过对模仿损失函数进行优化并且根据基于所述训练数据和/或所述行为规划器模型的至少一个另外的预测不确定性损失函数,训练和/或调整(S3)所述行为规划器模型。

本文源自:金融界

作者:情报员

0

全部评论 (0)

暂无评论