近日,安徽大学党委常委、副校长孙长银教授团队发布基于统一AI框架的深度强化学习智能决策平台——“玄策”(XuanCe),它支持丰富的单、多智能体决策任务,可使用PyTorch、TensorFlow或MindSpore进行开发,支持CPU、GPU、昇腾AI处理器,具有模块化程度高、可扩展性强、简单灵活等特性,代码已在GitHub开源。
深度强化学习在不同领域取得的技术突破
深度强化学习(Deep Reinforcement Learning,简称DRL)技术在视频游戏、围棋博弈、机器人控制等领域不断取得突破性进展,并且多次被《自然》、《科学》杂志作为封面文章重点报道。深度强化学习已然成为人工智能领域最重要的技术之一,被DeepMind认定为实现通用人工智能(Artificial General Intelligence,AGI)的关键技术。强化学习无需对系统进行精确地建模,只需通过和环境交互收集经验数据,以数据驱动决策模型的学习,就能训练出符合期望的策略。与此同时,深度神经网络强大的函数拟合能力将强化学习的这种优势进一步发挥。正因如此,深度强化学习在解决大规模复杂决策问题上,表现出了巨大的潜力。凭借在强化学习、智能控制与决策等领域的深厚积累,孙长银团队在研制“基于统一AI框架的深度强化学习智能决策平台”上取得重要突破。通过充分调研已有的深度强化学习算法,深入比较各种AI计算框架的相似性和差异性,经过反复迭代更新,最终形成了现在的“玄策”框架。目前,“玄策”已经在GitHub和启智社区开源。
新闻链接:http://www.ahu.edu.cn/2024/0404/c15129a332841/page.htm
网站内容来源于互联网,由网络编辑负责审查,目的在于传递信息,提供专业服务,不代表本网站平台赞同其观点和对其真实性负责。如因内容、版权问题存在异议的,请与我们取得联系,我们将协调给予处理(按照法规支付稿费或删除),联系方式:ahos@vplshi.com 。网站平台将加强监控与审核,一旦发现违反规定的内容,按国家法规处理,处理时间不超过24小时。