强化学习 | 黑龙江码哆科技有限公司

AGILE是一种基于强化学习的LLM Agent框架。AGILE Agent具备拥有长期记忆、使用外

AI 强化学习框架

327 2024-09-30

深度强化学习处理真实世界的自动驾驶

与模拟器相关的主要问题之一在于模拟数据和真实数据之间的差异，这是由于难以在模拟器内真实再现真实世界的

强化学习自动驾驶

322 2023-01-04

该怎么把预训练Transformer范式用到强化学习里？

强化学习训练

347 2022-11-02

本文将简单谈谈基于序列建模的强化学习方法。

强化学习 AI

371 2022-08-26

机器学习的任务与模型是可以组合的，即有非深度 / 深度监督学习、非深度 / 深度强化学习、非深度 /

机器学习深度学习强化学习

327 2022-03-25

用于图优化的端到端、可转移的深度强化学习

在本文中，我们证明了此类框架中的许多优化问题都可以使用精心设计的学习方法有效且最优地解决。

AI 数据强化学习

364 2021-09-26

Menger:大规模分布式强化学习架构

今天，我们要介绍的是Menger——一种具有本地化推理能力的大规模分布式RL架构，可通过多个处理集群(如Borg单元)扩展数千个Actors，从而减少了芯片放置任务的训练时间。

Menger 机器学习强化学习

324 2020-10-15

5种用于Python的强化学习框架

从头开始编写自己的Reinforcement Learning实施可能会花费很多工作，但是您不需要这

Python 强化学习框架

302 2020-06-05

你该知道的深度强化学习相关知识

在本文中，我们通过相关知识和算法的介绍，和您简要地讨论了如何将深度学习和强化学习融合在一起，产生所谓

深度学习强化学习人工智能

305 2020-05-12