强化学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

强化学习

强化学习（英语：Reinforcement learning，简称 RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。

关注标签

关注数

3

内容数

508

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

超神经HyperAI · 2023年02月27日

【TVM 学习资料】TensorIR 快速入门

本篇文章译自英文文档 Blitz Course to TensorIR 作者是 Siyuan Feng。更多 TVM 中文文档可访问→TVM 中文站 TensorIR 是深度学习领域的...

0 阅读 1.5k
超神经HyperAI · 2023年02月22日

6 大经典机器学习数据集，3w+ 用户票选得出，建议收藏

内容一览：本期汇总了超神经下载排名众多的 6 个数据集，涵盖图像识别、机器翻译、遥感影像等领域。这些数据集质量高、数据量大，经历人...

2 阅读 1.9k
超神经HyperAI · 2023年02月13日

【TVM 学习资料】用 Schedule 模板和 AutoTVM 优化算子

本教程将展示如何用 TVM 张量表达式（TE）语言编写 schedule 模板，并通过 AutoTVM 对模板进行搜索，从而找到最佳 schedule。这个自动优...

0 阅读 1.8k
超神经HyperAI · 2023年02月08日

【TVM 学习资料】使用 TVMC Python 入门：TVM 的高级 API

作者：Jocelyn Shiue全部 TVM 中文文档访问：全部 TVM 中文文档本节将介绍针对 TVM 初学者设计的脚本工具。开始前如果没有下载示例模型...

1 阅读 1.6k
超神经HyperAI · 2023年02月03日

学术科研无从下手？27 条机器学习避坑指南，让你的论文发表少走弯路

内容一览：如果你刚接触机器学习不久，并且未来希望在该领域开展学术研究，那么这份为你量身打造的「避坑指南」可千万不要错过了。关键...

1 阅读 1.3k
超神经HyperAI · 2023年01月16日

DeepMind 发布强化学习通用算法 DreamerV3，AI 成精自学捡钻石

内容一览：强化学习是多学科领域的交叉产物，其本质是实现自动决策且可做连续决策。本文将介绍 DeepMind 最新研发成果：扩大强化学习应...

1 阅读 1.6k
DataFun · 2022年12月14日

基于知识图谱的多模内容创作技术

导读：由于大数据时代的发展，知识呈指数级增长，而知识图谱技术又在近年来逐步火热，因此诞生了利用知识图谱技术进行智能创作的新想法...

1 阅读 1.5k
V · 2022年12月01日

用强化学习玩《超级马里奥》

Pytorch的一个强化的学习教程（ Train a Mario-playing RL Agent）使用超级玛丽游戏来学习双Q网络(强化学习的一种类型)，官网的文章只有...

0 阅读 1.6k
顶象 · 2022年11月09日

《调研报告》：防范城市消费券黑灰产非一己之力

近日，顶象发布的《城市消费券安全调研报告》（以下简称《调研报告》）中明确提出，自消费券发放之日起，黑灰产便盯上了这块蛋糕。据不...

0 阅读 942
V · 2022年11月09日

使用PyTorch实现简单的AlphaZero的算法（1）：背景和介绍

在本文中，我们将在PyTorch中为Chain Reaction[2]游戏从头开始实现DeepMind的AlphaZero[1]。为了使AlphaZero的学习过程更有效，我们还将...

2 阅读 1.1k
地瓜机器人 · 2022年10月31日

X3 PI 优化版3D模型文件

对于动手能力强的开发者来说，开发机器人的过程中会涉及到机器人结构的设计，所以就会需要X3派的3D模型来辅助机器人结构的设计。

1 阅读 1.3k
申耀的科技观察 · 2022年07月28日

NVIDIA® DGX 系统加速银河水滴步态识别AI模型训练

常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。其中，步态识别技术可以通过人的身体体型和行走姿态来辨识身份，它...

2 阅读 1.6k
申耀的科技观察 · 2022年06月08日

昇腾智行：场景驱动，创新先行，为智慧交通按下“加速键”

众所周知，交通是连接城市的重要纽带，也是为城市发展运送客流、物流的重要通道。作为城市发展的主要动力，交通对生产要素的流动、城镇...

1 阅读 1.2k
DataFun · 2022年05月17日

苗大东：京东基于强化学习的电商搜索排序算法

导读：电商场景的搜索排序算法根据用户搜索请求，经过召回、粗排、精排、重排与混排等模块将最终的结果呈现给用户，算法的优化目标是提...

3 阅读 1.9k
DeepRL · 2022年04月21日

【经验】深度强化学习训练与调参技巧

在此为 RL 社区贡献一点绵薄之力，首先摘录 Stable Baselines3 的 RL Tips and Tricks，其次给出个人心得，最后提供一些其他优秀的资源。

1 阅读 4.3k
DeepRL · 2022年03月17日

网易开源RL4RS，一个强化学习推荐系统工业数据集

近日，由网易伏羲研究团队和伏羲TTG技术团队联合发布的强化学习推荐系统工业数据集RL4RS，正式在Github开源社区开放下载。在之前的2021...

3 阅读 4.5k
DeepRL · 2022年02月17日

《深度强化学习：基础、研究与应用》书籍开源啦，中文简体版免费下载(附链接)

由北京大学前沿计算研究中心助理教授董豪博士等编写的深度强化学习专著《深度强化学习：基础、研究与应用（Deep ReinforcementLearning:...

8 阅读 8.7k
DeepRL · 2022年02月14日

【重磅】Gym发布 8 年后，迎来第一个完整环境文档，强化学习入门更加简单化！

OpenAI Gym是一款用于研发和比较强化学习算法的环境工具包，它支持训练智能体（agent）做任何事——从行走到玩Pong或围棋之类的游戏都在范...

3 阅读 4.4k
DeepRL · 2022年01月18日

自动强化学习综述:AutoRL(Automated Reinforcement Learning)

强化学习 (RL) 与深度学习的结合带来了一系列令人印象深刻的壮举，许多人认为（深度）强化学习提供了通向通用智能体的途径。然而，RL 智...

2 阅读 4.4k
云鹤 · 2022年01月12日

NeurIPS 2021华为诺亚方舟实验室系列研究介绍第一期：强化学习

近年来，强化学习在工业界和学术界受到广泛关注，在理论研究和实际应用方面均取得了瞩目的成就。然而强化学习目前尚存在诸多挑战问题亟...

3 阅读 4.3k

上一页
1
…
14
15
16
17
18
…
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息