强化学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

强化学习

强化学习（英语：Reinforcement learning，简称 RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。

关注标签

关注数

3

内容数

508

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

DeepRL · 2020年06月01日

强化学习的三种范例

许多研究人员认为，基于模型的强化学习（MBRL）比无模型的强化学习（MFRL）具有更高的样本效率。但是，从根本上讲，这种说法是错误的。...

2 阅读 2.3k
DeepRL · 2020年05月28日

基于强化学习的自动交易系统研究与发展综述

近年来，强化学习在电子游戏、棋类、决策控制领域取得了巨大进展，也带动着金融交易系统的迅速发展，金融交易问题已经成为强化学习领域...

3 阅读 3.2k
DeepRL · 2020年05月14日

前沿技术 || UC Berkeley开源RAD来改进强化学习算法

【导读】从视觉观察中学习是强化学习（RL）中的一个基本但具有挑战性的问题。尽管算法与卷积神经网络相结合已被证明是成功的秘诀，但当...

4 阅读 2.8k
腾讯技术工程 · 2020年05月14日

腾讯Elasticsearch海量规模背后的内核优化剖析

来源：腾讯技术工程微信号作者：黄华，腾讯 TEG 云架构平台部研发工程Elasticsearch 在腾讯内部广泛应用于日志实时分析、结构化数据分...

1 阅读 2.7k
腾讯技术工程 · 2020年05月09日

2 周流量激增百倍的腾讯课堂后台扩容和性能优化实战

来源：腾讯技术工程微信号作者：andyawang，腾讯 CSIG 后台开发工程师疫情期间，学校网课需求激增，腾讯课堂 2 天上线极速版，2 周内支...

1 阅读 2.2k
InfoQ · 2020年05月09日

AGI=终结者天网？别怕，现在的AI连猫狗都可能认错

原文最初发布在 SICARA 博客，经原作者 Etienne Bennequin 授权，InfoQ 中文站翻译并分享。

3 阅读 2.9k
一路奔跑 · 2020年04月24日

快速配置xdebug+phpstrom实现断点调试

简单说一下断点调试的使用场景当业务代码很复杂，想要知道每一步的变量及对应的值。学习一个新框架，熟悉框架的执行流程不确定代码会运...

0 阅读 2.2k
深度学习与先进智能决策 · 2020年04月15日

【NIPS 2017】基于深度强化学习的想象力增强智能体

论文题目：Imagination-Augmented Agents for Deep Reinforcement Learning

2 阅读 2.5k
深度学习与先进智能决策 · 2020年04月15日

伯克利，斯坦福，宾大联合发表：从观察和交互中学习预测模型

论文题目：Learning Predictive Models From Observation and Interaction

2 阅读 2.2k
深度学习与先进智能决策 · 2020年04月15日

【ICLR 2018】模型集成的TRPO算法【附代码】

论文题目：model-ensemble trust-region policy optimization

0 阅读 2.4k
深度学习与先进智能决策 · 2020年04月15日

【CoRL 2018】通过元策略优化的MBRL算法

论文题目：Model-Based Reinforcement Learning via Meta-Policy Optimization

0 阅读 2.3k
深度学习与先进智能决策 · 2020年04月15日

【NIPS 2018】循环World模型促进策略演变

论文题目：Recurrent World Models Facilitate Policy Evolution

3 阅读 2.7k
深度学习与先进智能决策 · 2020年04月15日

【ICLR2020】基于模型的强化学习算法玩Atari【附代码】

model-free的强化学习算法已经在Atari游戏上取得了巨大成功，但是与人类选手相比，model-free的强化学习算法需要的交互数据...

1 阅读 2.6k
脑极体 · 2020年03月30日

当AI开始“踢脏球”，你还敢信任强化学习吗？

足球机器人排成一排向球门发起射击，但守门员却并没有准备防守，而是一屁股倒在地上开始胡乱摆动起了双腿。然后，前锋跳了一段十分令人...

6 阅读 2.1k
矩池云 · 2020年03月27日

矩池云 | 使用LightGBM来预测分子属性

今天给大家介绍提升方法(Boosting), 提升算法是一种可以用来减小监督式学习中偏差的机器学习算法。

3 阅读 2.1k
DeepRL · 2020年03月25日

顶会论文 || 65篇"IJCAI"深度强化学习论文汇总

A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer: Fuli Luo, Peng Li, Jie Zhou, Pengcheng Yang, Baob...

1 阅读 2.6k
ronghuaiyang · 2020年03月25日

图解自监督学习，人工智能蛋糕中最大的一块

如果人工智能是一块蛋糕，那么蛋糕的大部分是自监督学习，蛋糕上的糖衣是监督学习，蛋糕上的樱桃是强化学习。作者：Amit Chaudhary编译...

4 阅读 3k
DeepRL · 2020年03月25日

《十个关键点》PPT汇总|| 强化学习和最优控制的81页

本文作者来自于宾夕法尼亚州立大学，总结了《十个关键点》，强化学习和最优控制的81页PPT汇总。来源：book.yunzhan365报道：深度强化学...

1 阅读 2.2k
深度学习与先进智能决策 · 2020年03月25日

【Science】颠覆三观的超强聚类算法

这篇文章是自己在上大数据分析课程时老师推荐的一篇文章，当时自己听着也是对原作者当年的的思路新奇非常敬佩，相信很多伙...

1 阅读 3.5k
深度学习与先进智能决策 · 2020年03月25日

【NeurIPS 2019】最大熵的蒙特卡洛规划算法

将其扩展到MCTS上，得到了 Maximum Entropy for Tree Search (MENTS)算法。

1 阅读 2.7k

上一页
1
…
18
19
20
21
22
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息