强化学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

强化学习

强化学习（英语：Reinforcement learning，简称 RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。

关注标签

关注数

3

内容数

508

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

AI学习者 · 2021年07月06日

如何更好地调整学习率

【GiantPandaCV导读】learning rate对模型调优重要性不言而喻，想到超参数调优第一个可能想到的方法就是网格搜索Grid Search，但是这种...

3 阅读 2.3k
汝墨安然 · 2021年06月22日

UWB室内人员定位结构与主要功能

UWB室内人员定位系统是物联网的基础服务之一，根据应用场景不同，可以促进企业的运营和营销能力的提升，或者给消费者提供更快更好的体...

1 阅读 1.4k
DeepRL · 2021年06月18日

强化学习 | 基于Novelty-Pursuit的高效探索方法

基于采样的学习机制，即在环境中交互试错，是强化学习和传统的监督学习的一大区别。监督学习中，我们的数据集与每一个数据的标签，都是...

1 阅读 3.3k
申耀的科技观察 · 2021年06月15日

打造智能决策“新引擎”，杉数科技勇闯“无人区”

毫无疑问，在中国科技的产业发展中，底层基础软件一直是一大“短板”，特别在求解器软件领域，不仅技术门槛较高、相关人才也极为稀少，同...

4 阅读 2.7k
旷视研究院 · 2021年06月15日

旷厂练习生Vol.6 I CVPR网红作者，超高产paper收割机

首发：旷视研究院作者：旷妹&丁同学姓名：丁同学所属：旷视研究院 Basemodel组实习生背景：清华大学软件学院 94年在读PhD两年旷厂炼丹生...

1 阅读 2k
硬件发烧友 · 2021年04月19日

「前端初学者、硬件爱好者、编程自学者」微信小程序开发很简单

截止到 2020 年，微信小程序 DAU（日活跃用户数）超过 4 亿。对于功能简单或者用户需要经常变动的物联网智能产品，专有 App 反而降低产...

5 阅读 1.7k
InfoQ · 2021年04月04日

图灵奖得主 Yann LeCun 最新文章：自监督学习，人工智能世界的“暗物质”

自监督学习让 AI 系统能够从很少的数据中学习知识，这样才能识别和理解世界上更微妙、更不常见的表示形式。

27 阅读 2.4k
DeepRL · 2021年03月16日

【重磅推荐】哥大开源“FinRL”: 一个用于量化金融自动交易的深度强化学习库

目前，深度强化学习（DRL）技术在游戏等领域已经取得了巨大的成功，同时在量化投资中的也取得了突破性进展，为了训练一个实用的DRL 交易...

2 阅读 6.6k
超神经HyperAI · 2021年03月11日

两会闭幕：科技圈大佬提出这些 AI 提案

内容提要：3 月 10 日和 11 日，两会相继闭幕。近年来，「人工智能」成为两会上必不可少的话题。今年两会，又有哪些关于人工智能的提案？

40 阅读 1.9k
DeepRL · 2021年03月09日

【最新重磅整理】82篇AAAI2021强化学习领域论文接收列表

416: Robust Reinforcement Learning: A Case Study in Linear Quadratic Regulation

3 阅读 3.4k
超神经HyperAI · 2021年02月26日

西北大学发布猴脸识别论文，公开 10 种动物面部数据集

内容提要：在人脸识别日趋成熟的今天，研究人员已经开始将这一技术扩展到动物研究中。最近，西北大学研究团队提出的「猴脸识别技术」，...

5 阅读 2.3k
Jack-Cui · 2021年02月26日

用AI玩55款经典游戏是什么体验？

DreamerV2 agent（智能体）可以在 Atari（雅达利）的 55 款经典游戏中挑战人类玩家。

6 阅读 3.2k
超神经HyperAI · 2021年02月23日

遥感资源大放送（上）：用开源代码，训练土地分类模型

内容概要：土地分类是遥感影像的重要应用场景之一，本文介绍了土地分类的几个常用方法，并利用开源语义分割代码，打造了一个土地分类模型。

3 阅读 2.7k
硬件发烧友 · 2021年02月19日

「绝对干货」芯片、半导体、集成电路的特点与区别

芯片，又称微电路、微芯片、集成电路（integrated circuit， IC），是指内含集成电路的硅片，体积很小，常常是计算机或其他电子设备的一...

5 阅读 2.2k
DeepRL · 2021年02月18日

【DeepMind】首发并开源Alchemy，一种元强化学习(meta-RL)基准环境。

元学习作为一种增加强化学习的灵活性和样本效率的方法，科研学者对此的关注兴趣迅速增长。然而，该研究领域中的一个问题是缺乏足够的基...

1 阅读 3k
DeepRL · 2021年01月25日

【干货】全面总结(值函数与优势函数)的估计方法

报道：深度强化学习实验室作者: 高新根博士(DeepRL-Lab研究员)编辑: DeepRL本文章读者能简单理解如下几个问题：简单分析了这些方法偏差...

1 阅读 5.6k
DeepRL · 2021年01月15日

如何提高"强化学习算法模型"的泛化能力?

在深度学习中，模型很容易过拟合到参与训练的数据集。因此，深度学习训练模型的时候通常会将数据集分成训练集和测试集，保证训练的模型...

3 阅读 6.6k
DeepRL · 2021年01月08日

iDLab实验室打造Reinforcement Learning and Control课程及讲义

The Intelligent Driving Laboratory (iDLAB) is a part of the School of Vehicle and Mobility (SVM) at Tsinghua University. This l...

3 阅读 3.9k
DeepRL · 2020年12月16日

【论文复现】一步步详解用TD3算法通关BipedalWalkerHardcore-v2环境

熟悉强化学习Gym环境的小伙伴应该对 (BWH-v2环境) BipedalWalkerHardcore-v2（如图1）并不陌生。在这个环境里，这个Agent需要与Environ...

1 阅读 4.6k
前沿科技探索家 · 2020年12月02日

《麻省理工科技评论》千字长文点赞百度飞桨：推动产业智能化大爆发

人工智能正在赋能各个产业，推动产业转型升级。作为国内 AI 领域的头雁，百度飞桨在这方面的一系列成果引发外媒关注。6月23日，全球顶级...

2 阅读 1.4k

上一页
1
…
16
17
18
19
20
…
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息