ldg个人博客


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

DRL论文阅读(三)之DQN改进随机采样(Prioritized Experience Replay)

发表于 2019-07-18 | 分类于 论文 , 深度强化学习 | 阅读次数:
字数统计: 2.4k | 阅读时长 ≈ 8
前言 上一篇介绍了Double DQN对DQN的目标Q值优化,这篇将介绍在DDQN的基础上,对经验回放池的优化 一、论文题目 PRIORITIZED EXPERIENCE REPLAY 二、研究目标 在DDQN基础上,改进经验回放池的均匀随机采样算法,使得学习更高效 三、问题定义 DDQN的 ...
阅读全文 »

DRL论文阅读(二)之DQN改进目标Q值计算(Double DQN)

发表于 2019-07-18 | 分类于 论文 , 深度强化学习 | 阅读次数:
字数统计: 1.2k | 阅读时长 ≈ 4
前言 在DDQN之前,基本所有的目标Q值都是通过贪婪法直接得到,无论是Q-learning还是DQN(Nature)。虽然DQN中用了两个Q网络并使用目标Q网络计算Q值,但是在得到a的过程中,还是使用的贪婪法计算得到。 使用max虽然可以让Q值向可能的优化目标靠拢,但是很容易过犹不及,导致过度估计, ...
阅读全文 »

DRL论文阅读(一)之DQN方法

发表于 2019-07-17 | 分类于 论文 , 深度强化学习 | 阅读次数:
字数统计: 1.6k | 阅读时长 ≈ 5
前言 以往的Q-learning算法只适合解决小问题,如果问题太大,则无法分别学习到所有状态下的所有动作值,因此提出了DQN。DQN的本质上仍然是Q-learning,只是利用了神经网络表示动作值函数,并利用了经验回放和单独设立目标网络这两个技巧,但是DQN本身是无法克服Q-learning本身锁固 ...
阅读全文 »

ros自定义msg消息类型及roslaunch启动多节点

发表于 2019-07-13 | 分类于 ROS | 阅读次数:
字数统计: 1.1k | 阅读时长 ≈ 4
前言 有时候需要自己定制一些特定的msg消息类型,而原有的就不一定能满足,这时候就需要自己进行一些相关的设置了 对于自定义的ros节点,也能通过roslaunch启动节点(py程序) rosmsg相关设置默认msg消息类型 官网 如geometry_msgs:msg API 一、创建工作空间 ...
阅读全文 »

初识Airsim(四)之QGC、SITL、户外UE4场景配置

发表于 2019-07-10 | 分类于 Airsim | 阅读次数:
字数统计: 1.6k | 阅读时长 ≈ 6
前言 这篇博客,更多的是记录一下ubuntu下QGC的安装及使用,Airsim的SITL配置以及如何添加UE4的定制场景等。但是在Airsim的HITL配置方面还没有成功过 相关关键词 QGC SITL PX4 一、PX4 SITL配置1.1 设置dialout用户1sudo usermod - ...
阅读全文 »

Windows下sublime相关配置

发表于 2019-07-10 | 分类于 系统 | 阅读次数:
字数统计: 1.7k | 阅读时长 ≈ 6
前言 在windows上下载sublime,一个是为了编辑txt文本文件方便,另一个也能通过Sublime来运行python代码,而不用在cmd窗口或者pycharm上 一、Sublime Text3下载 Sublime Text3 下载,请点击官网 有一段时间,不能通过官网下载,每次一点下载 ...
阅读全文 »

Ubuntu16下GPU Tensorflow安装详细步骤

发表于 2019-07-05 | 分类于 Linux | 阅读次数:
字数统计: 1.1k | 阅读时长 ≈ 4
前言 以往的GPU Tensorflow安装都是在服务器上安装,并且步骤不太详细,这一次,是认为比较详细的一步步的安装方法,有了这个笔记,以后参照这个应该就能很快的安装好Tensorflow了 版本说明 系统:Ubuntu16.04 CUDA版本:cuda10.0 cuDNN版本:cudnn7.4 ...
阅读全文 »

初识Airsim(三)之Ubuntu下Airsim平台搭建

发表于 2019-07-02 | 分类于 Airsim | 阅读次数:
字数统计: 1.1k | 阅读时长 ≈ 4
前言 微软推出的airsim对windows的支持更好,但是也能在Ubuntu下进行安装,由于本人习惯在ubuntu下进行开发,因此,参考了airsim的官方文档和网上的一些文章,在ubuntu下搭建成功 版本说明 Ubuntu16.04 Unreal Engine 4.18 Airsim 1.2 ...
阅读全文 »

(转)双系统之Win重装后linux引导损坏

发表于 2019-07-01 | 分类于 Linux | 阅读次数:
字数统计: 438 | 阅读时长 ≈ 1
前言 由于一些需求,有时需要重装电脑,而本来是双系统的电脑,重装后,Linux的引导修复可能缺失,即在启动的过程中只有windows的界面,而没有win与linux的选择界面,因此,在网上找了几篇博客,几经对比后,还是这一片写的比较好(对我而言),并且已经测试成功 原文网址原文 安装步骤(1)首先 ...
阅读全文 »

ubuntu下科学上网

发表于 2019-06-27 | 分类于 Linux | 阅读次数:
字数统计: 681 | 阅读时长 ≈ 2
前言 其实这一个笔记和前面的笔记(ubuntu16下翻墙搭建)差不多,但是之前的笔记只记载了chrome浏览器下,网页端科学上网的方法,关于终端下如何科学上网,并没有记载,因此这篇笔记,更多的是说明如何在终端上科学上网,当然也能在firefox上,chrome浏览器上还没有测试 一、安装chrom ...
阅读全文 »
<i class="fa fa-angle-left"></i>1…678…10<i class="fa fa-angle-right"></i>

99 日志
22 分类
69 标签
RSS
GitHub E-Mail 微博 知乎
© 2021 ldg
已运行19 天 12 小时 41 分钟 59 秒 本站总访问量37573次 本站访客数29302人次
由 Hexo 强力驱动
|
主题 — NexT.Gemini v5.1.4
0%