DRL论文阅读（三）之DQN改进随机采样（Prioritized Experience Replay）

发表于 2019-07-18 | 分类于论文，深度强化学习 | 阅读次数:

字数统计: 2.4k | 阅读时长 ≈ 8

前言上一篇介绍了Double DQN对DQN的目标Q值优化，这篇将介绍在DDQN的基础上，对经验回放池的优化一、论文题目 PRIORITIZED EXPERIENCE REPLAY 二、研究目标在DDQN基础上，改进经验回放池的均匀随机采样算法，使得学习更高效三、问题定义 DDQN的 ...

阅读全文 »

DRL论文阅读（二）之DQN改进目标Q值计算（Double DQN）

发表于 2019-07-18 | 分类于论文，深度强化学习 | 阅读次数:

字数统计: 1.2k | 阅读时长 ≈ 4

前言在DDQN之前，基本所有的目标Q值都是通过贪婪法直接得到，无论是Q-learning还是DQN（Nature）。虽然DQN中用了两个Q网络并使用目标Q网络计算Q值，但是在得到a的过程中，还是使用的贪婪法计算得到。使用max虽然可以让Q值向可能的优化目标靠拢，但是很容易过犹不及，导致过度估计， ...

阅读全文 »

DRL论文阅读（一）之DQN方法

发表于 2019-07-17 | 分类于论文，深度强化学习 | 阅读次数:

字数统计: 1.6k | 阅读时长 ≈ 5

前言以往的Q-learning算法只适合解决小问题，如果问题太大，则无法分别学习到所有状态下的所有动作值，因此提出了DQN。DQN的本质上仍然是Q-learning，只是利用了神经网络表示动作值函数，并利用了经验回放和单独设立目标网络这两个技巧，但是DQN本身是无法克服Q-learning本身锁固 ...

阅读全文 »

ros自定义msg消息类型及roslaunch启动多节点

发表于 2019-07-13 | 分类于 ROS | 阅读次数:

字数统计: 1.1k | 阅读时长 ≈ 4

前言有时候需要自己定制一些特定的msg消息类型，而原有的就不一定能满足，这时候就需要自己进行一些相关的设置了对于自定义的ros节点，也能通过roslaunch启动节点（py程序） rosmsg相关设置默认msg消息类型官网如geometry_msgs：msg API 一、创建工作空间 ...

阅读全文 »

初识Airsim（四）之QGC、SITL、户外UE4场景配置

发表于 2019-07-10 | 分类于 Airsim | 阅读次数:

字数统计: 1.6k | 阅读时长 ≈ 6

前言这篇博客，更多的是记录一下ubuntu下QGC的安装及使用，Airsim的SITL配置以及如何添加UE4的定制场景等。但是在Airsim的HITL配置方面还没有成功过相关关键词 QGC SITL PX4 一、PX4 SITL配置1.1 设置dialout用户1sudo usermod - ...

阅读全文 »

Windows下sublime相关配置

发表于 2019-07-10 | 分类于系统 | 阅读次数:

字数统计: 1.7k | 阅读时长 ≈ 6

前言在windows上下载sublime，一个是为了编辑txt文本文件方便，另一个也能通过Sublime来运行python代码，而不用在cmd窗口或者pycharm上一、Sublime Text3下载 Sublime Text3 下载，请点击官网有一段时间，不能通过官网下载，每次一点下载 ...

阅读全文 »

Ubuntu16下GPU Tensorflow安装详细步骤

发表于 2019-07-05 | 分类于 Linux | 阅读次数:

字数统计: 1.1k | 阅读时长 ≈ 4

前言以往的GPU Tensorflow安装都是在服务器上安装，并且步骤不太详细，这一次，是认为比较详细的一步步的安装方法，有了这个笔记，以后参照这个应该就能很快的安装好Tensorflow了版本说明系统：Ubuntu16.04 CUDA版本：cuda10.0 cuDNN版本：cudnn7.4 ...

阅读全文 »

初识Airsim（三）之Ubuntu下Airsim平台搭建

发表于 2019-07-02 | 分类于 Airsim | 阅读次数:

字数统计: 1.1k | 阅读时长 ≈ 4

前言微软推出的airsim对windows的支持更好，但是也能在Ubuntu下进行安装，由于本人习惯在ubuntu下进行开发，因此，参考了airsim的官方文档和网上的一些文章，在ubuntu下搭建成功版本说明 Ubuntu16.04 Unreal Engine 4.18 Airsim 1.2 ...

阅读全文 »

(转)双系统之Win重装后linux引导损坏

发表于 2019-07-01 | 分类于 Linux | 阅读次数:

字数统计: 438 | 阅读时长 ≈ 1

前言由于一些需求，有时需要重装电脑，而本来是双系统的电脑，重装后，Linux的引导修复可能缺失，即在启动的过程中只有windows的界面，而没有win与linux的选择界面，因此，在网上找了几篇博客，几经对比后，还是这一片写的比较好（对我而言），并且已经测试成功原文网址原文安装步骤（1）首先 ...

阅读全文 »

ubuntu下科学上网

发表于 2019-06-27 | 分类于 Linux | 阅读次数:

字数统计: 681 | 阅读时长 ≈ 2

前言其实这一个笔记和前面的笔记（ubuntu16下翻墙搭建）差不多，但是之前的笔记只记载了chrome浏览器下，网页端科学上网的方法，关于终端下如何科学上网，并没有记载，因此这篇笔记，更多的是说明如何在终端上科学上网，当然也能在firefox上，chrome浏览器上还没有测试一、安装chrom ...

阅读全文 »