多标记与深度学习论文

多标记与深度学习论文

问:深度学习和深度强化学习的区别
  1. 答:强化学习和深度学习是两种技术,只不过深度学习技术可以用到强化学习上,这个就叫深度强化学习.
    1.强化学习其实也是机器学习的一个分支,但是它与我们常见的机器学习不太一样。它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。强化学习是一种标记延迟的监督学习。
    2.强化学习实际上是一套很通用的解决人工智能问题的框架,很值得大家去研究。另一方面,深度学习不仅能够为强化学习带来端到端优化的便利,而且使得强化学习不再受限于低维的空间中,极大地拓展了强化学习的使用范围。
  2. 答:强化学习要求agent去探索环境,然后对状态进行evaluate,在每一个状态下agent可以选择多种action,每次选择的依据可以是贪婪或者softmax等,但是得到的reward是无法表明当前的选择是正确的还是错误的,得到的只是一个score,监督学习的labels可以给agent简洁明了的correct or wrong,并且在agent 在对环境充分的探索前即在每一种状态下选择的每个action的次数不够多时,无法充分求expect,并且在action之间也无法进行对比择优。但是当监督学习的label信息有噪声干扰或者是利用一些active learning 获得到的labels的时候,强化学习的agent与环境直接交互获取到的信息是更加可靠。
    强化学习也是使用未标记的数据,但是可以通过某种方法知道你是离正确答案越来越近还是越来越远(即奖惩函数)。传统的“冷热游戏”(hotter or colder,是美版捉迷藏游戏 Huckle Buckle Beanstalk 的一个变种)很生动的解释了这个概念。你的朋友会事先藏好一个东西,当你离这个东西越来越近的时候,你朋友就说热,越来越远的时候,你朋友会说冷。冷或者热就是一个奖惩函数。半监督学习算法就是最大化奖惩函数。可以把奖惩函数想象成正确答案的一个延迟的、稀疏的形式。
    在监督学习中,能直接得到每个输入的对应的输出。强化学习中,训练一段时间后,你才能得到一个延迟的反馈,并且只有一点提示说明你是离答案越来越远还是越来越近。
    DeepMind 在自然杂志上发表了一篇论文 ,介绍了他们把强化学习和深度学习结合起来,让神经网络学着玩各种雅达利(Atari)游戏(就是各种街机游戏),一些游戏如打砖块(breakout)非常成功,但是另一些游戏比如蒙特祖玛的复仇,就表现的很糟糕。
  3. 答:强化学习其实也是机器学习的一个分支,但是它与我们常见的机器学习(比如监督学习supervised
    learning)不太一样。它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。强化学习是一种标记延迟的监督学习。强化学习实际上是一套很通用的解决人工智能问题的框架,很值得大家去研究。另一方面,深度学习不仅能够为强化学习带来端到端优化的便利,而且使得强化学习不再受限于低维的空间中,极大地拓展了强化学习的使用范围。
  4. 答:深度强化学习就是在传统强化学习的基础上增加了神经网络,如Q-learning上加了网络变成DQN就是深度强化学习了,通过深度网络来拟合函数获得Q值,解决Q-table面对连续状态和高维动作空间时很吃力的问题。
问:深度学习能应用在哪些领域?
  1. 答:深度学习的快速发展,不仅使机器学习得到许多实际的应用,还拓展了整个AI(人工智能的)的范围。 它将任务进行拆解,使得各种类型的机器辅助变成可能,具体分为以下几类应用:
    1、无人驾驶汽车:深度学习在无人驾驶领域主要用于图像处理,可以用于感知周围环境、 识别可行驶区域检测、以及识别行驶路径识别。
    2、图片识别及分类:识别出图片中的对象,并建立关键词,对图片进行分类。
    3、机器翻译:基于深度学习理论,借助海量计算机模拟的神经元,在海量的互联网资源的依托下,来模仿人脑理解语言,形成更加符合语法规范、容易理解的译文。
    4、目标识别:即不仅可以识别出是什么物体,还可以预测物体的位置,位置一般用边框标记。
    5、情感识别:通过深度学习,帮助计算机识别新闻、微博、博客、论坛等文本内容中所包含情感态度,从而及时发现产品的正负口碑。
    6、艺术创作:通过深度学习,让计算机学会根据不同的作曲家风格进行音乐编曲或者基于各流派画家进行绘画创作。
  2. 答:很多领域都会运用到深度学习,把一门学科学好,学精,掌握核心知识点,都需要深度学习。
  3. 答:深度学习的话大部分都是用在人工智能领域的,因为在人工智能领域的话,你需要用它来作为支撑。
问:图像和深度学习类的论文应该怎么看
  1. 答:整体感知文章内容,明确中心。
    2.看出文章各个部分之间的联系,大体了解文章的思路,理清文章结构,划分文章层次。
    3.感受文章的语言所表达的思想感情。
    4.结合上下文理解词义和句义,领会词句在特定语言环境中的含义和作用。
    5.找出文中感受最深的句子或段落,抓住一段文字的中心,找出关键语句,体会这些语句的深层含义。
多标记与深度学习论文
下载Doc文档

猜你喜欢