- · 机器人版面费是多少[04/09]
- · 《机器人》投稿方式[04/09]
- · 《机器人》数据库收录影[04/09]
- · 《机器人》期刊栏目设置[04/09]
机器人论文的研究方法(机器人论文的研究方法(2)
作者:网站采编关键词:
摘要:为这个领域中一个重要的架构,在计算能力爆发式增长的十年中,赢得了许多重要的机器学习竞赛。这个红利的热度直到今年仍未降温;今天,我们看到在
为了更深入地了解这些,我参加了一门“深度学习”课程,并开发了一个图像识别的神经网络以及基于循环神经网络(RNN)和长短项记忆(LSTM)的自然语言处理。可以去我的Github仓库中查看这些代码:
https://github.com/khanhnamle1994/deep-learning
最近,我也开始阅读一些深度学习方面的学术论文。下面这些是我收集到的几篇对深度学习领域的发展有重大影响的几篇论文:
1、Gradient-Based Learning Applied to Document Recognition (1998)
http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdf
意义:向机器学习世界引进了卷积神经网络
作者:Yann LeCun, Leon Bottou, Yoshua Bengio, and Patrick Haffner
2、Deep Boltzmann Machines (2009)
http://proceedings.mlr.press/v5/salakhutdinov09a/salakhutdinov09a.pdf
意义:为玻尔兹曼机提出了一种新的学习算法,其中包含许多隐藏变量层。
作者:Ruslan Salakhutdinov, Geoffrey Hinton
3、Building High-Level Features Using Large-Scale Unsupervised Learning (2012)
http://icml.cc/2012/papers/73.pdf
意义:解决了仅从未标记的数据构建高层次、特定类别的特征检测器的问题。
作者:Quoc V. Le,Marc’Aurelio Ranzato,Rajat Monga,Matthieu Devin,Kai Chen,Greg S. Corrado,Jeff Dean,Andrew Y. Ng
4、DeCAF?—?A Deep Convolutional Activation Feature for Generic Visual Recognition (2013)
http://proceedings.mlr.press/v32/donahue14.pdf
意义:释放了一个深度卷积激活特征的开源实现——DeCAF,以及所有相关的网络参数,使视觉研究人员能够深入地在一系列视觉概念学习范例中进行实验。
作者:Jeff Donahue,Yangqing Jia,Oriol Vinyals,Judy Hoffman,Ning Zhang,Eric Tzeng,Trevor Darrell
5、Playing Atari with Deep Reinforcement Learning (2016)
https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf
意义:提供了第一个可以使用强化学习从高维感官输入中直接学习控制策略的深度学习模型。
作者:Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex Graves,Ioannis Antonoglou,Daan Wierstra,Martin Riedmiller(DeepMind 团队)
在这些学习和研究中,我发现大量非常有意思的知识点。在这里我将分享十个深度学习的方法,AI工程师可能会将这些应用到他们的机器学习问题当中。
不过,首先先让我们来定义一下什么是“深度学习”。对很多人来说,给“深度学习”下一个定义确实很有挑战,因为在过去的十年中,它的形式已经慢慢地发生了很大的变化。
先来在视觉上感受一下“深度学习”的地位。下图是AI、机器学习和深度学习三个概念的一个关系图。
AI的领域要相对较广泛,机器学习是AI的一个子领域,而深度学习是机器学习领域中的一个子集。
深度学习网络与“典型”的前馈多层网络之间是有一些区别的,如下:
深度学习网络比之前的网络有更多的神经元
深度学习网络具有更复杂的连接层的
深度学习网络需要用强大的计算能力来训练
深度学习网络能够进行自动特征提取
因此深度学习可以被定义为在以下四个基本网络框架中拥有大量参数和层的神经网络:
无监督预训练网络(Unsupervised Pre-trained Networks)
卷积神经网络(Convolutional Neural Networks)
循环神经网络(Recurrent Neural Networks)
递归神经网络 (Recursive Neural Networks)
在这篇文章中,我主要对后三个框架比较感兴趣。
卷积神经网络 基本上就是用共享权重在空间中进行扩展的标准神经网络。设计CNN主要是为了通过内部卷积来识别图片,内部卷积可以看到待识别物体的边。
循环神经网络 基本上是在时间上进行扩展的标准神经网络,因为边进入下一个时间步,而不是在同一时间步进入下一个层。设计RNN主要是为了识别序列,例如语音信号或者文本。它里面的循环意味着网络中存在短暂的记忆。
递归神经网络 更类似于分层网络,其中输入序列没有真正的时间面,而是输入必须以树状分层处理。
以下10种方法可以应用于所有这些体系结构。
1、反向传播
反向传播是“误差反向传播”的简称,它是一种计算函数(在神经网络中以函数形式存在)偏微分的方法。当你要用一个基于梯度的方法来解决一个最优问题时(注意梯度下降只是解决这类问题的一种方法),你希望在每一次迭代中计算函数梯度。
文章来源:《机器人》 网址: http://www.jqrzzs.cn/zonghexinwen/2022/1209/2005.html
上一篇:大学学校是如何规定论文查重标准的
下一篇:机器人论文发表(机器人论文发表要求)