神经网络和深度学习简介:结构、类型和限制
已发表: 2022-06-25既然您正在阅读本文,那么您很有可能对基本的机器学习有所了解——如果不是技术方面的知识,那么至少是机器学习的理论方面。
深度学习是继机器学习之后的下一个合乎逻辑的步骤。 在传统的机器学习中,机器是基于监督或强化来学习的。 然而,深度学习旨在复制人类学习的过程,并允许系统自行学习。
使用神经网络可以做到这一点。 想想你大脑中的神经元以及它们是如何工作的。 现在想象一下,如果它们被转换成人工网络——这就是人工神经网络。
深度学习和神经网络将彻底改变我们所知道的世界,而且在这项技术方面还有很多东西需要解开。
在这篇介绍性文章中,我们将简要介绍深度学习以及神经网络的工作原理、它们的不同类型以及神经网络的一些限制。
深度学习——简要概述
深度学习可以被认为是机器学习的一个子领域。 然而,与任何传统的机器学习算法或系统不同,深度学习系统使用多个层从它们输入的原始输入中提取高阶特征。 层数越多,网络越“深”,特征提取和整体学习就越好。
深度学习这个词自 1950 年代就已经存在,但当时的方法相当不受欢迎。 随着该领域的研究越来越多,深度学习不断发展,今天我们拥有由神经网络驱动的复杂深度学习方法。
神经网络在深度学习中的一些更流行的应用涉及人脸检测、对象检测、图像识别、文本到语音检测和转录等。 但我们只是触及了表面——还有很多东西等着我们去发现!
因此,在深入了解深度学习之前,我们必须首先了解什么是 AI 中的人工神经网络。
加入来自世界顶级大学的在线人工智能课程——硕士、高管研究生课程和 ML 和 AI 高级证书课程,以加快您的职业生涯。
人工神经网络
人工神经网络受到人类大脑实际运作方式的启发,它们构成了深度学习的基础。 这些系统接收数据,训练自己在数据中寻找模式,并为一组新的相似数据找到输出。
这就是深度学习的动力——神经网络自行学习并在自动寻找模式方面变得更强大,无需任何人工干预。 因此,神经网络可以充当数据的排序和标记系统。
让我们通过首先了解感知器来深入了解 ANN。
探索我们的机器学习和人工智能课程
IITM 机器学习和云高级认证 | LJMU 机器学习与人工智能理学硕士 | 来自 IITB 的机器学习和人工智能高级研究生课程 |
IIITB 机器学习和自然语言处理高级证书课程 | IIITB 机器学习和深度学习高级证书课程 | 来自 IITR 的管理人员人工智能高级证书课程 |
感知器
人工神经网络由较小的单元组成,就像我们大脑中的神经网络由称为神经元的较小单元组成。 较小的 ANN 单元称为感知器。 本质上,感知器包含一个或多个输入层、一个偏差、一个激活函数和一个最终输出。
感知器的工作原理是接收输入,将它们乘以权重,然后通过激活函数传递它们以产生输出。 添加偏差很重要,这样即使所有输入都为零,也不会出现问题。 它适用于以下公式:
Y = ∑(权重 * 输入)+ 偏差
因此,首先发生的是单个感知器内的计算。 在这里,计算加权和并将其传递给激活函数。 同样,可以有不同类型的激活函数,如三角函数、阶跃函数、激活函数等。
人工神经网络的结构
要开发神经网络,第一步是将不同的感知器层组合在一起。 这样,我们就得到了一个多层感知器模型。
在这些多层中,第一层是输入层。 该层直接接受输入。 而最后一层称为输出层,负责创建所需的输出。
输入层和输出层之间的所有层都称为隐藏层。 这些层不直接与特征输入或最终输出通信。 相反,来自一层的隐藏层神经元使用不同的通道连接到另一层。
激活函数的输出决定了神经元是否被激活。 一旦神经元被激活,它就可以使用通信通道将数据传输到下一层。 因此,所有数据点都在整个网络中传播。
最后,在输出层中,具有最高值的神经元通过触发确定最终输出。 神经元在所有传播之后收到的值是概率。 这意味着网络根据其接收到的输入,通过最高概率值估计输出。
一旦我们得到最终输出,我们可以将其与已知标签进行比较,并相应地进行权重调整。 重复这个过程,直到我们达到最大允许迭代或可接受的错误率。
现在,让我们谈谈可用的不同类型的神经网络。
阅读我们与机器学习和人工智能相关的热门文章
物联网:历史、现在和未来 | 机器学习教程:学习机器学习 | 什么是算法? 简单易行 |
印度机器人工程师的薪水:所有角色 | 机器学习工程师的一天:他们在做什么? | 什么是物联网(物联网) |
排列与组合:排列与组合之间的区别 | 人工智能和机器学习的 7 大趋势 | 使用 R 进行机器学习:您需要知道的一切 |
不同类型的神经网络
今天,我们将看看用于深度学习的两种最流行的神经网络类型,即 CNN 和 RNN。
CNN——卷积神经网络
CNN 不是使用简单的 2-D 阵列,而是使用 3-D 排列的神经元。 第一层称为卷积层。 这个卷积层中的每个神经元只负责处理一小部分输入信息。 因此,网络以小部分理解整个图片并多次计算它们以成功完成整个图片。
因此,CNN 对于图像识别、物体检测和其他类似任务非常有价值。 CNN 成功的其他应用包括语音识别、计算机视觉任务和机器翻译。
RNN——循环神经网络
RNN 在 1980 年代左右成为众人瞩目的焦点,它们使用时间序列数据或序列数据进行预测。 因此,它们适用于语音识别、自然语言处理、翻译等时间或顺序解决方案。
与 CNN 一样,RNN 也需要训练数据来学习然后进行预测。 然而,RNN 与 CNN 的不同之处在于,RNN 能够记住一层的输出并将其反馈给其他层的神经元。 因此,这可以被认为是一个不断重新处理信息的反馈网络,而不是像人工神经网络那样仅仅将信息向前馈送。
使用神经网络的局限性
神经网络是一个正在进行研究和修改的领域。 因此,通常有一些缺点正在得到解决和纠正,以对技术进行复杂的修改。 让我们看看神经网络的一些限制:
需要大量数据
神经网络处理大量训练数据才能正常运行。 如果你没有大量的数据,网络将很难自我训练。 此外,神经网络有几个参数——比如学习率、每层神经元的数量、隐藏层的数量等,需要适当地调整这些参数,以最大限度地减少预测误差,同时最大限度地提高预测效率和速度。 目标是允许神经网络复制人脑功能,为此它需要大量数据。
主要用作黑匣子
由于通常很难找出隐藏层的工作原理和组织方式,因此神经网络通常被视为黑盒环境。 因此,如果发生错误,查找错误原因并修复它变得非常具有挑战性和耗时。 不要忘记,它也变得相当昂贵。 这是银行和金融机构尚未使用神经网络进行预测的主要原因之一。
开发通常很耗时
由于神经网络是自己学习的,因此与传统的机器学习方法相比,整个过程通常非常耗时,而且成本高昂。 神经网络在计算和财务上也很昂贵,因为它们需要大量的训练数据和计算能力才能进行学习。
综上所述
更重要的是,这个世界在飞速发展,每一周都在流逝。 如果您热衷于了解有关深度学习以及如何使神经网络发挥作用的更多信息,我们建议您查看我们与 IIIT-B 合作提供的机器学习和深度学习高级证书课程。 这个为期 8 个月的课程为您提供启动职业所需的一切——从一对一的指导到行业支持再到就业指导。 今天就让自己报名吧!
不,人工神经网络对于完成深度学习很重要。 有多种类型的人工神经网络。 但应用最多的 2 个是循环神经网络和卷积神经网络。 感知器是 ANN 最基本的单元。1. 没有神经网络可以进行深度学习吗?
2. ANN 有哪些类型?
3. 人工神经网络最基本的单元是什么?