面向初学者的机器学习简介：什么是、历史、功能和分类

已发表: 2022-07-13

机器学习简介

在当今技术驱动的市场中，机器学习的需求量很大。这是席卷全球并彻底改变了计算机科学世界的最新趋势。此外，应用程序产生的大量数据导致计算能力显着提高，从而导致学生和候选人对机器学习技能的普及和需求。

机器学习用于不同的领域。从自动化基本任务到提供有价值的见解，它使行业和企业受益匪浅。机器学习已在我们的日常设备中实施，例如健身追踪器、智能家庭助理、医疗保健系统、自动驾驶汽车等。实施机器学习的其他基本示例是：-

机器学习或 ML 是数据分析的一个组成部分。它用于创建复杂的算法和模型，帮助研究人员、工程师、数据科学家和分析师预测和提供可靠的信息。

从世界顶级大学在线学习机器学习——硕士、高级管理人员研究生课程和 ML 和 AI 高级证书课程，以加快您的职业生涯。

IITM 机器学习和云高级认证	LJMU 机器学习与人工智能理学硕士	来自 IITB 的机器学习和人工智能高级研究生课程
IIITB 机器学习和自然语言处理高级证书课程	IIITB 机器学习和深度学习高级证书课程	来自 IITR 的管理人员人工智能高级证书课程

“机器学习”是人工智能和计算机游戏领域的先驱和专家 Arthur Samuel 在 1959 年创造的一个术语。他将其定义为使计算机无需编程即可学习的过程。

1940 年代，发明了第一个可以手动操作的计算机系统，称为 ENIAC（电子数值积分器和计算机）。这是建造一台可以模拟人类学习和思考的机器的想法的开始。

由于统计学的原因，机器学习在 1990 年代得到普及，并引发了人工智能中的概率方法，进一步转向数据驱动的方法。这为科学家思考、设计和构建具有分析能力的智能系统以从海量数据集中学习铺平了道路。

机器学习实现可以根据学习系统可用的学习“信号”或“响应”分为三个不同的类别。它们如下：-

当算法使用示例数据和由字符串标签或数值（如类或标签）组成的相关目标响应，并在以后给定新示例时学习如何预测正确响应时，称为监督学习。这是一种类似于在老师的监督下进行人类学习的方法，学生记住老师提供的好例子。然后学生从这些目标示例中得出一般规则。

无监督学习是指算法从没有任何相关响应的简单示例中学习，而仅在算法上确定数据模式。该算法通常将数据重组为完全不同的东西，例如表示类的新特征或不相关值的集合。

这些对于让数据分析师深入了解数据的含义非常有用，并为改进有监督的机器学习算法提供有价值的提示。这几乎类似于人类通过观察两个对象之间的相似性来学习确定某些事物或实例是否属于同一类别。您通过浏览网页遇到的推荐系统和广告是营销自动化，并且基于这种无监督的自动化学习。

当向算法提供没有任何标签的示例时，它可以归类为一种无监督学习。但是，当一个示例按照算法提出的解决方案伴随着正反馈或负反馈时，这就是强化学习。此学习类别与需要算法做出决策并承担后果的应用程序相关联。

它类似于人类学习的试错法。通过试错法，算法了解到特定的行动方案不像其他方案那样成功。关于强化学习，最好的例子之一是计算机学会独立玩电子游戏。该应用程序提供了某些实例或情况的算法示例，例如让玩家陷入迷宫，同时避开敌人。

半监督学习是指提供未完成的训练信号以及一些缺失的目标输出。该原则的一个例外情况称为转导，其中整个问题实例集都是在学习时确定的，除了缺少目标的部分。

下面是了解机器学习如何工作的步骤：

数据收集：首先，收集适合处理的任何形式的过去数据。 数据质量越高，就越适合建模。
数据处理：在大多数情况下，数据是以原始形式收集的，并且必须进行预处理。 数字属性可能有多个缺失值，例如可以用属性的平均值替换房屋的价格。但是，可以将分类特征的缺失值替换为具有最高众数的特征。这取决于使用的过滤器类型。
划分输入数据：输入数据必须分为训练集、交叉验证集和测试集。 组间比例要求为6:2:2
构建模型：应该在训练集上使用合适的技术和算法构建模型。
测试概念化模型：概念化模型使用训练期间未输入模型的数据进行测试，并借助 F1 分数、召回率和精度等指标评估其性能。

由于人工智能的日益普及和进步，机器学习技能是目前就业市场最需要的技能之一，人工智能现在是我们生活中不可或缺的一部分。

参加机器学习的高级课程无疑会给你的职业生涯带来巨大的提升。如果您正在寻找一些有利可图的选择，您可以选择upGrad 。除了众多其他利润丰厚的课程可供选择外，机器学习和深度学习高级证书课程是帮助您在机器学习领域进行深入培训的完美课程。

本课程的主要亮点是——

在传统编程中，数据（输入）+程序（逻辑）被馈送到机器以运行程序并实现输出。另一方面，在机器学习中，数据（输入）+输出被馈送到机器以在训练时运行它，机器可以创建它的程序（逻辑），在测试时接受评估。

学习机器学习的先决条件是线性代数、统计和概率、微积分、图论以及 Python、R、MATLAB、C++ 或 Octave 等语言的编程技能。

数据在机器学习中分为三个部分。训练模型需要训练数据。这是它实际从中学习的模型可以看到的数据。验证数据用于快速评估模型并改进了涉及的超参数。测试数据经过全面培训，并提供公正的评估。