目前位置:主页 > 科普园地 > 科普知识 >

了解机器学习

文章来源:未知         发布时间:2021-06-10

在前面的章节中我们知道了,人工智能的主要目的是赋予机器智能,那到底如何赋予机器智能呢?在人工智能不同的发展阶段,赋予机器智能的方法不一样。

在人工智能1.0时代,让机器具有推理能力就认为赋予了机器智能;在人工智能2.0时代,让机器具有知识系统就认为赋予了机器智能;在现在的人工智能3.0时代,让机器像人类一样能够通过学习获得知识和技能就认为赋予了机器智能,这种赋予机器智能的方法被称为机器学习(Machine Learning)。接下来,我们一起了解机器是如何学习的。

 

“快把光明的灯擎起来了/那里有美丽的天/问着村里的水流的声音/我的爱人在哪……”  同学们觉得这首诗怎么样?

这首诗并不是人类创作的,而是微软人工智能机器人小冰创作的,并且小冰已经出版了个人的诗集阳光失了玻璃窗》。那小冰是如何学会写诗的呢?

小冰学了1920年以来519位现代诗人的上千首诗,并将这些诗反复学习了10000次,共耗时约100个小时,与之对比,人类学习这些诗大概需要100年。

01

        人类学习的方式       

机器学习是让机器模拟人类的学习行为的一种方法。在了解机器如何学习之前,我们先来看看人类是如何学习的。
在我们成长的过程中,我们通过不断的学习和记忆来认识外部世界的各类事物,并且通过事物的差异来区分每种不同事物,我们把显著区分不同事物的差异点叫作事物的特征。在现实中你是如何判断一只动物是猫呢?在我们很小的时候,父母会指着猫的图片告诉我们“这是一只猫”,经过反复的记忆之后,我们会在脑海中形成猫的外观特征模型,并且会把这个特征模型与“猫"这个词联系起来。当我们再一次看到猫的图像时,就会把图像与脑海中的特征模型进行匹配,识别出图像结果。
人类学习的过程与认识猫的过程类似,是通过不断的积累经验,总结事物的规律,从而不断改进的过程。

02

       机器学习的方式       

机器学习的过程与人类的学习过程类似。首先,机器需要先积累经验,而这些经验通常以大量数据的形式存在,我们把这些数据叫作样本数据(例如大量猫的图片),然后通过学习这些大量的数据总结规律,在计算机中我们把总结规律这个过程叫作训练模型,训练之后的模型就是计算机总结出来的规律。最后,在遇到新的问题时,训练好的模型会给我们提供相应的判断。
当计算机在学习大量的数据时,如果这些数据事先设置了标记,告诉计算机每个数据的含义是什么,那么这种学习的方式称为监督学习。例如给猫的样本图片设置“猫”的标记,告诉计算机这些样本图片是猫的图片。反之,如果对学习的数据没有进行标记,计算机需要自己总结规律,然后归纳这些数据的含义,这种学习的方式称为无监督学习。这里我们重点说一下监督学习。

03

        监督学习的过程       

我们以计算机识别猫为例,来了解机器监督学习的过程。计算机通过监督学习识别猫的过程如下:
1.创建样本数据集。收集大量猫的图片,并将收集到的图片分为两部分,其中80%的图片数据作为训练样本,用于后面模型的训练,并把训练样本的数据都标记为“猫”。20%的数据作为测试样本,用于后面模型的测试,测试样本的数据不需要做任何标记。
2.特征提取。为了让计算机能够区分猫和其他的物品,我们需要提取猫的显著特征,例如猫的耳朵,眼睛等。
3.训练模型。创建或者是选择一个图像识别模型(分类器),这个模型一开始可能并不能准确的识别出猫的图片。计算机将训练样本中的每张图片提取特征之后,将这些特征图片输入图像识别模型中,自动修正图像识别模型中的参数。经过多次的迭代训练之后,图像识别模型识别猫的准确率会越来越高,直到准确率趋于一个平稳值时,完成模型训练。
4.测试模型。当我们训练完模型之后,我们需要评估模型是否能够正确识别出猫的图片。我们把测试集中没有标记的图片输入图像识别模型,看图像识别模型能否准确地识别出猫的图片,如果可以准确地识别出猫,说明模型训练成功,然后在具体的应用中去使用该模型。如果识别不出猫,说明训练失败,我们需要重新提取图片特征,重新训练模型。
 

作者:谢明佐

作者简介:北京勤牛创智科技有限公司联合创始人

文章节选自北京勤牛创智科技有限公司《人工智能入门》,有删减改动。

上一篇:机器学习的应用 下一篇:没有了