1. 首页 > 热门资讯

人工智能自考本科考哪几门课程,第五章 机器学习



本课程内容开源地址:https://github.com/masterru/aiformiddleschool还比较简陋,不过还是欢迎fork和star

目标:

1. 掌握机器学习的基本概念;

2. 知道机器学习的典型应用;

3. 可以熟练掌握机器学习的相关应用;

4. 能够利用人工智能开源框架开发机器学习相关应用;

5. 建立起利用机器学习解决生活中所碰到的问题的意识;

6. 在日常学习生活中,建立起保护隐私信息的意识,养成主动保护自己及他人的个人隐私数据的习惯。在训练模型时,注重训练的公平性和无歧义性,不训练具有偏见的机器学习模型。

一、机器学习初体验

表5.1.1 机器学习初体验备选工具

环境

工具名称

功能简介

获取方式

浏览器

面向儿童的机器学习

在线创建机器学习模型,训练识别模型,并实现识别应用。

访问网址:https://machinelearningforkids.co.uk/

浏览器

DEEPL翻译器

利用深度神经网络打造的精准翻译器,号称目前最精准的翻译系统,支持29种语言互相翻译。

访问网址:https://www.deepl.com/translator

机器学习案例:面向儿童的机器学习和深度学习翻译器,分别属于深度学习在线应用全流程体验案例和深度神经网络(机器学习的新发展)应用案例。

1. 面向儿童的机器学习

应用案例5-1:面向儿童的机器学习

(1)浏览器打开如表5.1.1第一行的面向儿童的机器学习;

(2)创建一个项目,猫和狗(Cats and dogs),两个参数,分别为cat和dog;

(3)分别上传20张猫和狗的照片,训练机器识别猫和狗;

(4)生成机器学习模式,并用网上的猫和狗的图片进行测试(用www进行测试),观察你的识别结果是否准确?如图5.1.2

图5.1.1面向儿童的机器学习训练界面

图5.1.2 测试模型界面

2. 深度学习翻译器

应用案例5-2:深度学习翻译器

(1)浏览器打开如表5.1.1第二行的DEEPL翻译器(深度学习翻译器);

(2)输入《春晓》诗句并翻译;

(3)观察翻译结果,判断翻译准确度如何?

图5.1.3 深度学习翻译器

二、机器学习的概念

1.机器学习的概念

机器学习是人工智能的一个分支,也是目前主要的人工智能应用的实现方式,机器学习的出现,让人工智能模式识别能力提高到了历史新高度,也使得很多应用从实验室走到了社会应用。机器学习从历史数据或者样本数据中学习知识和规律,形成模式并用于推断和决策,如识别花草树木、识别猫狗、识别水果等等,他和一般程序的区别是需要数据“喂养”,是一种数据驱动的方法。

机器学习模仿了人类学习的过程,通过不断地识别、刺激建立认知,从而形成概念和知识。机器学习是人工智能发展史上的第三阶段,前边经历了逻辑推理、知识工程两个阶段,前两个阶段都依赖于人类专家的知识梳理和经验总结,第三阶段开始,人工智能初步具备了学习能力,从而可以脱离人类实现“无监督”学习。

机器学习目前还没有一个统一的定义,最通俗的定义是:机器学习是用计算机程序模拟人的学习能力,从实际例子中学习得到知识和经验,并用于推理和决策。

2.机器学习的分类

机器学习有三种主要的方法:监督式、无监督式和强化式学习。还有包括半监督学习在内的混合方法,可以根据研究人员寻求解决的问题进行定制。

在监督式学习中,有一个“监督者”,起到了类似于教师的角色,提供给机器正确答案。如在体验案例中的猫狗识别,上传了猫和狗的20张照片就是告诉程序,什么是猫,什么是狗,并进行了标注,机器就可以使用这些标注过的数据来学习,从而形成什么是猫什么是狗的模式。监督式学习包括分类和回归两大分类。常见分类算法包括:朴素贝叶斯、决策树、Logistic回归、K紧邻、支持向量机。常见的回归算法包括:线性回归和多项式回归。

无监督学习则和监督式学习相反,在机器学习过程中,没有“监督者”角色,机器或程序需要独自区分对象,数据都没有事先标注,模式形成的过程全部依赖于机器。无监督学习包括聚类、降维等常见分类。常见聚类算法包括:K均值聚类、Mean-Shift、DBSCAN等。常见的降维算法包括:主成分分析、奇异值分解、潜在狄里克雷特分配、潜在语义分析、t-SNE等。

深度学习是机器学习的新发展,目前深度学习是主流人工智能应用的核心,人工神经网络是深度学习的主要算法。

三、机器学习的应用

机器学习的应用非常广泛,目前的计算机视觉、语音识别、自然语言处理都应用了机器学习的算法,在此不再赘述,在本章的应用环节,我们介绍一批比较神奇而且有趣的机器学习应用,自动生成,如自动生成绘画、自动生成文章等,在此按照大厂的模型来介绍一些机器学习的应用,如文心大模型和悟道大模型。

1. 机器绘画

所谓的机器绘画,就是让机器像人类一样绘画,只需要输入一段画面的描述文字,机器就会通过理解文字内容,并按照文字描述生成相应的画面。机器绘画的基础是自然语言理解,然后使用机器学习的一种GAN(生成对抗网络)算法,来自动生成图画。生成对抗网络是一种基于深度学习的生成建模方法,生成建模是一项无监督的机器学习任务,需要自动检测和学习传入数据中的模式,以便模型可用于生成与原始数据无法区分的新假副本。

表5.3.1 机器绘画应用

环境

工具名称

功能简介

获取方式

浏览器

ERNIE-ViLG 文生图

输入一段文字生成图片。

访问网址:https://wenxin.baidu.com/ernie-vilg

浏览器

CogView根据文字描述生成图片

输入一段文字生成图片。

访问网址:https://models.aminer.cn/CogView/index.html

场景描述:

面对绘画任务,你是否无从下笔?又或者你梦想自己能够绘制一幅美丽的画,而自己又不具备绘画能力?这时候就需要机器绘画来帮忙了。

体验步骤:

(1)浏览器打开网址;

(2)输入“一个读书的小女孩”;

(3)对比两个系统生成的图像哪个更加真实,哪个更加符合你的预期。绘制参考结果如下图所示。

图5.3.1 ERNIE-ViLG文生图生成结果

图5.3.2 CogView生成结果

2. 自然语言生成

自然语言处理包括自然语言理解和自然语言生成两个分支。自然语言理解是从语言到意义的过程,自然语言生成则是从意义到语言的过程,通常用于人机对话、文本自动摘要、智能写作等。

表5.3.2 自然语言生成应用

环境

工具名称

功能简介

获取方式

浏览器

ERNIE3文本理解与创作

输入一段文字生成新的文字。

访问网址:https://wenxin.baidu.com/ernie3

浏览器

GLM-130B模型任务演示

输入一段文字生成新的文字。

访问网址:https://models.aminer.cn/democenter?demo=story_generate

场景描述:

你是否想要制作一个聊天机器人,而不知道如何让机器人和你自由对话?你是否在写作时碰到了瓶颈,实在没有灵感?

体验步骤:

(1)浏览器打开表5.3.2所示网址;

(2)输入一段文字,点击立即生成按钮;

(3)对比两个系统生成文本哪个文采、流畅度等方面更好。

图5.3.3 ERNIE3文本理解与创作截图

图5.3.4 GLM-130B模型任务演示

四、机器学习的开发

1. 图形化编程

前驱知识准备:图形化编程的界面布局;知道角色背景造型等基本概念;图形化编程的事件(当绿旗被点击)、外观(说**2秒)、控制(等待1秒、重复执行、如果那么)等基本积木;知道图形化编程的基本方法。

硬件准备:带有摄像头麦克风的笔记本电脑(含Mac笔记本)、台式机电脑。注:平板电脑暂不支持机器学习模块。慧编程mBlock5.3.0支持Windows7、Windows10、macOS 10.12+版本的操作系统,推荐64位操作系统。

软件工具准备:参照表2.4.1所示第一行的获取方式下载并安装慧编程工具。完成账号注册并登陆(可以应用更多功能)。

任务:训练一个剪刀石头布识别模型,并实现人机剪刀石头布对弈游戏

图5.4.1 模型训练界面

图5.4.2 剪刀石头布程序

拓展任务:

在游戏过程中如何防止人或程序作弊?如何进一步提高识别的准确性?

2. Python编程

下面利用python来实现机器绘画的功能,为了简化程序的实现,我们使用文心大模型作为预训练模型,通过调用该模型直接绘制图像。

库的安装方法如下:

在命令行模式下输入:

pip install --upgrade wenxin-api

然后在百度文心大模型界面创建Apikey,

地址为:https://wenxin.baidu.com/api/key

复制APIkey和Secretkey备用。

做好相关准备后,就可以编制程序了,具体代码如下:

图5.4.3 Python调用百度文心大模型作画示例

运行代码后,就可以获取生成的图片的地址,如下图所示:

图5.4.4 利用百度文心大模型作画生成图片地址

拓展任务:

在以上程序中,如何自动打开所生成的图像?(提示:调用python的浏览器调用库)

思考与练习

1. 什么是机器学习?传统机器学习有哪些分类?

2. 应用机器学习会不会导致个人隐私数据的泄露?如果会,该如何避免?

3. 你还知道哪些开源的机器学习框架,请利用一个框架设计一个识别手写文字的模型。

本文链接:http://hainhha.cn/rm/16763.html

版权声明:本文内容由互联网用户自行发布,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系qq:1442716096举报,一经查实,本站将立刻删除。

联系我们

在线咨询:点击这里给我发消息

微信号:weixin888

工作日:9:30-18:30,节假日休息