第七单元 第7课《探索大语言模型》课件 -清华大学版 人工智能通识(小学)

资源下载
  1. 二一教育资源

第七单元 第7课《探索大语言模型》课件 -清华大学版 人工智能通识(小学)

资源简介

(共39张PPT)
第七单元 第7课
探索大语言模型
清华版(小学)

1
学习目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
教学目标
(1)了解语言模型的发展历程,知道ChatGPT代表的大语言模型与传统语言模型的区别。
(2)知道大语言模型技术的关键是掌握了人类语言的顺序性。
(3)认识大语言模型的局限性,理性看待大语言模型。
02
新知导入
语言模型的本质
大语言模型的核心机制类似于高级“词语接龙”,通过概率分布预测下一个最可能的词逐步生成连贯文本,这种自回归方式使其掌握了语言规律。
02
新知导入
神经网络的赋能作用
Transformer的自注意力机制让模型理解上下文,并涌现出逻辑推理等复杂能力。
02
新知导入
知识获取的路径
模型通过海量文本数据的预训练,学习到语言结构、常识推理及专业概念,形成压缩版的“人类知识库”,而非直接存储原始数据。
03
新知讲解
1
语言的秘密
语言的核心地位
语言是人类知识传承的核心载体,其复杂性与多变性使其成为AI研究的终极挑战之一。
03
新知讲解
1
语言的秘密
传统语言理解的局限
基于语法规则的方法因口语省略、歧义等语言的非规则性原因难以实现真正理解,导致深度学习前进展缓慢。
03
新知讲解
1
语言的秘密
传统语言生成的困境
规则驱动的句子生成仅保证形式正确,却无法规避语义荒谬(如“吃月亮”),暴露符号主义AI的边界。
03
新知讲解
1
语言的秘密
语言模型的革新价值
概率驱动 :选择高关联词保障语义合理
数据学习 :通过海量文本自动捕捉语言规律,取代人工规则
03
新知讲解
1
语言的秘密
神经网络的破局作用
深度学习通过 分布式表征 将词汇映射为高维向量,实现:
上下文感知 ,如“bank”根据语境区分“河岸/银行”。
隐式语法掌握 ,无需显式规则即可生成合规句子。
03
新知讲解
1
语言的秘密
语言模型的概率驱动本质
语言模型通过统计历史语料中词汇共现频率,如“吃苹果”比“吃太阳”出现概率高100倍,量化词语接龙的合理性,形成基于数据的决策依据。
03
新知讲解
早期应用的局限性
ChatGPT前,语言模型受限于数据规模与架构,如RNN的短记忆问题,仅用于输入法提示、搜索补全等窄领域,无法实现复杂创作。
1
语言的秘密
03
新知讲解
技术跃迁的关键突破
Transformer架构2017引入自注意力机制,解决长程依赖问题,配合海量数据与算力,使语言模型从“工具”升级为“创作者”。
1
语言的秘密
03
新知讲解
OpenAI的早期探索
2015年OpenAI初创时尚未找到实现通用AI的路径,直至2017年Google提出Transformer架构才获得突破方向。
2
ChatGPT的诞生
03
新知讲解
Transformer的革命性价值
Transformer捕捉1000词级上下文关系,其超长序列建模能力解决了传统语言模型短记忆瓶颈(仅10词回溯)。
2
ChatGPT的诞生
03
新知讲解
GPT的诞生与进化
OpenAI将Transformer应用于语言模型推出GPT,其回看窗口从10词扩展到1000词,显著提升语言理解与生成质量。
2
ChatGPT的诞生
03
新知讲解
技术突破的意外收获
语言学家未预料到生成模型能通过概率统计解决语言理解难题,证明“大数据+自回归”可涌现类人语义能力。
2
ChatGPT的诞生
03
新知讲解
AI发展的非线性特征
从OpenAI初期迷茫到GPT横空出世,体现技术突破常源于跨机构成果迁移(如Transformer→GPT),需保持开放协作。
2
ChatGPT的诞生
03
新知讲解
GPT的里程碑意义
GPT通过“词语接龙”机制与海量数据训练,证明神经网络可涌现出类人语言理解能力,为AI发展树立新范式。
2
ChatGPT的诞生
03
新知讲解
OpenAI的技术聚焦与迭代
OpenAI专注大模型研发(如GPT-2→GPT-4),8年内实现从文本生成到多模态理解的跨越,奠定行业领先地位。
2
ChatGPT的诞生
03
新知讲解
知识壁垒的突破路径
大语言模型通过解析45TB级文本数据,相当数百万本书,内化人类千年文明成果,实现从“统计规律”到“知识推理”的跃升。
2
ChatGPT的诞生
03
新知讲解
能力进步的多元体现
模型在语言流畅性、知识广度、逻辑推理等方面显著提升,验证“规模效应”(数据量+参数量)对智能水平的决定性影响。
2
ChatGPT的诞生
03
新知讲解
语言顺序性的普适启发
大语言模型对语言顺序性的学习,启发了科学家将类似原理迁移至视觉领域,通过捕捉视频帧间的 时空顺序性理解物理世界规律。
3
从文本生成到视频生成
03
新知讲解
Sora的技术突破本质
OpenAI的Sora系统通过海量视频数据学习空间(单帧几何关系)与时间(帧间运动逻辑)的关联性,生成符合光学反射等物理规则的内容,但本质仍是模式统计而非因果推理。
3
从文本生成到视频生成
03
新知讲解
数据驱动的“伪物理理解”
Sora生成的逼真视频源于训练数据中光学规律的重复模式,而非真正掌握物理法则,如窗外风景与玻璃反射的融合。
3
从文本生成到视频生成
03
新知讲解



1.概率统计的本质局限
大语言模型基于数据概率生成答案,无法保证事实准确性,存在误导风险。
2.使用边界的理性认知
应将其定位为辅助工具,如文本润色、灵感提示,而非重要决策的独立信息源,避免过度依赖。
3.人类主体的不可替代性
保持独立思考与交叉验证能力,是规避AI信息污染、守护知识纯度的关键防线。
03
新知讲解



思考:1.为什么大语言模型有时会生成错误信息?
(1)大语言模型基于概率生成文本,如高频词组合优先,而非真实知识库检索,因此可能混淆事实(如虚构人物事件)或放大数据偏见。
04
课堂练习
一、填空题。
1.大语言模型通过 机制逐词生成文本。
2.Transformer架构的核心创新是 机制。
3.Sora系统通过学习视频的 顺序性来生成逼真内容。
4.大语言模型可能生成错误信息是因为其基于 而非事实库。
5.使用大语言模型时,应对重要信息进行 以验证准确性。
自回归
自注意力
时空
概率统计
交叉验证
04
课堂练习
二、判断题。
1.大语言模型能够完全理解语言的深层含义。( )
2.Transformer架构通过自注意力机制解决了长文本依赖问题。( )
3.Sora视频生成系统真正理解了物理世界的规律。( )
4.大语言模型的训练数据量对其性能有决定性影响。( )
5.大语言模型可以替代人类进行所有类型的决策。( )
×

×

×
04
课堂练习
三、选择题。
1.Transformer架构对大语言模型的主要贡献是? ( )
A. 增加了计算速度 B. 解决了长距离上下文依赖问题
C. 减少了数据存储需求 D. 完全替代了人类编辑
2.Sora视频生成系统的核心技术基础是?( )
A. 语言模型的词语接龙机制 B. 学习视频中的时空顺序性
C. 直接编程物理规律 D. 仅依赖单帧图像分析
3.大语言模型可能生成错误信息的主要原因是? ( )
A. 基于统计概率而非事实核查 B. 故意误导用户 C. 计算能力不足 D. 网络连接不稳定
4.使用大语言模型时,如何最大限度避免被误导? ( )
A. 完全依赖其生成的内容 B. 对关键信息进行交叉验证 C. 仅用于娱乐目的 D. 限制使用次数
B
B
A
B
05
拓展延伸
1.多模态大模型的技术融合
通过统一架构(如CLIP、Flamingo)实现文本、图像、视频的联合表征学习,使模型能跨模态理解与生成内容。
05
拓展延伸
2.开源与闭源大模型之争
开源模型(如LLaMA)推动技术民主化但可能被滥用,而闭源模型(如GPT-4)更可控但依赖商业公司,引发AI发展路径的争议。
05
拓展延伸
3.AI写作的版权边界探讨
当前法律普遍不保护纯AI生成内容,但人类修改后的作品可能享有版权,需平衡创新激励与知识产权保护。
06
课堂总结
1
语言的秘密
2
ChatGPT的诞生
3
完成课堂练习
4
进行相关知识拓展
1
2
4
5
探索大语言模型
4
从文本生成到视频生成
3
07
板书设计
探索大语言模型
1、语言的秘密
2、 ChatGPT的诞生
3、从文本生成到视频生成
4、完成课堂练习
5、进行知识拓展
课后作业。
1、如何正确使用大语言才能避免被误导?
08
课后作业
思考:1.如何正确使用大语言才能避免被误导
(1)牢记AI是“工具”而非“权威”,保持批判性思维(如质疑矛盾表述),才能发挥其效率优势而不被错误信息反噬。
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

资源预览