第七单元第7课《探索大语言模型》课件 -清华大学版人工智能通识（小学）

资源简介

(共39张PPT)
第七单元第7课
探索大语言模型
清华版（小学）
通
1
学习目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
教学目标
（1）了解语言模型的发展历程，知道ChatGPT代表的大语言模型与传统语言模型的区别。
（2）知道大语言模型技术的关键是掌握了人类语言的顺序性。
（3）认识大语言模型的局限性，理性看待大语言模型。
02
新知导入
语言模型的本质
大语言模型的核心机制类似于高级“词语接龙”，通过概率分布预测下一个最可能的词逐步生成连贯文本，这种自回归方式使其掌握了语言规律。
02
新知导入
神经网络的赋能作用
Transformer的自注意力机制让模型理解上下文，并涌现出逻辑推理等复杂能力。
02
新知导入
知识获取的路径
模型通过海量文本数据的预训练，学习到语言结构、常识推理及专业概念，形成压缩版的“人类知识库”，而非直接存储原始数据。
03
新知讲解
1
语言的秘密
语言的核心地位
语言是人类知识传承的核心载体，其复杂性与多变性使其成为AI研究的终极挑战之一。
03
新知讲解
1
语言的秘密
传统语言理解的局限
基于语法规则的方法因口语省略、歧义等语言的非规则性原因难以实现真正理解，导致深度学习前进展缓慢。
03
新知讲解
1
语言的秘密
传统语言生成的困境
规则驱动的句子生成仅保证形式正确，却无法规避语义荒谬（如“吃月亮”），暴露符号主义AI的边界。
03
新知讲解
1
语言的秘密
语言模型的革新价值
概率驱动：选择高关联词保障语义合理
数据学习：通过海量文本自动捕捉语言规律，取代人工规则
03
新知讲解
1
语言的秘密
神经网络的破局作用
深度学习通过分布式表征将词汇映射为高维向量，实现：
上下文感知，如“bank”根据语境区分“河岸/银行”。
隐式语法掌握，无需显式规则即可生成合规句子。
03
新知讲解
1
语言的秘密
语言模型的概率驱动本质
语言模型通过统计历史语料中词汇共现频率，如“吃苹果”比“吃太阳”出现概率高100倍，量化词语接龙的合理性，形成基于数据的决策依据。
03
新知讲解
早期应用的局限性
ChatGPT前，语言模型受限于数据规模与架构，如RNN的短记忆问题，仅用于输入法提示、搜索补全等窄领域，无法实现复杂创作。
1
语言的秘密
03
新知讲解
技术跃迁的关键突破
Transformer架构2017引入自注意力机制，解决长程依赖问题，配合海量数据与算力，使语言模型从“工具”升级为“创作者”。
1
语言的秘密
03
新知讲解
OpenAI的早期探索
2015年OpenAI初创时尚未找到实现通用AI的路径，直至2017年Google提出Transformer架构才获得突破方向。
2
ChatGPT的诞生
03
新知讲解
Transformer的革命性价值
Transformer捕捉1000词级上下文关系，其超长序列建模能力解决了传统语言模型短记忆瓶颈（仅10词回溯）。
2
ChatGPT的诞生
03
新知讲解
GPT的诞生与进化
OpenAI将Transformer应用于语言模型推出GPT，其回看窗口从10词扩展到1000词，显著提升语言理解与生成质量。
2
ChatGPT的诞生
03
新知讲解
技术突破的意外收获
语言学家未预料到生成模型能通过概率统计解决语言理解难题，证明“大数据+自回归”可涌现类人语义能力。
2
ChatGPT的诞生
03
新知讲解
AI发展的非线性特征
从OpenAI初期迷茫到GPT横空出世，体现技术突破常源于跨机构成果迁移（如Transformer→GPT），需保持开放协作。
2
ChatGPT的诞生
03
新知讲解
GPT的里程碑意义
GPT通过“词语接龙”机制与海量数据训练，证明神经网络可涌现出类人语言理解能力，为AI发展树立新范式。
2
ChatGPT的诞生
03
新知讲解
OpenAI的技术聚焦与迭代
OpenAI专注大模型研发（如GPT-2→GPT-4），8年内实现从文本生成到多模态理解的跨越，奠定行业领先地位。
2
ChatGPT的诞生
03
新知讲解
知识壁垒的突破路径
大语言模型通过解析45TB级文本数据，相当数百万本书，内化人类千年文明成果，实现从“统计规律”到“知识推理”的跃升。
2
ChatGPT的诞生
03
新知讲解
能力进步的多元体现
模型在语言流畅性、知识广度、逻辑推理等方面显著提升，验证“规模效应”（数据量+参数量）对智能水平的决定性影响。
2
ChatGPT的诞生
03
新知讲解
语言顺序性的普适启发
大语言模型对语言顺序性的学习，启发了科学家将类似原理迁移至视觉领域，通过捕捉视频帧间的时空顺序性理解物理世界规律。
3
从文本生成到视频生成
03
新知讲解
Sora的技术突破本质
OpenAI的Sora系统通过海量视频数据学习空间（单帧几何关系）与时间（帧间运动逻辑）的关联性，生成符合光学反射等物理规则的内容，但本质仍是模式统计而非因果推理。
3
从文本生成到视频生成
03
新知讲解
数据驱动的“伪物理理解”
Sora生成的逼真视频源于训练数据中光学规律的重复模式，而非真正掌握物理法则，如窗外风景与玻璃反射的融合。
3
从文本生成到视频生成
03
新知讲解
爱
思
考
1.概率统计的本质局限
大语言模型基于数据概率生成答案，无法保证事实准确性，存在误导风险。
2.使用边界的理性认知
应将其定位为辅助工具，如文本润色、灵感提示，而非重要决策的独立信息源，避免过度依赖。
3.人类主体的不可替代性
保持独立思考与交叉验证能力，是规避AI信息污染、守护知识纯度的关键防线。
03
新知讲解
爱
思
考
思考：1.为什么大语言模型有时会生成错误信息？
（1）大语言模型基于概率生成文本，如高频词组合优先，而非真实知识库检索，因此可能混淆事实（如虚构人物事件）或放大数据偏见。
04
课堂练习
一、填空题。
1.大语言模型通过机制逐词生成文本。
2.Transformer架构的核心创新是机制。
3.Sora系统通过学习视频的顺序性来生成逼真内容。
4.大语言模型可能生成错误信息是因为其基于而非事实库。
5.使用大语言模型时，应对重要信息进行以验证准确性。
自回归
自注意力
时空
概率统计
交叉验证
04
课堂练习
二、判断题。
1.大语言模型能够完全理解语言的深层含义。（）
2.Transformer架构通过自注意力机制解决了长文本依赖问题。（）
3.Sora视频生成系统真正理解了物理世界的规律。（）
4.大语言模型的训练数据量对其性能有决定性影响。（）
5.大语言模型可以替代人类进行所有类型的决策。（）
×
√
×
√
×
04
课堂练习
三、选择题。
1.Transformer架构对大语言模型的主要贡献是？ ( )
A. 增加了计算速度 B. 解决了长距离上下文依赖问题
C. 减少了数据存储需求 D. 完全替代了人类编辑
2.Sora视频生成系统的核心技术基础是？( )
A. 语言模型的词语接龙机制 B. 学习视频中的时空顺序性
C. 直接编程物理规律 D. 仅依赖单帧图像分析
3.大语言模型可能生成错误信息的主要原因是？ ( )
A. 基于统计概率而非事实核查 B. 故意误导用户 C. 计算能力不足 D. 网络连接不稳定
4.使用大语言模型时，如何最大限度避免被误导？ ( )
A. 完全依赖其生成的内容 B. 对关键信息进行交叉验证 C. 仅用于娱乐目的 D. 限制使用次数
B
B
A
B
05
拓展延伸
1.多模态大模型的技术融合
通过统一架构（如CLIP、Flamingo）实现文本、图像、视频的联合表征学习，使模型能跨模态理解与生成内容。
05
拓展延伸
2.开源与闭源大模型之争
开源模型（如LLaMA）推动技术民主化但可能被滥用，而闭源模型（如GPT-4）更可控但依赖商业公司，引发AI发展路径的争议。
05
拓展延伸
3.AI写作的版权边界探讨
当前法律普遍不保护纯AI生成内容，但人类修改后的作品可能享有版权，需平衡创新激励与知识产权保护。
06
课堂总结
1
语言的秘密
2
ChatGPT的诞生
3
完成课堂练习
4
进行相关知识拓展
1
2
4
5
探索大语言模型
4
从文本生成到视频生成
3
07
板书设计
探索大语言模型
1、语言的秘密
2、 ChatGPT的诞生
3、从文本生成到视频生成
4、完成课堂练习
5、进行知识拓展
课后作业。
1、如何正确使用大语言才能避免被误导？
08
课后作业
思考：1.如何正确使用大语言才能避免被误导
（1）牢记AI是“工具”而非“权威”，保持批判性思维（如质疑矛盾表述），才能发挥其效率优势而不被错误信息反噬。
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

请用微信扫码

第七单元 第7课《探索大语言模型》课件 -清华大学版 人工智能通识（小学）

第七单元 第7课《探索大语言模型》课件 -清华大学版 人工智能通识（小学）

第七单元第7课《探索大语言模型》课件 -清华大学版人工智能通识（小学）

第七单元第7课《探索大语言模型》课件 -清华大学版人工智能通识（小学）