第9课 文本生成的影响因素 课件(19张PPT)

资源下载
  1. 二一教育资源

第9课 文本生成的影响因素 课件(19张PPT)

资源简介

(共19张PPT)
第9课 
文本生成的影响因素
第二单元 文本的智能生成
第9课 课堂导入
问题情境
影响文本生成的因素有哪些?
如何保证大语言模型生成的文本质量?
第9课 学习内容
一 多角度审核
二 参数的影响
学习内容
三 训练数据的影响
一、多角度审核
第9课 学习内容
模型在生成文本时,获得不同候选词的概率后,往往还需通过各种机制对生成内容进行限定。
一、多角度审核
第9课 学习内容
角色扮演——多约束叙事挑战
1.明确学习任务:分工扮演不同角色,协同生成具有悬疑风格的文本。
2.选择角色。
3.确定续写任务。
4.选择续写方式,进行续写审核工作。
第9课 学习内容
选择角色
一、多角度审核
一、多角度审核
第9课 学习内容
续写任务
生物标本室传来玻璃碎裂声,科学社成员小华用手电一照,突然发现___________________________
续写方式
方式一:选择排位靠前的一项;
方式二:一次保留多个备选文本。
一、多角度审核
第9课 学习内容
角色 反馈
纪律委员 字数是否符合
道德观察员 内容是否血腥
文风质检员 风格是否符合
方式一续写:__________________ 方式二续写:___________________
___________________
___________________
结论:___________________________ 结论:___________________________
蝴蝶标本柜有带血抓痕
少于150字,通过
悬疑风十足,通过
尝试下一个候选者
“血”可能涉嫌暴力,否定
一、多角度审核
第9课 学习内容
角色 反馈
纪律委员 字数是否符合
道德观察员 内容是否血腥
文风质检员 风格是否符合
方式一续写:__________________ 方式二续写:___________________
___________________
___________________
结论:___________________________ 结论:___________________________
少于150字,通过
A.破碎的颅骨
B.碎裂的容器
C.未知生物骨骼
A血腥,其他还好
B平淡,其他还好
选C
蝴蝶标本柜有带血抓痕
尝试下一个候选者
一、多角度审核
第9课 学习内容
5.进行多轮操作后,整理获得的文本,查看生成效果。
6. 选择大语言模型进行续写并查看续写效果。
[输入]
续写,不超过150字,悬疑风格,适合中学生,不能有暴力等不合适的内容。
文本:生物标本室传来玻璃碎裂声,科学社成员小华用手电一照,突然发现_______
[输出]
本该浸泡在福尔马林液中的蝴蝶标本全部消失了,只剩下空荡荡的容器。小华屏住呼吸,忽然听到细微的振翅声。抬头一看,成百上千只本应死去的蝴蝶正诡异地悬停在半空,翅膀闪烁着不自然的荧光……
一、多角度审核
第9课 学习内容
一起来说一说是否有必要从多角度约束文本智能生成?
有必要。因为:
·不同角色约束机制相互制衡,道德观察员维护内容安全性,文风质检员确保风格的统一性。
·方式二的多候选机制通过并行评估,提高了优质内容的产出效率。
·约束机制不仅是提升内容质量的技术手段,更是负责任创新的伦理要求。
语言模型生成文本的基本原理是什么?
二、参数的影响
第9课 学习内容
基于已有文本预测下一个有可能出现的词。
随机选取
“温度”参数
多样性
二、参数的影响
第9课 学习内容
1. 运行配套资源中的《聊天测试》软件。
2. 根据老师的提示,适当设置相关参数。
3. 多次输入要求“一句话简介人工智能”,观察每次得到的回复是否相同。
4. 将“温度”参数设置为0,然后重复问题,观察得到的回复是否相同。
5. 根据使用体验,分析“温度”参数对生成文本的影响。
第9课 学习内容
三、训练数据的影响
1.运行配套资源中的《简易问答》软件。
2.人为增加一条错误的问答数据,如“ADJ-ADB”,意思是“猫吃啥-猫吃狗”。
3.训练模型,然后输入问题ADJ(猫吃啥),看看模型的输出。可以发现,模型有很大的概率会给出错误的回答。
第9课 学习内容
三、训练数据的影响
4.输入多条重复的正确问答,如ADJ(猫吃啥)-ADC(猫吃鱼)。
5.训练模型,然后输入问题ADJ(猫吃啥),看看此时模型的输出。可以发现,后期输入的大量正确数据可以把模型的回答纠正过来。
第9课 学习内容
三、训练数据的影响
第9课 学习内容
三、训练数据的影响
当模型训练数据中混入少量错误数据时,可能导致输出偏差;但如果后续持续添加大量正确的样本,模型就能逐渐学会更准确的模式,从而降低错误数据的影响。
模型的学习能力有一定的容错性,关键在于高质量数据的数量和比例占优。与其追求训练数据的绝对“干净”,不如通过增加正确样本的数量来“稀释”错误数据带来的负面影响。
1. 大语言模型生成文本时,需要各种机制对生成内容进行限定来保证内容符合,文风一致等。
2. “温度”参数控制大语言模型生成文本的多样性。
3. 训练模型时使用的数据会对大语言模型生成的文本产生影响。
第9课 课堂总结
第9课 拓展与提升
可以选择一个自己熟悉的大语言模型,通过查阅资料,实验测试或分析技术文档来探究。
输入提示越清晰、信息越丰富,生成内容越准确、越相关。
不同版本或结构的模型在理解能力和内容生成能力上存在差异。
基于特定任务微调的模型在对应场景下表现更好,也更容易遵循用户意图。
你知道哪些因素会影响大语言模型的文本生成结果?
安全机制可能限制或修改生成内容,以避免不当内容输出。

展开更多......

收起↑

资源预览