第9课文本生成的影响因素课件（19张PPT）

资源简介

(共19张PPT)
第9课　
文本生成的影响因素
第二单元　文本的智能生成
第9课课堂导入
问题情境
影响文本生成的因素有哪些？
如何保证大语言模型生成的文本质量？
第9课学习内容
一多角度审核
二参数的影响
学习内容
三训练数据的影响
一、多角度审核
第9课学习内容
模型在生成文本时，获得不同候选词的概率后，往往还需通过各种机制对生成内容进行限定。
一、多角度审核
第9课学习内容
角色扮演——多约束叙事挑战
1.明确学习任务：分工扮演不同角色，协同生成具有悬疑风格的文本。
2.选择角色。
3.确定续写任务。
4.选择续写方式，进行续写审核工作。
第9课学习内容
选择角色
一、多角度审核
一、多角度审核
第9课学习内容
续写任务
生物标本室传来玻璃碎裂声，科学社成员小华用手电一照，突然发现___________________________
续写方式
方式一：选择排位靠前的一项；
方式二：一次保留多个备选文本。
一、多角度审核
第9课学习内容
角色反馈
纪律委员字数是否符合
道德观察员内容是否血腥
文风质检员风格是否符合
方式一续写：__________________ 方式二续写：___________________
___________________
___________________
结论：___________________________ 结论：___________________________
蝴蝶标本柜有带血抓痕
少于150字，通过
悬疑风十足，通过
尝试下一个候选者
“血”可能涉嫌暴力，否定
一、多角度审核
第9课学习内容
角色反馈
纪律委员字数是否符合
道德观察员内容是否血腥
文风质检员风格是否符合
方式一续写：__________________ 方式二续写：___________________
___________________
___________________
结论：___________________________ 结论：___________________________
少于150字，通过
A.破碎的颅骨
B.碎裂的容器
C.未知生物骨骼
A血腥，其他还好
B平淡，其他还好
选C
蝴蝶标本柜有带血抓痕
尝试下一个候选者
一、多角度审核
第9课学习内容
5.进行多轮操作后，整理获得的文本，查看生成效果。
6. 选择大语言模型进行续写并查看续写效果。
[输入]
续写，不超过150字，悬疑风格，适合中学生，不能有暴力等不合适的内容。
文本：生物标本室传来玻璃碎裂声，科学社成员小华用手电一照，突然发现_______
[输出]
本该浸泡在福尔马林液中的蝴蝶标本全部消失了，只剩下空荡荡的容器。小华屏住呼吸，忽然听到细微的振翅声。抬头一看，成百上千只本应死去的蝴蝶正诡异地悬停在半空，翅膀闪烁着不自然的荧光……
一、多角度审核
第9课学习内容
一起来说一说是否有必要从多角度约束文本智能生成？
有必要。因为：
·不同角色约束机制相互制衡，道德观察员维护内容安全性，文风质检员确保风格的统一性。
·方式二的多候选机制通过并行评估，提高了优质内容的产出效率。
·约束机制不仅是提升内容质量的技术手段，更是负责任创新的伦理要求。
语言模型生成文本的基本原理是什么？
二、参数的影响
第9课学习内容
基于已有文本预测下一个有可能出现的词。
随机选取
“温度”参数
多样性
二、参数的影响
第9课学习内容
1. 运行配套资源中的《聊天测试》软件。
2. 根据老师的提示，适当设置相关参数。
3. 多次输入要求“一句话简介人工智能”，观察每次得到的回复是否相同。
4. 将“温度”参数设置为0，然后重复问题，观察得到的回复是否相同。
5. 根据使用体验，分析“温度”参数对生成文本的影响。
第9课学习内容
三、训练数据的影响
1.运行配套资源中的《简易问答》软件。
2.人为增加一条错误的问答数据，如“ADJ-ADB”，意思是“猫吃啥-猫吃狗”。
3.训练模型，然后输入问题ADJ（猫吃啥），看看模型的输出。可以发现，模型有很大的概率会给出错误的回答。
第9课学习内容
三、训练数据的影响
4.输入多条重复的正确问答，如ADJ（猫吃啥）-ADC（猫吃鱼）。
5.训练模型，然后输入问题ADJ（猫吃啥），看看此时模型的输出。可以发现，后期输入的大量正确数据可以把模型的回答纠正过来。
第9课学习内容
三、训练数据的影响
第9课学习内容
三、训练数据的影响
当模型训练数据中混入少量错误数据时，可能导致输出偏差；但如果后续持续添加大量正确的样本，模型就能逐渐学会更准确的模式，从而降低错误数据的影响。
模型的学习能力有一定的容错性，关键在于高质量数据的数量和比例占优。与其追求训练数据的绝对“干净”，不如通过增加正确样本的数量来“稀释”错误数据带来的负面影响。
1. 大语言模型生成文本时，需要各种机制对生成内容进行限定来保证内容符合，文风一致等。
2. “温度”参数控制大语言模型生成文本的多样性。
3. 训练模型时使用的数据会对大语言模型生成的文本产生影响。
第9课课堂总结
第9课拓展与提升
可以选择一个自己熟悉的大语言模型，通过查阅资料，实验测试或分析技术文档来探究。
输入提示越清晰、信息越丰富，生成内容越准确、越相关。
不同版本或结构的模型在理解能力和内容生成能力上存在差异。
基于特定任务微调的模型在对应场景下表现更好，也更容易遵循用户意图。
你知道哪些因素会影响大语言模型的文本生成结果？
安全机制可能限制或修改生成内容，以避免不当内容输出。

展开更多......

收起↑

请用微信扫码

第9课 文本生成的影响因素 课件（19张PPT）

第9课 文本生成的影响因素 课件（19张PPT）

第9课文本生成的影响因素课件（19张PPT）

第9课文本生成的影响因素课件（19张PPT）