资源简介 秘密★启用前【考试时间:12月4日14:30-17:00】重庆一中高2027届高一上期期中考试语文试题卷注意事项:1.答卷前,考生务必将自己的姓名、准考证号码填写在答题卡上。2.作答时,务必将答案写在答题卡上。写在本试卷及草稿纸上无效。3.考试结束后,将容题卡交回。一、现代文阅读(35分)(一)现代文阅读I(本题共5小题,19分)阅读下面的文字,完成1一5题。材料一:数据是驱动人工智能发展的“燃料”,训练人工智能摸型尤其是大模型需要海量数据,但互联网中公开可用的敛据已越发不能满足所需,甚至面临数据短缺困境。同时,一系列实践又表明,人工智能合成数据具有一定的有效性。人工智能合成数据是由计算机模拟技术或机器学习算法生成的自标注信息。作为真实数据的人工替代品,合成数据既能呈现原始数据的统计属性,又能实现数据合规性与效用之间的平衡,可以有效助推机器学习的发展。但与此同时,人工智能合成数据也带来了一系列社会伦理隐忧。一是合成数据制造算法“无风险神话”。训练数据果的偏差与可识别性是导致算法产生诸多社会伦理风险的主要原因。更进一步而言,数据具有“属人性”,数据的产生与人类的在线活动是闷时的,由此数据集才映射数据主体的个人信息、蕴合人奥社会偏见并导玫数据集偏差,造成各种类型的算法风险。但合成数据的生成方式决定了它摆脱“属人性”而具有“虚构性”:敛据增强、生成模型和模拟环境是合成数据的三种方式,它们从对现实数据进行局部修改,到利用生成对抗网络等模型生成,再到从完全虚拟的环境中生成,“属人性”退速减弱而“虚构性”持续增强,直至与数据主体无任何直接关联。可以说,合成数据被视为一项无风险技术,是有效解决算法风险的良方。然而,在全面、客观、中立、无归属面具下的合成数据技术,实际上是一种特定的风险技术:不仅片面地将数据偏差视为算法风险的主要甚至唯一原因,忽视算法设计本身的因素,而且在抹去数据主休身份、性别、种族等特征的同时,实际上已成为一种新型的权力模式,决定着在社会和不同群体之间如何分配风险。二是一。由于合成数据既能保持原始数据的统计属性,又不由任何数据主体直接产生、不属于任何特定主体,因此被视为一种隐私增强技术,能够在发挥数据效用的同时有效保护个人身份信息。然而,在保护隐私的初表下,合成数据的生成过程暗藏着隐私泄露的风险。合成数据不是完全从零开始创建合成,而是仍需要借助年实数据来训练。因此,尽管生成过程复杂,但仍存在“再识别”风险。尤其是合成数据与源数据过度拟合、合成数据中异常值遵遇成员推理攻击、合成数据无法防止的属性泄露三种情况,会导致合成数据存在较大的隐私泄露风险。由此,造成了作为隐私增强技术的合成数据却不能有效保护隐私的饽论。更进一步而言,此学论升级了数字时代的隐私困境一自决图境:合成数据生成之初合规性地使用源数据,但在其后的二次利用甚至数次利用中,返回源数据主体并保降他们的信息自决权,或过于严苛戏不切实际。由此,数据主体对自身数据是否披露与使用的终极掌控权也无从实现。语文试卷第1页共8页 展开更多...... 收起↑ 资源预览