资源简介 (共14张PPT)加工数据——数据清洗(第四课时)年 级:一年级学 科:中职信息技术思考:获取的数据能直接进行分析吗?数据也需要清洗!文本清洗图片清洗视频清洗声音清洗广义地说:数据清洗包括文本、声音、图片、视频等的清洗。应用场景智慧养老智慧金融智能语音智能文娱清洗对象……代码编程可视化操作数据清洗平台数据清洗完毕数据清洗:是指把初始数据进行纠正,包括检查数据一致性,处理无效值、重复值和缺失值等,洗掉“脏”数据,最后形成合格的数据的过程。重复值无效值不一致缺失值洗掉“脏”数据数据清洗:是指把初始数据进行纠正,包括检查数据一致性,处理无效值、重复值和缺失值等,洗掉“脏”数据,最后形成合格的数据的过程。数据重复数据缺失数据无效数据格式不一致“脏” 数据问题数据分析结果将影响护理工作中,甚至发生严重失误!思考:如何进行数据清洗呢?工具1数据重复2数据缺失4数据无效解决方法存在问题数据格式不一致31删除重复值2查空值填补4条件判断统一格式处理31数据重复方法:删除重复项1数据缺失方法:查空值填补1数据格式不一致方法:统一格式处理1数据无效方法:条件判断任务根据所学的数据质量的常见问题,请同学们对照自己采集的数据,结合以前学过的相对应的方法,对有问题的数据进行数据清洗,并把完成后的数据文件上传到超星平台上 展开更多...... 收起↑ 资源预览