资源简介 第五章数据处理和可视化表达选择题关于大数据的特征说法中不正确的是( )数据体量巨大。从TB级别跃升到PB级别。数据类型繁多价值密度低大数据时代研究的数据如此之多,追求的不是精确性,而是模糊性。在目前计算机中,硬盘容量大多是( )B级。TPBD在信息系统中,系统日志包括操作系统日志、( )和安全日志。应用程序日志信息日志算法日志以上都是URL指的是( )应用程序接口网络爬虫统一资源定位符以上都不正确( )已经成为存储发展的一种趋势,其技术也日益成熟。U盘云存储数据库以上全不正确数据特征探索的主要任务是对数据进行预处理,发现和处理( ),绘制直方图,观察分析数据的分布特征。缺失值、异常数据数据之间的关联性数据的规律以上全不正确K-平均算法是一种经典的( )算法。关联分析数据分类聚类分析数据可视化数据分类是数据分析处理中最基本的方法。数据分类通常的做法是,基于样本数据先训练构建分类函数或者分类模型(也称分类器),该分类器具有将待分类数据项映射到某一特点类别的功能。下面的示意图①②③应该是( )输入 训练 预测输入 预测 训练预测 输入 训练训练 输入 预测数据可视化表达可以更加直观形象地呈现数据,下列关于数据可视化表达不合理的是( )利用拆线图呈现微博热议变化趋势利用饼图反映农副产品价格与节假日关系利用柱形图展示娱乐节目参赛选手得票情况利用雷达图对比两个用户在购买频率、购买商品种类等5个维度上的差异10.两个篮球运动员的场均得分可能有较大差别,但他们的场均篮板、推断和盖帽数据却可能非常接近。要探寻两个球员赛季各项数据的差异和联系,可选用( )。A.拆线图B.饼图C.散点图D.雷达图判断题利用电子表格软件处理数据时,一般用饼图表示事物随时间变化的趋势。( )数据可视化表达工具Seaborn是独立于Matplotlib的。( )Bokeh也是一个很好的可视化库,可实现交互式可视化。它的重点在其交互性,且是通过浏览器以数据驱动文档的风格呈现。( )数据分析就是在一大批杂乱无章的数据中,运用数字化工具和计算方法,探索数据内在的结构的规律,探究数据本身的价值,为后面的决策提供依据。( )数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛快速通往心灵。( )三、简答题请写出生成词云图至少所需要的3种第三方库并说明这3种库各自的作用。第五章数据处理和可视化表达选择题关于大数据的特征说法中不正确的是( C )数据体量巨大。从TB级别跃升到PB级别。数据类型繁多价值密度低大数据时代研究的数据如此之多,追求的不是精确性,而是模糊性。在目前计算机中,硬盘容量大多是( A )B级。TPBD在信息系统中,系统日志包括操作系统日志、( A )和安全日志。应用程序日志信息日志算法日志以上都是URL指的是( C)应用程序接口网络爬虫统一资源定位符以上都不正确( B)已经成为存储发展的一种趋势,其技术也日益成熟。U盘云存储数据库以上全不正确数据特征探索的主要任务是对数据进行预处理,发现和处理( A ),绘制直方图,观察分析数据的分布特征。缺失值、异常数据数据之间的关联性数据的规律以上全不正确K-平均算法是一种经典的( C)算法。关联分析数据分类聚类分析数据可视化数据分类是数据分析处理中最基本的方法。数据分类通常的做法是,基于样本数据先训练构建分类函数或者分类模型(也称分类器),该分类器具有将待分类数据项映射到某一特点类别的功能。下面的示意图①②③应该是( A)输入 训练 预测输入 预测 训练预测 输入 训练训练 输入 预测数据可视化表达可以更加直观形象地呈现数据,下列关于数据可视化表达不合理的是( B )利用拆线图呈现微博热议变化趋势利用饼图反映农副产品价格与节假日关系利用柱形图展示娱乐节目参赛选手得票情况利用雷达图对比两个用户在购买频率、购买商品种类等5个维度上的差异10.两个篮球运动员的场均得分可能有较大差别,但他们的场均篮板、推断和盖帽数据却可能非常接近。要探寻两个球员赛季各项数据的差异和联系,可选用( D)。A.拆线图B.饼图C.散点图D.雷达图判断题利用电子表格软件处理数据时,一般用饼图表示事物随时间变化的趋势。(F)数据可视化表达工具Seaborn是独立于Matplotlib的。( F)Bokeh也是一个很好的可视化库,可实现交互式可视化。它的重点在其交互性,且是通过浏览器以数据驱动文档的风格呈现。(T)数据分析就是在一大批杂乱无章的数据中,运用数字化工具和计算方法,探索数据内在的结构的规律,探究数据本身的价值,为后面的决策提供依据。(T)数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛快速通往心灵。(T)三、简答题请写出生成词云图至少所需要的3种第三方库并说明这3种库各自的作用。解:至少需要的3个库:jieba、Wordcloud、matplotlib。Jieba:因为要把一份待分析的文本数据的句子和段落划分成词,需用jieba库。Wordcloud:分词之后,就需要根据分词结果生成词云,这个过程需要用到Wordcloud库Matplotlib:需要用matplotlib库中的pyplot来绘图 展开更多...... 收起↑ 资源预览