数据挖掘工程师试题库数据仓库就是一个面向主题的、集成的、()、反映历史变化的数据集合元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓数据处理通常分成两大类:联机事务处理和()多维分析是指以“维”形式组织起来的数据采取切片、切块、()和旋转ROLAP是基于()的OLAP实现,而MOLAP是基于多维数据结数据仓库按照其开发过程,其关键环节包括()、数据存储于管理和数据操作型数据存储实际上是一个集成的、面向主题的、可更新的、()、企“实时数据仓库”以为着源数据系统、决策支持服务和仓库仓库之间以一从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主调和数据是存储在()数据仓库和操作型数据存储中的数据。抽取、转换、加载过程的目的是为决策支持应用提供一个()、权威数据数据抽取的两个常见类型是静态抽取和增量抽取。静态抽取用于()填充使用星型模式可以从一定程度上()查询效率。因为星型模式中数据的组维度表一般又主键、分类层次和描述属性组成。对于主键可以选择两种方雪花型模式是对()维表的进一步层次化和规范化来消除冗余的数据。数据仓库中存在不同综合级别的数据。一般把数据分成4个级别:()、SQL Server SSAS提供了所有业务数据的同意整合试图,数据仓库的概念模型通常采用信息包图法来进行设计,要求将其5个组成数据仓库的()通常采用星型图法来进行设计,要求将星型的各类逻辑实确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根在项目实施时,根据事实表的特点和拥护的查询需求,可以选用()、业当维表中的主键在事实表中没有与外键关联时,这样的维称为()。它于维度可以根据其变化快慢分为元变化维度、()维度和剧烈变化维度三类数据仓库的数据量通常较大,且数据一般很少更新,可以通过设计和优化数据仓库数据库常见的存储优化方法包括()、反向规范化引入冗余、表分类器设计阶段包含三个过程:划分数据集、分类器构造和()分类问题中常用的评价准则有精确度、查全率和查准率和()支持向量机中常用的核函数有多项式核函数、径向基核函数和()聚类分析包括连续型、二值离散型、()和混合类型4种类型描述属性的连续型属性的数据样本之间的距离有欧氏距离、曼哈顿距离和()更多试题请关注下方微信公众号