【备考点拨】:本章节内容为2020年教材新增内容,2021版教材予以保留,预计大概率今年还会继续考!本部分内容从2020年的考查形式来看考查较简单,主要是“匹配”,利用好2020年的真题,学会举一反三。
考点一:数据科学
数据科学 | 内容 |
提出 | 丹麦计算机科学领域先驱,彼得 • 诺尔 |
定义 | 通过系统性研究获取与数据相关的知识体系的学科。一方面研究数据本身的特性和变化规律,另一方面为自然科学和社会科学提供揭示自然和人类行为的现象和规律。 |
研究对象 | 数据 |
研究目标 | 获得洞察力和理解力 |
研究过程 | 从“数据”整合成“信息”进而组织成“知识”。(包含对数据进行采集、存储、处理、分析、表现等一系列活动。) |
考点二:大数据
大数据 | 内容 |
定义 | 无法在一定时间范围内用常规软件工具捕捉、管理和处理的数据集合 |
4V 特性 | (1)数据量大; (2)数据多样性: 结构化数据:存储在数据库,用二维表结构实现表达的数据 半结构化数据:介于完全结构化数据和完全非结构化数据之间 非结构化数据:数据结构不规则或不完整、没有预定义的数据 (3)价值密度低 (4)数据的产生和处理速度快 |
考点三:数据挖掘
数据挖掘 | 内容 |
含义 | 从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中 ,提取隐藏又有潜在价值的信息和知识的过程。 (1)数据源真实、大量、有噪声; (2)发现的是用户感兴趣的知识; (3)发现的知识是可接受、可理解、可运用的; (4)不要求发现放之四海而皆准的知识,仅支持特定的发现问题 |
出发点 | 解决实际问题 |
核心任务 | 对数据关系和特征进行探索 |
类别 | 有指导学习或监督学习;无指导学习或非监督学习 |
算法 | 分类、聚类分析、关联分析、趋势与演化分析、特征分析、异常分析等。 (1)分类:确定目标对象属于哪个预定类别,以实现对未来潜在的预测需求。 (2)聚类分析:把一组数据按照差异性和相似性分为几个类别使同类的数据相似性大,不同类数据相似性小,跨类数据关联性尽可能低。 (3)关联分析:对数据集中反复出现的相关关系和关联性进行挖掘提取,根据一个数据项的出现预测其他数据项的出现。 (4)趋势与演化分析:包括数据变化趋势、序列模式分析、周期性分析以及相似程度分析等内容,统计学的回归分析方法经常用于这类问题的分析。 |
考点四:数据可视化
1、数据可视化:借助图形化手段清晰有效地传达与沟通信息。
2、数据可视化
(1)科学可视化:面向科学与工程领域的数据。
(2)信息可视化:处理对象是非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据。
经典真题:
1、关于大数据多样性的说法正确的有( )
A、大数据包括半结构化数据
B、大数据必须是结构规则、完整的数据
C、大数据包括结构化数据
D、大数据包括非结构化数据
E、地理位置是大数据的一种类型
2、关于数据挖掘的说法,正确的有( )。
A、数据源必须是真实的、大量的、无噪声的
B、发现的是用户感兴趣的知识
C、发现的知识是可接受、可理解、可运用的
D、并不要求发现放之四海而皆准的知识仅支持特定的发现问题。
E、核心任务是对数据关系和特征进行探索
中级经济师考试报名中,今年通关取证在此一举!
现在购课75折,送新版教材+历年真题汇编+题库VIP,详情戳>>>
温馨提示:文章由作者233网校-py独立创作完成,未经著作权人同意禁止转载。