求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

變更

前往: 導覽搜尋

数据挖掘

增加 238 位元組, 2 年前
無編輯摘要
需要是发明之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种[[应用]],包括商务管理,[[生产]]控制,市场分析,工程设计和科学探索等。
数据挖掘是[[人工智能]] <ref>[https://www.sohu.com/a/244582810_401265 人工智能是什么?人工智能的概念简介] ,搜狐,2018-08-01</ref> 和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、[[统计学]]、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。知识发现过程由以下三个阶段组成:①数据准备;②数据挖掘;③结果表达和解释。数据挖掘可以与用户或知识库交互。
数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和[[规律]]表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种[[方法]]将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。
数据的类型可以是结构化的、半结构化的,甚至是异构型的。发现知识的方法可以是[[数学]]的、非数学的,也可以是归纳的。最终被发现了的知识可以用于信息管理、查询优化、决策支持及数据自身的维护等。
数据挖掘的对象可以是任何类型的数据源。可以是关系数据库 <ref>[https://www.sohu.com/a/320178859_505827 史上最全分布式数据库概述],搜狐,2019-06-12</ref> ,此类包含结构化数据的数据源;也可以是数据仓库、文本、[[多媒体]]数据、空间数据、时序数据、Web数据,此类包含半结构化数据甚至异构性数据的数据源。
发现知识的方法可以是数字的、非数字的,也可以是归纳的。最终被[[发现]]的知识可以用于信息管理、查询优化、决策支持及数据自身的维护等。
725,322
次編輯