導覽
近期變更
隨機頁面
新手上路
新頁面
優質條目評選
繁體
不转换
简体
繁體
3.128.95.217
登入
工具
閱讀
檢視原始碼
特殊頁面
頁面資訊
求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。
檢視 维数约简 的原始碼
←
维数约简
前往:
導覽
、
搜尋
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" align="right" |- | style="background: #FF2400" align= center| '''<big>维数约简</big>''' |- |<center><img src=https://p5.ssl.qhimgs1.com/sdr/400__/t0192fa4cb1da6aa2c5.jpg width="300"></center> <small>[https://www.so.com/s?src=lm&ls=s112c46189d&q=%e7%bb%b4%e6%95%b0%e7%ba%a6%e7%ae%80&lmsid=94f4dc112c0f32b4&lm_extend=ctype:3 来自 360娱乐网 的图片]</small> |} '''<big>维数约简<big>'''是机器学习[[领域]]中一个重要的研究方向。近年来,高维[[海量]]不[[可控]]数据的[[现状]],[[维数]]约简算法又一次成为人们关注的[[焦点]]。 <ref>[https://baike.so.com/doc/7034525-7257430.html 维数约简]</ref> ==基本信息== 中文名称 维数约简 外文名称 Dimensionality reduction 意义 防止了维数灾难的发生 目的 去除噪声的影响 ==定义== 维数约简:Dimensionality reduction 维数约简又称为降维,是机器学习的一种必要手段。若数据库X是属于n维空间的,通过特征提取或者特征选择的方法,将原空间的维数降至m维,要求m远小于n,满足:m维空间的特性能反映原空间数据的特征,这个过程称之为维数约简。 ==意义== 维数约简是相对于维数灾难或者说是高维数据来提出的,很明显,其意义就是降低原来的维数,并保证原数据库的完整性,在约简后的空间中执行后续程序将大大减少运算量,提高数据挖掘效率,且挖掘出来的结果与原有数据集所获得结果基本一致。更广泛的说就是防止了维数灾难的发生。 ==提出背景== 在科学研究中,我们常常要对数据进行处理,而这些数据通常位于一个高维空间中,例如当处理一个256*256 的图像序列时,我们需要将其拉成一个向量,这样,我们就得到了65536维的数据,如果直接对这些数据进行处理,会有以下问题:首先,会出现所谓的"维数灾难"问题,巨大的计算量将使我们无法忍受;其次,这些数据通常没有反映出数据的本质特征,如果直接对他们进行处理,不会得到理想的结果。所以,通常我们需要首先对数据进行维数约简,然后对约简后的数据进行处理。当然要保证约简后的数据特征能反映甚至更能揭示原数据的本质特征。 通常,我们进行数据维数约简主要是基于以下目的: 1、压缩数据以减少存储量 2、去除噪声的影响 3、从数据中提取特征以便进行分类 4、将数据投影到低维可视空间,以便于看清数据的分布 对付高维数据问题基本的方法就是维数约简,即将n 维数据约简成m(M<<N)维数据,并能保持原有数据集的完整性,在m 上进行数据挖掘不仅效率更高,且挖掘出来的结果与原有数据集所获得结果基本一致。分析现有的数据挖掘模型,用于数据维数约简的基本策略归纳起来有两种:一种是从有关变量中消除无关、弱相关和冗余的维,寻找一个变量子集来构建模型。换句话说就是在所有特征中选择最优代表性的特征,称为特征选择。另一种特征提取,即通过对原始特征进行某种操作获取有意义的投影。也就是把n 个原始变量变换为m 个变量,在m上进行后续操作。 ==參考來源== {{Reflist}} [[Category:揭密生活]]
此頁面使用了以下模板:
Template:Main other
(
檢視原始碼
)
Template:Reflist
(
檢視原始碼
)
模块:Check for unknown parameters
(
檢視原始碼
)
返回「
维数约简
」頁面