求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

机械学习查看源代码讨论查看历史

跳转至: 导航搜索

来自 搜狐网 的图片

机械学习是中国的经济术语。

世界三大汉语词典分别是中国大陆的《 汉语大词典[1]》(共13册,5.6万词条,37万单词)、中国台湾的《 中文大辞典 》(共10册,5万词条,40万单词)以及日本的《 大汉和辞典 》(共13册,4.9万词条,40万单词)。汉字是记录汉语的文字[2],它已有六千年左右的历史,是世界上最古老的文字之一。

名词解释

所谓机械学习是一种单纯依靠记忆学习材料,而避免去理解其复杂内部和主题推论的学习方法。平时多称为死记、死背或死记硬背。

美国心理学家大卫·奥苏伯尔提出,与有意义学习相对的概念,指符号所代表的新知识与学习者认知结构中已有的知识建立非实质性的和人为的联系。如学生仅能记住乘法口诀表,形成机械的联想,但并不真正理解这些符号所代表的知识。

机械学习模式

机械学习是最简单的机器学习方法。机械学习就是记忆,即把新的知识存储起来,供需要时检索调用,而不需要计算和推理。

机械学习又是最基本的学习过程。任何学习系统都必须记住它们获取的知识。在机械学习系统中,知识的获取是以较为稳定和直接的方式进行的,不需要系统进行过多的加工。而对于其它学习系统,需要对各种建议和训练例子等信息进行加工处理后,才能存储起来。

当机械学习系统的执行部分解决好问题之后,系统就记住该问题及其解。我们可把学习系统的执行部分抽象地看成某个函数,该函数在得到自变量输入值(X_1,X_2,\cdots,X_n)之后,计算并输出函数值(Y_1,Y_2,\cdots,Y_p)。机械学习在存储器中简单地记忆存储对((X_1,X_2,\cdots,Xn),(Y_1,Y_2,\cdots,Y_p))。当需要f(X_1,X_2,\cdots,X_n)时,执行部分就从存储器中把(Y_1,Y_2,\cdots,Y_p)简单地检索出来而不是重新计算它。

Lenat,Hayes Roth,和Klahr等人于1979年关于机械学习提出一种有趣的观点。他们指出,可以把机械学习看成是数据化简分级中的第一级。数据化简与计算机语言编译类似;其目的是把原始信息变成可执行的信息。在机械学习中我们只记忆计算的输入输出,忽略了计算过程,这样就把计算问题化简成存取问题。

正像计算问题可以简化成存取问题一样,其它的推理过程也可以简化成较为简单的任务。例如推导可以简化成计算。比方说第一次要我们解一个一元二次方程的时候,我们必须使用很长的一段推导才能得出解方程的求根公式。但是一旦有了求根公式,以后再解一元二次方程时,就不必重复以前的推导过程,可以直接使用求根公式计算出根,这样就把推导问题简化成计算问题。同样地,归纳过程可以简化成推导过程。

例如我们可以在大量病例的基础上归纳总结出治疗的一般规律,形成规则,当遇见一个新病例时,我们就使用规则去处理它,而不必参照以前的众多病例推断解决办法。化简的目的,主要是为了提高工作效率。

机械学习的主要问题

注意3个重要的问题:存储组织,稳定性和存储与计算之间的权衡。

(a) 存储组织信息。显然,只有当检索一个项目的时间比重新计算一个项目的时间短时,机械学习才有意义,检索的越快,其意义也就越大。因此,采用适当的存储方式,使检索速度尽可能地快,是机械学习中的重要问题。在数据结构与数据库领域,为提高检索速度,人们研究了许多卓有成效的数据存储方式,如索引、排序、杂凑等等,在机械学习中我们可以充分利用这些成果来实现我们的要求。

(b) 环境的稳定性与存储信息的适用性问题。在急剧变化的环境下机械学习策略是不适用的。做为机械学习基础的一个重要假定是在某一时刻存储的信息必须适用于后来的情况。然而如果信息变换得特别频繁,这个假定就被破坏了。

(c) 存储与计算之间的权衡。因为机械学习的根本目的是改进系统的执行能力,因此对于机械学习来说很重要的一点是它不能降低系统的效率。比方说,如果检索一个数据比重新计算一个数据所花的时间还要多,那么机械学习就失去了意义。

这种存储与计算之间的权衡问题的解决方法有两种。一种方法是估算一下存储信息所要花费的存储空间以及检索信息时所花费的时间,然后将其代价与重新计算所花的代价比较,再决定存储信息是否有利。另一种方法是把信息先存储起来,但为了保证有足够的检索速度,限制了存储信息的量,系统只保留那些最常使用的信息,“忘记”那些不常使用的信息。这种方法也叫“选择忘却”技术。

参考文献