http://www.5alw.com- 我爱论文网

网站资讯通告:我爱论文网提供论文代写,发表论文,代写毕业论文,代写硕士论文,职称论文发表等论文相关服务。
搜索: 您现在的位置: 我爱论文网 >> 论文考试 >> 毕业论文 >> 医学毕业论文 >> 正文

数据挖掘技能与用户常识获取(1)

作者:admin    论文来源:本站原创    点击数:    更新时间:2011-12-5

  数据挖掘是指从数据凑集中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概念、法则及模式等毕业论文。它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测将来可能发生的行动。数据挖掘的过程也叫常识发现的过程,它是一门波及面很广的穿插性新兴学科,波及到数据库、人工智能、数理统计、可视化、并行盘算等范围职称论文。数据挖掘是一种新的信息处理技术,其主要特点是对数据库中的大量数据进行抽取、转换、分析和其余模型化处理,并从中提取辅助决策的关键性数据。数据挖掘是KDD(Knowledge  Discovery  in  Database)中的重要技术论文代写,它并不是用尺度的数据库查询语言(如SQL)进行查问,而是对查询的内容进行模式的总结和内在法令的搜索。传统的查问和报表处理只是得到事件发生的结果,并不深入研讨发生的起因,而数据挖掘则主要理解产生的起因,并且以必定的相信度对未来进行预测,用来为决议举动供应有利的支持。
      2 数据挖掘的常用技术
  机器学习、数理统计等方法是数据挖掘进行常识学习的主要方法。数据挖掘算法的好坏将直接影响到所发现知识的好坏,目前对数据挖掘的研究也主要集中在算法及其应用方面。统计措施应用于数据挖掘重要是进行数据评估;机器学习是人工智能的另一个分支,也称为演绎推理,它通过学习训练数据集,发现模型的参数,并找出数据中隐含的规则。其中关系分析法、人工神经元网络、决定树跟遗传算法在数据挖掘中的应用很广泛代写职称论文
  1)关联分析法。从关联数据库中提取关联规则是多少种重要的数据挖掘方式之一。发掘关联是通过搜寻系统中的所有事物,并从中找到浮现条件概率较高的模式。关联实际上就是数据对象之间相关性确切定,用关联找出所有能将一组数据项跟另一组数据项相联系的规则,这种规矩的建破并不是判断的关联,而是一个存在一定信任度的可能值,即事件发生的概率。关联剖析法直观、易懂得,但对关系度不高或相干性复杂的情况不太有效。
  2)人工神经元网络(ANN),是数据挖掘中利用最普遍的技巧。神经网络的数据挖掘办法是通过模拟人的神经体系来重复练习学习数据集,从待分析的数据集中发明用于猜测和分类的模式。神经元网络对庞杂情形仍能得到正确的预测结果,而且能够处理种别和连续变量,但神经元网络分歧适处置高维变量,其最大的弊病是不透明性,因为其无奈说明成果是如何产生的,及其在推理进程中所用的规则论文。神经元网络合适于结果比可理解性更主要的分类和预测的复杂情况,可用于聚类、分类和序列模式。
  3)决策树(DT)是一种树型结构的预测模型,其中树的非终端节点表示属性,叶节点表示所属的不同类别。根据训练数据集中数据的不同取值建立树的分支,形成决策树。与神经元网络最大的不同在于其决策制定的过程是可见的,可能阐明结果是如何产生的。决策树一般发生直观、易懂得的规则,而且分类不需太多计算时间,适于对记录分类或结果的猜想,尤实在用于当目标是生成易理解、可翻译成SQL或自然语言的规则时。决策树也可用于聚类、分类及序列模式,其应用的典型例子是CART(回归决策树)方法。
  4)遗传算法(GA)是一种基于生物进化实际的优化技术。其基本观点是“适者生存”原理,用于数据挖掘中则常把任务表示为一种搜索问题,运用遗传算法富强的搜查才干找到最优解。实际上遗传算法是模仿生物进化的过程,反复进行决定、交叉和渐变等遗传操作,直至满足最优解。遗传算法可处理很多数据类型,同时可并行处理各种数据,常用于优化神经元网络,解决其余技能难以解决的问题,但需要的参数太多,对良多问题编码艰难,个别打算量大。
“数据挖掘技能与用户常识获取(1)”版权归作者所有,转载请著名出处。  
Tags:全部  
责任编辑:admin

联系方式

我爱论文网提供毕业论文代写,职称论文发表等相关论文服务,如有需要请通过下面的联系方式联系我们:
如需通过企业QQ咨询请点击
我们的专用企业QQ号码是:4000290153
电话咨询请拨打免费电话:400-029-0153
邮件咨询地址:4000290153@b.qq.com
  • 此栏目下没有推荐论文
设为首页 | 加入收藏 | 友情链接 | 版权申明 | 网站地图