数据挖掘心得体会
【篇一:数据挖掘课程体会】
数据挖掘课程体会
学习数据挖掘这门课程已经有一个学期了,在这十余周的学习过程中,我对数据挖掘这门课程的一些技术有了一定的了解,并明确了一些容易混淆的概念,以下主要谈一下我的心得体会。
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。数据挖掘就是从大量的数据中,抽取出潜在的、有价值的知识、模型或规则的过程。作为一类深层次的数据分析方法,它利用了数据库、人工智能和数理统计等多方面的技术。
要将庞大的数据转换成为有用的信息,必须先有效率地收集信息。随着科技的进步,功能完善的数据库系统就成了最好的收集数据的工具。数据仓库,简单地说,就是搜集来自其它系统的有用数据,存放在一整合的储存区内。所以其实就是一个经过处理整合,且容量特别大的关系型数据库,用以储存决策支持系统所需的数据,供决策支持或数据分析使用。
数据挖掘的研究领域非常广泛,主要包括数据库系统、基于知识的系统、人工智能、机器学习、知识获取、统计学、空间数据库和数据可视化等领域。主要是可以做以下几件事:分类、估计、预测、关联分析、聚类分析、描述和可视化、复杂数据类型挖掘。在这里就不一一介绍了。
在学习关联规则的时候,提出了一个关于啤酒与纸尿布的故事:在一家超市里,纸尿布与啤酒被摆在一起出售,但是这个奇怪的举措却使得啤酒和纸尿布的销量双双增加了。其实,这是由于这家超市对其顾客的购物行为进行购物篮分析,在这些原始交易数据的基础上,利用数据挖掘方法对这些数据进行分析和挖掘。从而意外的发现跟纸尿布一起购买最多的商品竟是啤酒。按我们的常规思维,啤酒与纸尿布是两个毫无关联的商品,但是借助数据挖掘技术对大量交易数据进行挖掘分析后,却可以寻求到这一有价值的规律。这个故事在一定程度上说明了数据挖掘技术的巨大价值。
总之,非常感谢周教员在这十余周的精彩授课,让我受益匪浅,我会继续学习这门课程,努力为今后的课题研究或论文打好基础。
【篇二:数据挖掘讲课心得体会】
数据挖掘讲课心得体会
今年的数据仓库与数据挖掘课程,任课老师布置每人讲一章,并课中研讨的授课方式,我非常赞同这种自己备课,自己上去讲课并课中和同学研讨、最终老师点评的做法,因为他能让自己更好理解文章,同时又可以锻炼自己的表达能力。
我主讲《数据仓库与数据挖掘技术》中的第二章“知识发现过程与应用结构”,在整个备课和讲课当中,存在很多不足,备课时参考的书目太少,使得在讲课时关于概念和文章出现的例子不能进行相关扩展和补充,也不能用生活中通熟易懂的例子来阐述书本中的抽象概念;讲课时更多的按着ppt所写进行概略性的讲述,没有形成自己的逻辑思维体系,我也知道,讲课是门艺术,不是几次就能掌握的,要经过不断的实践积累经验,不断的研读相关书目,形成自己的“知识树”的基础上,才能对所讲的知识融会贯通。台湾有位教育家曾说:如果你要讲一
门,至少要对该门课的五至六本经典教材研读几遍,形成相应的知识树之后才好授课,这是题外话。
关于数据挖掘每一章算法的授课,我认为在有限的时间里先把一个核心算法解释清楚,对其他算法可以简略带过(最后一次课xxx对pagerank的讲解就很到位),因为,后面算法一般是前面所讲算法的一种改进。算法讲解时,除了要对该算法的原理和概念讲述清楚之外,要对该算法的实例最好用板书的形式解释清楚,并演算每一步,而不是拘泥于ppt进行讲解。板书字体可大可小,速度可快可慢,可以写
写停停,也可以一气呵成,可以边写边讲,也可以只写不讲。而ppt是则是死的东西,参考的内容也是书上的步骤,而不是授课人自己的理解,在讲解过程中,不利于学生的理解和认识。讲解的过程中,语速要适当放慢,语速太快是所有人刚开始讲课的通病,我也不例外,讲课讲得很快,自己的思维被打乱不说,主要下面的同学不能理解,毕竟讲课不是演讲。
对于上学期的一页纸开卷,我非常赞同这种考试方式,毕竟对于理工类课程,公式很长,又特别难记,我们在理解其思想的基础上,完全没必要再记很长的公式,在考试的过程中,可以相应的记录些公式带入考场。
以上是我个人在讲课和听课过程、及其考试过程中的一些总结和体会。
【篇三:大数据学习总结】
《大数据时代》读后感
一、学习总结
1、关于作者
年潜心研究数据科学的技术权威,他是最早洞见大数据时代发展趋势
的数据科学家之一。
2、关于大数据
1)大数据是什么
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4v特点:volume(大量)、velocity((高)速率)、variety(多样性)、veracity(真实)。大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。
2)大数据的来源
所谓的“big data”是由ibm和gartner分析师提出的概念,我们比较时髦的称其为大数据。
3)大数据现状、应用
通过分析和优化企业数据实现一种对未来的企业运营的精准的预测能力。采用一系列的技术,从技术中获得洞察力,也就是bi或者分析;另外一个是分析路径,寻找关键绩效指标,从仪表盘这样的工具进行数据分析,实现预测性工作。
4)大数据未来
fayyad曾被视为数据挖掘领域的no.1,他用下图向我们解释了为什么说分析是大数据未来的发展方向。
3、关于大数据时代
1)思维变革
更多:不是随机样本,而是全体数据;“样本=总体”。
更杂:不是精确性,而是混杂性;允许不精确,最大化利用全体数据。
更好:不是因果关系,而是相关关系;“是什么”,而不是“为什么”。
2)商业变革
数据化:一切皆可“量化”;关注信息本身。
价值:发现、利用数据的价值。
角色定位:大数据掌控、大数据技术、大数据思维的三足鼎立。
3)管理变革
责任:数据来源有效性、数据存储安全性、数据使用合法性。
自由:反对数据垄断大亨。
二、读后感
1、大数据时代,是名符其实的“信息社会”
经历了口口相传、纸媒传播,到现在的网络技术,我们可以获得比以前更多的信息并进行分析,可以从更多的维度诠释世界。
通讯技术的发展,促进了个人/组织在信息获取上的平等发展,数据不再是限制我们努力的因素了。数据的的爆炸式产生,促使我们必须从海量的信息中做出选择、掌握数据挖掘技术和筛选工具。
2、大数据技术支持预测工作
大数据技术越完善,我们越能更快更全面的获得更多的有效数据,预测则越准确。
3、知识管理迫在眉睫
大数据的未来是数据分析,而分析的目的是转化为经验、规律、总结??,它们的集合就是知识。知识是个人/组织成长的直接推动因素。
知识管理要遵循积累原则(知识积累是实施知识的管理基础)、共享原则(一个组织内部的信息和知识要尽可能公开,使每一个员工都能接触和使用公司的知识和信息)、交流原则(知识管理的核心就是要在公司内部建立一个有利于交流的组织结构和文化气氛,使员工之间的交流毫无障碍)。这三原则不正是大数据技术的组织基础吗?
三、在工作中的而应用
1、关注运作工作向数据管理方向的转化
在仓储工作中,为物品对象(仓库、货物、设备、员工等)、流程对象(如作业、异常处理、管理等)建立属性列表,关注数据积累。
同时,关注仓储数据与运输、客服、园区等各方面环境数据的对应。
2、重视数据挖掘,提高数据分析能力
根据运作问题和目标,通过数据挖掘和分析,寻找有效的数据指标。通过对关键指标的趋势预测,发现潜在风险、发掘改善途径。
3、推动数据转化,促进建立知识管理系统
在实际工作中,重视对裸数据、经验、执行文件的管理,引导各项目的知识转化。建立从数据积累、知识转化(数据到知识、隐性知识到显性知识、个体知识到组织知识等)、知识共享的知识管理体系,形成仓储管理知识体系及其良性循环。
(正文结束)
因篇幅问题不能全部显示,请点此查看更多更全内容