您的位置:首页 > 活动 > 培训 > 走进高校 > 最新动态

CCF@U519:于戈、李瑞轩走进燕山大学

2017年6月17日上午,“CCF走进高校”活动来到燕山大学。CCF沈阳主席、东北大学教授于戈应邀作了题为《大数据应用与数据科学人才培养》的专题报告,华中科技大学李瑞轩教授应邀作了题为《大数据技术挑战与应用创新》的专题报告,燕山大学信息科学与工程学院的师生代表共100余人聆听了本次报告,报告由信息科学与工程学院院长任家东主持。

报告通过介绍大数据的基本概念、特征和面临的科学问题,分析数据产生方式的变化,对比大数据与数据库的差异,揭示大数据管理的本质挑战,特别是大数据所面临的数据集成、在线分析、隐私泄露等问题,最后还介绍了大数据研究和实践的具体案例。报告内容丰富精彩,受到师生们的一致好评。本次CCF走进燕山大学活动取得圆满成功。

演讲之后,同学们积极举手提问,两位讲者与在场同学进行了热烈的互动交流。

IMG_5179

于戈作报告

IMG_5180

李瑞轩作报告

IMG_5182

活动现场

会后合影

听众感言:

学院:信息科学与工程学院     姓名:王玉乾

今天在信息馆401听取了于戈教授和李瑞轩教授关于大数据的讲座,两位老师用独有的语言魅力让我们对大数据领域产生了浓厚的兴趣。首先,两位老师都对大数据的基本概念进行了介绍,大数据是指无法一定时间内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据具有5 v特点:volume(大量)、velocity(高速)、variety(多样)、value(低价值密度)、veracity(真实性)。于戈老师主要介绍了大数据的应用领域以及数据的基本概念、特征和面临的科学问题。只有对大数据进行合理的分析挖掘,才能从中得到大智慧,于戈老师还对此进行举例论证,如在用户网上购物的过程中,会产生一定的用户点击流,这就是大数据过程中的数据采集过程。其次通过对用户点击流进行关联挖掘,可以发现用户在购物过程中产生的偏好和个人习惯。商家可以针对用户的购买偏好,为每位顾客进行商品推荐,提供个性化服务,进而产生经济效益,这就是数据产生效益的过程。另外大数据还可以应用到电子商务、社交网络分析、电信业流量经营、移动服务产品推荐、智慧城市、智慧交通等多个领域,为我们的日常生活提供方便和快捷。李瑞轩老师不仅对大数据的基本概念进行了解释,还介绍了华中科技大学大数据实验室的研究内容和现状,让我们对大数据的开发软件、框架等有了进一步的了解,让我们知道,大数据的研究不仅仅样对大数据进行分析挖掘,怎样对分析结果进行可视化等等。同时,在研究大数据的时还要注意数据安全。个人信息泄露现在已经不是新鲜事了,各种诈骗短信就是通过盗取个人隐私信息,给受骗人发短信、打电话等方式,用这样的方式骗取大家的财产。各种网站都需要实名认证,但是这样的实名认证也确实容易泄露用户的个人信息。为了能继续对大数据进行研究,我们需要这样的实名认证,但为了个人信息安全,我们有不能信任这样的实名认证,我们认为,目前唯一的解决方法就是对数据安全进行研究,在手机用户数据的同时对数据安全进行研究。李老师还给我们介绍了Hadoop集群框架搭建进行了介绍,让我们对Hadoop技术有了进一步了解。

通过听取于老师和李老师的讲座,我们对大数据产生了进一步的研究兴趣。同时,感谢两位老师不远千里给我们带来了一场精彩的讲座,让我们受益匪浅。

学院:信息科学与工程学院   姓名:陈瑜   

于戈教授讲解的“大数据应用与数据科学人才培养”从数据与数据处理、大数据应用与数据科学、大数据技术与大数据产业、数据科学和大数据人才培养四个方面介绍了大数据应用需求、数据科学的主要内容、数据科学项目的开发方法以及在大数据分析中的应用技术,并专门探讨了数据科学人才的培养目标和培养模式。 李瑞轩教授主要从大数据基本概念、特征和面临的科学问题,大数据的精髓和实质,大数据处理技术与挑战,大数据应用创新以及大数据如何改变未来等几个方面对大数据技术进行介绍,为我们理解大数据的发展历史、现状和未来提供了帮助。

两位教授不愧是走在大数据前沿的人才,讲的内容系统全面,由浅入深,层层深入,让人很自然的进入大数据的世界。下面主要谈一下我参加这场讲座之后的感想。

于老师讲授的内容,即使是门外汉来听这一场讲座,也可以在讲座之后对大数据的重点有一个比较好的理解。人工智能中的知识发现方法,基础实用,可以给不知道如何学习大数据的同学一个指导。而大数据的应用,又可以给同学一个目标,学以致用。

李老师的讲座内容,实例更多,帮助我理解目前大数据的现实应用。不过我更感兴趣的是讲座中提到的观点:“追求数据规模or追求数据质量”、“数据规模比算法更重要”。第一个观点渗透出成本和价值的问题。我们不能简单地只追求数据规模或者数据质量,要与实际相结合,数据收集处理能力决定着收集数据的代价,想要保证规模,要有能承受收集数据代价的资本,保证不了数据规模,那就要多在数据质量上下文章。而第二个观点,我的第一反应就是它侧面渗透了“从长远看,学习好工具库中的方法调入比学习算法原理、自己写算法更有优势”这样的观点,当然这种观点的落脚点是工作,而不是科研,毕竟大多数人以后都是要走工作这条路。但这样的想法并不合理,如果在学习中,我们研究好了已有的算法,再认真学习一个工具的使用,以后的每个工具都是很快的学会如何使用。而只关注每个工具的使用,那学习使用工具可能花费很多时间。从这个方面想,就符合“万变不离其宗”的观念,因此还是要学好算法原理,不只是为了算法的改进。

这样的讲座很好,不但能够学到相关的知识、理念,还补充了CCF中国计算机学会的信息。让我们了解到专业人士的集中地,以后恶补专业领域知识又多了一条途径。

学院:信息科学与工程学院   姓名:刘倩   

今天非常有幸听到两位教授的讲座,于戈教授演讲的主题是《大数据应用与数据科学人才培养》,李瑞轩演讲的主题是《大数据技术挑战与应用创新》,讲座非常精彩,听完他们的演讲之后让我对大数据有了更深刻的理解,对自己以后的学习也有很大的帮助。

于戈教授在演讲中提到了“统计学中的分析方法”,其中说到数理统计学是现在使用最多的方法,对此我也有深刻的理解,像最小二乘法就是其中的一个小方法,在我们平常学习算法的时候,遇到的好多算法的原理也都是和统计学息息相关,可见大数据是离不开统计学的。作为学生,如果想要学好大数据这门知识,我认为作为计算机专业的我们应该重视一下统计学的方法,例如:描述统计学,推断统计学和数理统计学等,用统计学的知识来分析数据,对我们分析大数据会有很大的帮助。而且在大数据时代,数据分析,越来越成为我们工作生活中一个最基本的技能。大数据人才的培养,也正是基于这样一个时代的发展背景。大数据人才的适用领域非常广泛,有着巨大的社会需求。就业行业遍及生物、医学、经济、社会、媒体、金融、教育、政府各个方面,只要有数据的地方,我们都可以施展才华。

当然在大数据时代,我们同样面临着很多挑战,例如面对大数据的广泛应用,可能会导致侵犯他人隐私的情况发生,因为个人的相关数据信息轻易可得,个人隐私越来越不安全。其实不仅仅是个人隐私,包括国家安全和企业的商业机密,也受到很大的威胁。那么怎么办呢?我认为对于国家而言,一方面要积极推进数据对外开放,凡是不涉及个人隐私、国家安全和商业机密的数据,都应该公开,这样才能避免形成数据孤岛,充分发掘和利用数据资源;另一方面,在开放数据的同时要加强相关立法,这两个方面是互相补充的,只有这样,才能赶上时代发展的步伐,充分发挥我们这个人口大国、经济大国的数据资源优势。从个人的角度讲,要加强个人信息防护意识,在上网发布相关信息时,要了解哪些是可以发的,哪些是不能发的,以免给自己带来困扰。

在这次讲座中,我深刻认识到大数据时代给我们带来了很多便利的同时也让我们面临着很多挑战,所以作为研究生的我们,应该踏踏实实学习专业知识,充实自己,迎接新的挑战。