社交网络与数据挖掘重量级讲者都到了！

——CCF ADL87《社交网络与数据挖掘》开始报名

阅读量:4859 2017-11-14 收藏本文

学科前沿讲习班
The CCF Advanced Disciplines Lectures

CCF ADL 第87期

主题　社交网络与数据挖掘

2017年12月22-24日北京

社交网络和数据挖掘是计算机学科相关研究中的热点，其具体研究涵盖理论、关键技术以及互联网核心应用等各个方面。随着在线社交网络和物理社交网络的快速融合，社交网络正渗透到国家安全、经济发展和社会生活等各个方面，从大数据的产生、到基于群体智慧（如：众包）的数据加工、再到信息的消费，社交网络和数据挖掘的应用无处不在。社交网络分析的研究也逐渐从宏观的网络结构拓扑分析、发展到中观的社区发现等、再到更微观的社交关系、影响力以及用户行为建模等，然而社交网络数据的挖掘和分析还有很多本质上的挑战，包括用户交互、社交信息论的基础理论，社交数据挖掘的关键技术等。

本期CCF学科前沿讲习班《社交网络和数据挖掘》邀请到了社会网络分析和数据挖掘领域重量级的专家学者做主题报告。他们将对社交网络和数据挖掘的基础理论、关键技术方法以及当前热点问题进行深入浅出的介绍，并对如何开展本领域前沿技术研究等进行探讨。使参加者在了解学科热点、提高理论水平的同时，掌握最新技术趋势。

学术主任：唐杰清华大学、刘知远清华大学
主办单位：中国计算机学会

独家合作媒体：雷锋网

特邀讲者：

Jiawei Han，美国伊利诺伊大学香槟分校（UIUC）计算机系教授，IEEE和ACM Fellow，美国信息网络学术研究中心主任。曾担任KDD、SDM和ICDM等国际知名会议的程序委员会主席，创办了ACM TKDD学报并任主编。在数据挖掘、数据库和信息网络领域发表论文600余篇。出版了数据挖掘专著“Data Mining: Concepts and Techniques”，成为数据挖掘国内外经典教材。曾获SIGKDD 2004最佳创新奖和ICDE 2002杰出贡献奖。

报告题目：Multi-Dimensional Analysis of Massive Text Corpora, Jiawei Han

摘要：The real-world big data are largely unstructured and interconnected, in the form of natural language text. It is highly desirable to view and analyze massive text data from multi-dimensional angles. This poses a major challenge on how to transform unstructured text data into structured text and analyze such data in multidimensional space. To facilitate such analytical functionality, we propose a textcube modeling and discuss how to construct such cubes from massive text corpora and how to conduct multidimensional OLAP analysis using such textcubes. In the past several years, we have developed a text mining approach that only needs distant or minimal supervision but relies on massive data. We show (i) quality phrases can be mined from such massive text data, (ii) types can be extracted from massive text data with distant supervision, (iii) entities, attributes and values can be discovered by meta-path directed pattern discovery, (iv) faceted taxonomy can be constructed from massive corpora, (v) textcubes can be constructed from massive text, and (v) multi-dimensional analysis can be conducted on such cubes. We show such a paradigm represents a promising direction on turning massive text data into structured and useful knowledge.

Philip S. Yu，美国伊利诺伊大学芝加哥分校（UIC）计算机科学系教授、信息技术领域Wexler讲座教授，清华大学数科院院长，IEEE和ACM Fellow。曾获2016年ACM SIGKDD创新奖，2013年IEEE CS技术成就奖，2003年IEEE ICDM研究贡献奖。在数据挖掘等领域国际著名学术期刊及会议上发表论文1千余篇，论文被引用超过88000次，H-index（高引用指数）达140，申请专利300余项。曾任ACM TKDE主编、IEEE TKDD主编、IEEE ICDE和IEEE Data Mining会议指导委员会成员。曾获2013年ICDM十年最有影响论文奖，2014年EDBT久经考验奖（Test of Time Award）。

报告题目：Broad Learning via Fusion of Social Network Information

摘要：In the era of big data, there are abundant of data available across many different data sources in various formats. “Broad Learning” is a new type of learning task, which focuses on fusing multiple large-scale information sources of diverse varieties together and carrying out synergistic data mining tasks across these fused sources in one unified analytic. Great challenges exist on “Broad Learning” for the effective fusion of relevant knowledge across different data sources, which depend upon not only the relatedness of these data sources, but also the target application problem. As social networks contain rich information, in this talk we examine how to fuse social network information to improve mining effectiveness over various applications.

Wei Wang，美国加州大学洛杉矶分校（UCLA）计算机科学系计算机系Leonard Kleinrock讲席教授，Scalable Analytics Institute (ScAi)主任。曾获2012年IEEE ICDM杰出服务奖，2013年大川基金会研究奖，2016年ACM SIGKDD杰出贡献奖。主要研究兴趣包括大数据分析、数据挖掘、生物信息学与计算生物学、数据库。已出版1部专著，在相关领域发表180余篇论文。担任IEEE TKDE、IEEE TBD、ACM TKDD等国际期刊编委。

报告题目：Systematic Modeling of Dynamic Networks

摘要：Temporal networks have become ubiquitous because of the numerous applications that generate network structures in a time-dependent way. In recent years, a significant amount of work has been done on the area of evolutionary network analysis, which examines various problems in the context of network evolution, including but not limited to anomaly detection, link prediction, node classification. Although many individual solutions exist for these problems, a broader question is whether we can directly characterize the structure of the network as a function of time. The ability to characterize the structure of the network as a function of time is crucial in using it in different application settings, because such a characterization can capture very rich information about the structure of the underlying network. In this talk, I will present challenges facing dynamic network modeling and our solutions.

Xiangen Hu，国家“千人计划”创新人才，美国孟菲斯大学终身教授、孟菲斯大学智能系统研究所研究员，美国国防部先进分布学习（Advanced Distributed Learning）孟菲斯协同实验室主任，华中师范大学心理学院教授、院长。研究兴趣包括：认知模型，语义表达与分析，智能导学，教育大数据，以及网络行为分析。近十年来主持美国科学基金（NSF）、教育部教育研究所（IES）、美国国防部（DoD）、海军研究所（ONR）、陆军研究室（ARL）研究项目。

报告题目：Semantic Representation & Analysis (SRA) and potential applications

摘要：Semantic Representation Analysis (SRA) is a general framework for vector-based semantic analysis. Within this framework, semantics of natural language are represented in the form of Induced Semantic Structure (ISS). SRA has applications in information retrieval (IR), text analysis, and intelligent tutoring systems (ITS). In this lecture, I will 1) introduce a mathematical model of SRA; 2) introduce and demonstrate a method that generates individualized domain-specific context sensitive semantic representation; 3) introduce and demonstrate learner’s characteristics curves (LCC) as local student’s model and its application in intelligent tutoring systems.

James A. Evans, 芝加哥大学社会学系教授，毕业于斯坦福大学，曾在哈佛等大学从事社会组织结构方面的研究。在芝加哥大学创立知识挖掘实验室。主要研究兴趣包括：群体智能、社会组织结构分析。最近专注科技创新产生和传播规律的研究，在Science等顶级期刊上连续发表多篇文章。

报告题目：Team Structure and Scientific Advance

摘要：Teams dominate the production of high-impact science and technology. Analyzing teamwork from more than 50 million papers, patents, and software products, 1954-2014, we demonstrate across this period that larger teams developed recent, popular ideas, while small teams disrupted the system by drawing on older and less prevalent ideas. Attention to work from large teams came immediately, while advances by small teams succeeded further into the future. Differences between small and large teams magnify with impact—small teams have become known for disruptive work and large teams for developing work. Differences in topic and research design account for part of the relationship between team size and disruption, but most of the effect occurs within people, controlling for detailed subject and article type. These findings suggest the importance of supporting both small and large teams for the sustainable vitality of science and technology. I also demonstrate the importance of modeling the team or hypergraph structure of science, rather than reducing it to simple, pairwise networks.

唐杰，清华大学计算机系长聘副教授、博导，首届国家优秀青年基金获得者，CCF青年科学家，英国牛顿高级学者奖。主要研究社会网络分析、数据挖掘和机器学习。发表200余篇论文，Google引用9400余次。研发了研究者社会网络ArnetMiner系统，吸引全球220个国家和地区832万独立IP的访问。获北京市科技进步一等奖、中国人工智能学会科技进步一等奖。

报告题目：社会影响力与行为预测

摘要：社会网络已经成为沟通真实物理世界和虚拟互联空间的桥梁。我们在互联网络中的行为直接反映了我们在真实世界的活动和情感。我将介绍在大规模真实网络中（如：微信、微博、Twitter、 AMiner等网络）如何分析用户之间的交互影响力和基于网络拓扑的结构影响力，并基于影响力预测用户行为。模型同时考虑了网络结构、用户属性和网络用户的偏好。并设计了针对大规模网络的并行学习算法。在实际真实在线社交系统中得到了验证。

沈华伟，中国科学院计算技术研究所研究员。主要研究兴趣包括社交网络分析、网络信息传播等，获得过CCF优博提名奖。2015年被评为中国科学院优秀青年促进会会员（“中科院优青”）。获得国家科技进步二等奖、北京市科学技术二等奖、电子学会科学技术一等奖、钱伟长中文信息处理科学技术一等奖。出版个人专/译著3部，在Science、PNAS等学术期刊和WWW、SIGIR、AAAI、IJCAI等学术会议上发表论文60余篇。

报告题目：在线社交媒体中的信息传播预测

摘要：近年来，以微博、微信等为代表的在线社会媒体逐渐成为人们发布、传播和获取信息的主要媒介。社会媒体汇聚了大量的用户关系数据和信息传播数据，为分析和研究人类社会活动提供了弥足珍贵的数据资源。社会媒体中数据多源异构、个体间关系繁杂、信息传播突发等特点给社会媒体分析提出了科学技术挑战。分析社交网络的结构规律、挖掘用户行为的固有模式、探索网络信息传播的内在机理、研究高效的社交网络分析与网络信息传播预测方法，有利于提升对在线社会媒体的科学认知水平和有效利用能力。报告将从网络结构分析、网络表达学习、网络信息传播预测等几个方面介绍报告人近几年在在线社会媒体中的信息传播预测方面的研究成果。

石川，北京邮电大学计算机学院教授、博导。主要研究方向: 数据挖掘、机器学习、社会网络分析和演化计算。主持或参加国家和部委科研十余项。近五年来，发表学术论文40余篇，英文专著一部。曾获ADMA 2011最佳论文奖、CCF-腾讯犀牛鸟基金及项目优秀奖，指导学生获得顶尖国际数据挖掘竞赛IJCAI Contest 2015 全球冠军。获得北京市高等学校青年英才计划支持。

报告题目：异质信息网络建模与分析

摘要：当前的社会网络分析主要针对同质网络（即网络中结点类型相同），但是现实世界中的网络化数据通常包含不同类型的对象，并且对象之间的关联表示不同的语义关系。构建异质信息网络（即包含不同类型的结点或边的网络）可以包含更加完整的对象之间的关联信息，因此分析这类网络有希望挖掘更加准确的模式。本课题以异质信息网络为对象，深入分析异质网络的复杂结构和丰富语义对数据挖掘带来的挑战。本报告将介绍异质信息网络的基本概念、特点、和分析方法，以及在实际问题中的应用。

宋国杰，北京大学信息科学技术学院副教授，智能交通系统研究中心副主任。主要从事数据挖掘、机器学习、社会网络分析和智能交通系统等方面的研发工作。主持20多项国家级纵向课题和横向课题。发表包括国际顶级期刊TKDE、TPDS、TITS、Scientific Report以及国际顶级会议 KDD、AAAI、WWW 等的相关论文70余篇。研究成果获“2012 年度中国公路学会科学技术奖一等奖”、“2012 年度山西省科学技术奖二等奖”和“2013 年度中国公路学会科学技术奖一等奖”。教学成果两度获得北京大学教学成果一等奖；国家级精品课程《数据结构与算法》主讲教师。

报告题目：社会网络信息传播影响最大化挖掘

摘要：网络信息传播挖掘研究是近年来社交网络分析领域的热点问题。报告将重点介绍两方面的研究工作：传播影响最大化（Influence Maximization）和网络推断（Network Inference）。前者主要研究在既定传播模型下，如何高效寻找社交网络中信息传播影响力最大的Top-k节点集合，而后者则是在给定观测到信息传播级联数据集的基础上，推断出隐藏的、不可直接观测的社交网络拓扑结构。报告将重点介绍这两类工作的代表性研究成果，并对未来发展进行展望。

崔鹏，清华大学计算机系副教授。研究兴趣包括网络表示学习，人类行为建模，以及社会多媒体计算。在相关领域发表论文60余篇，曾获ICDM 2015最佳学生论文奖、KDD 2014最佳论文Finalist、ICME 2014最佳论文奖、MMM2013最佳论文奖、ACM Multimedia 2012重大技术挑战奖等。曾多次担任ICDM、ACM Multimedia等高水平国际会议的程序委员会领域主席，担任IEEE TKDE、ACM TOMM、Neurocomputing等国际期刊编委。2015年获得ACM中国新星奖。

报告题目：Network Embedding: Enabling Network Analytics and Inference in Vector Space

摘要：Nowadays, larger and larger networks are used in applications. It is well recognized that network data is sophisticated and challenging. To process graph data effectively, the first critical challenge is network data representation, that is, how to represent networks properly so that advanced analytic tasks, such as pattern discovery, analysis and prediction, can be conducted efficiently in both time and space. In this talk, we will review the recent thoughts and achievements on network embedding. More specifically, a series of fundamental problems in network embedding will be discussed, including why we need to revisit network representation, what are the research goals of network embedding, how network embedding can be learned, and the major future directions of network embedding.

刘知远，清华大学计算机系助理教授。主要研究方向为表示学习、知识图谱和社会计算。已在人工智能领域著名国际期刊和会议发表相关论文30余篇，Google Scholar统计引用超过2000次。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖，入选中国科学青年人才托举工程、CCF-Intel青年学者提升计划。

报告题目：语言表示学习与计算社会科学

摘要：语言是人类交流的工具、人类文化的载体，是了解人类社会的重要视角。近年来随着表示学习在自然语言处理中的应用，语言表示学习也为社会科学研究提供了全新的技术工具，特别是面向在线社会媒体的大规模用户产生内容进行用户和内容分析，具有很大优势。本报告将介绍语言表示学习技术在计算社会科学方面的最新动态，探讨该方向的未来发展趋势。

赵鑫，中国人民大学计算机副教授。研究领域为社交数据挖掘和自然语言处理，共发表CCF A/B、SCI论文50余篇，其中以第一作者发表的《Comparing Twitter and Traditional Media Using Topic Models》被引用700余次。入选第二届CCF青年人才发展计划。担任多个国际顶级期刊和学术会议评审，AIRS 2016出版主席、SMP 2017领域主席以及NLPCC 2017领域主席。

报告题目：面向社交媒体平台的商业数据挖掘

摘要：随着互联网技术的不断发展，各种社交媒体平台都得到了广泛的使用。社交网络平台中蕴含大量的用户信息，包括用户个人属性信息（如年龄、性别等等）、用户所发表的内容信息等等。如何充分利用社交媒体平台的信息来加强用户个性化建模，从而推动商业数据挖掘成了一个研究热点。本次报告试图系统梳理一些重要的商业大数据应用问题，如用户意图检测、用户画像构建以及推荐算法等。

杨洋，浙江大学助理教授，2016年毕业于清华大学计算机科学与技术系，获清华大学优秀博士毕业论文、北京市优秀博士毕业生等荣誉。2012年访问美国康奈尔大学，与图灵奖得主John Hopcroft教授合作，2013年访问比利时鲁汶大学。研究方向为社交网络挖掘，在KDD、AAAI、ICDM等国际顶级学术会议上发表论文十余篇。曾担任KDD 2015分会主席，CIKM 2016、WSDM 2016、ASONAM 2015等国际会议程序委员会委员。

报告题目：Urban Dreams of Migrants: A Case Study of Migrant Integration in Shanghai

摘要：An unprecedented human mobility has driven the rapid urbanization around the world. In China, the fraction of population dwelling in cities increased from 17.9% to 52.6% between 1978 and 2012. Such large-scale migration poses both significant challenges for policymakers and important questions for researchers. In this talk, I will introduce our study of the process of migrant integration. Specifically, we employ a one-month complete dataset of telecommunication metadata in Shanghai with 54 million users and 698 million call logs. We find systematic differences between locals and migrants in their mobile communication networks and geographical locations. For instance, migrants have more diverse contacts and move around the city with a larger radius than locals after they settle down. By distinguishing new migrants (who recently moved to Shanghai) from settled migrants (who have been in Shanghai for a while), we demonstrate the integration process of new migrants in their first three weeks. Moreover, we further investigate migrants’ behavior in their first weeks and in particular, how their behavior relates to early departure. We find that migrants who end up leaving early tend to neither develop diverse connections in their first weeks nor move around the city. Their active areas also have higher housing prices than that of staying migrants.

学术主任：

刘知远，清华大学计算机系助理教授。主要研究方向为表示学习、知识图谱和社会计算。已在人工智能领域著名国际期刊和会议发表相关论文30余篇，Google Scholar统计引用超过2000次。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖，入选中国科学青年人才托举工程、CCF-Intel青年学者提升计划。

日程安排：

2017年12月22日（周五）
08:30-09:00　开班仪式
09:00-09:15 合影
09:15-12:15　专题讲座1：Broad Learning via Fusion of Social Network Information

Philip S. Yu，美国伊利诺伊大学芝加哥分校特聘教授，清华大学数科院院长，ACM/IEEE会士

专题讲座2：社交影响力与行为预测

唐杰，清华大学副教授

12:30-14:00 午餐
14:00-16:00 专题讲座3：在线社交媒体中的信息传播预测

沈华伟，中科院计算所研究员

专题讲座4：社会网络信息传播影响最大化挖掘

宋国杰，北京大学副教授

16:00-17:30 专题讲座5：Team Structure and Scientific

James A. Evans, 芝加哥大学社会学系教授

2017年12月23日（周六）

09:00-12:00 专题讲座6：Systematic Modeling of Dynamic Networks

Wei Wang，UCLA教授、KDD 2016 Service Award

专题讲座7：Semantic Representation & Analysis (SRA) and potential applications

Xiangen Hu，千人、孟菲斯大学教授、华中师范大学教授、院长

12:00-14:00 午餐
14:00-17:00 专题讲座8：异质信息网络建模与分析

石川，北京邮电大学教授

专题讲座9：

Network Embedding: Enabling Network Analytics and Inference in Vector Space

崔鹏，清华大学副教授

专题讲座10：语言表示学习与计算社会科学

刘知远，清华大学助理教授

2017年12月24日（周日）
09:00-12:00 专题报告11：Multi-Dimensional Analysis of Massive Text Corpora

Jiawei Han，UIUC教授、ACM/IEEE Fellow

12:00-14:00 午餐

14:00-16:00 专题讲座12：面向社交媒体平台的商业数据挖掘

赵鑫，中国人民大学副教授

专题讲座13：

Urban Dreams of Migrants: A Case Study of Migrant Integration in Shanghai

杨洋，浙江大学助理教授

16:00-17:00 Panel: 社交大数据挖掘的应用前景

结业式
（如有变动，以现场为准）

地点：中科院计算所一层报告厅（北京市海淀区中关村科学院南路6号）

报名方式：即日起至2017年12月20日，报名请登录 https://jinshuju.net/f/yxdpPx 或扫描二维码报名

报名及缴费说明：
1、根据报名先后顺序录取，会员优先，报满为止，收到报名确认邮件后缴费；

2、2017年12月20日（含）前注册并缴费：CCF会员2500元/人，非会员报名同时加入CCF 2700元/人；非会员3000元/人；现场缴费：会员、非会员均为4000元/人；CCF团体会员参加，按CCF会员标准缴费；

3、公务卡缴费可现场刷卡，但需要提前提交报名信息可按优惠价格缴费；

4、请务必在报名表中填写CCF会员号，不填写会员号，按非会员处理；

5、注册费包括讲课资料、视频资料和3天会议期间午餐，其他食宿、交通自理；

6、缴费后确因个人原因未参加者，扣除报名费30%（开具服务费发票）；

7、本期ADL给予边远地区高校两个免费名额，可免注册费，限CCF会员，需个人提出书面申请并加盖学校公章，将电子版发至adl@ccf.org.cn, CCF将按照申请顺序进行录取。

缴费方式：

银行转账（支持网银、支付宝）：

开户行：北京银行北京大学支行

户名：中国计算机学会

账号：0109 0519 5001 2010 9702 028

请务必注明：姓名+ADL87

联系邮箱：adl@ccf.org.cn

咨询电话：010-62600321-16

<<< 上一篇 CCFADL88《量子计算》开始报名

实体经济中AI+大数据实战解读下一篇 >>>

<<< 下一篇实体经济中AI+大数据实战解读