2017年7月5日,CCF YOCSEF天津在天津大学北洋园校区郑东图书馆南区一层报告厅成功举办了“知识图谱与图数据库新进展”学术报告会。
图1. 部分参会代表合影
随着各行业领域构建的知识图谱规模和复杂程度不断增长,提出了若干理论和技术挑战,而图数据库系统可作为管理大规模知识图谱的重要工具。本次报告会邀请到国内外学术界和工业界从事知识图谱和图数据库研究与实践工作的9位知名专家学者:澳大利亚格里菲斯大学王克文教授、北京航空航天大学马帅教授、东南大学漆桂林教授、文因互联 CEO鲍捷博士、上海瓦歌智能科技有限公司总经理兼深圳狗尾草智能科技公司CTO王昊奋博士、澳大利亚莫纳什大学高级讲师李元放博士、云知声资深技术专家刘升平博士、湖南大学助理教授彭鹏博士和海知智能CTO丁力博士,共同研讨大规模知识图谱构建、存储、查询、推理和应用过程中的若干理论和技术问题,以及面向大规模知识图谱管理的图数据库技术。
报告会上午9:00时在热烈的掌声中开始,天津大学计算机科学与技术学院、软件学院院长李克秋教授致开幕词,欢迎与会代表来到天津大学参加这场知识图谱和图数据库领域的学术盛宴。
图2. 李克秋院长致辞
天津大学软件学院副院长、数据科学与服务工程团队负责人冯志勇教授介绍了天津大学近年来在知识图谱和图数据库研究方向上的进展情况,提议学术界与工业界应就相关研究课题开展合作。
图3. 冯志勇副院长致辞
本次学术报告会执行主席为YOCSEF天津副主席天津大学王鑫博士和YOCSEF天津委员天津大学张小旺博士。来自全国各地的高校、科研院所的师生以及企业界的代表共160余人参加了本次报告会。超星“学习通”平台对本次活动进行了在线直播,超过500人在线收看。
在上午的报告会上,王克文教授、马帅教授、漆桂林教授和鲍捷博士分别进行了精彩的学术报告。
图4. 报告会现场
澳大利亚格里菲斯大学王克文教授是该校人工智能与语义技术实验室主任,是国际人工智能知识表示领域的知名学者。他的报告“知识图谱和本体中的规则”介绍了知识图谱中的规则抽取,集中讨论了如何将AI中的Abduction推理用于形式化OBDA中的查询解释问题,并基于Datalog技术设计高效算法。由此实现的查询解释系统ABEL可以处理超过十万个RDF三元组的本体知识库。
图5. 王克文教授作报告
北京航空航天大学马帅教授是国家优秀青年科学基金获得者,其团队研究工作持续发表在数据库和数据挖掘领域国际顶级会议和期刊上。他的报告“大图搜索: 挑战与技术”介绍了图搜索及其挑战,探讨了如何使用“查询近似和数据近似”这两类技术来提高大图搜索的效果和效率。
图6. 马帅教授作报告
东南大学漆桂林教授,目前担任中国中文信息学会语言与知识计算专业委员会副主任和中国科学技术情报学会知识组织专业委员会副主任;在知识工程、大数据语义分析、知识图谱等领域有将近 20年的研究和产业化经验。他的报告“大规模知识图谱构建和推理技术”首先介绍了知识图谱的历史以及语义网络;然后介绍了通用和垂直领域知识图谱关键技术,包括百科知识获取技术、知识融合技术、知识清洗技术、实体链接技术;讨论了知识的表示语言和知识推理技术以及大规模知识图谱存储技术;最后探讨了知识图谱技术在问答中的应用。
图7. 漆桂林教授回答提问
文因互联(Memect)创始人兼 CEO鲍捷博士有十余年的人工智能研究经验,研究领域有神经网络、知识表现与推理、语义网、机器学习、自然语言处理等,他是中文信息学会语言与知识计算专委会委员,历任美国三星研发中心研究员,MIT访问研究员,BBN访问研究员,RPI博士后,W3C Web本体语言工作组成员。他的报告“用精益迭代提高知识图谱构造效率”集中于文因互联团队在构造金融知识图谱过程中的成功实践经验,包括全周期成本的考虑因素、利用关系数据库和JSON查询降低知识图谱数据库成本、用持续交付和错误归因提升知识提取效率、平衡提取粒度和成本以及团队管理与成本等。
图8. 鲍捷博士作报告
在下午的报告会上,王昊奋博士、李元放博士、刘升平博士、彭鹏博士和丁力博士分别进行了精彩的学术报告。
王昊奋博士是上海瓦歌智能科技有限公司总经理兼深圳狗尾草智能科技公司CTO、CCF YOCSEF上海主席、中文信息学会语言与知识计算委员会委员、中国计算机学会术语工作委员会执行委员。他的报告“当知识图谱遇上聊天机器人:机遇与挑战”系统地回顾了聊天机器人的发展,展望了聊天机器人通往更智能化、更人性化、更趣味化的道路上所面临的挑战,最后聚焦到狗尾草公司推出的公子小白和Holo-Era机器人如何使用知识图谱结合深度学习技术来解决上述挑战。
图9. 王昊奋博士作报告
李元放博士是澳大利亚莫纳什大学信息技术系高级讲师。他的研究兴趣包括语义万维网和软件工程。他的报告“用知识图谱解释实体对在Twitter中的共现”介绍了DBpedia等现代知识图谱包含实体及其间逻辑关系的重要信息,用知识图谱中实体对之间的逻辑关系帮助解释其在Twitter中共现的频率,在实体对之间的语义路径上训练一个排序函数对该语义路径进行排序,用以确定哪些路径最有可能解释为什么实体对在给定tweet中共现。
图10. 李元放博士作报告
刘升平博士是云知声 AI Labs的 资深技术专家,曾任IBM中国研究院资深研究员,目前是中文信息学会语言与知识计算专委会委员。他的报告“知性会话:基于知识图谱的人机对话系统”结合工业级的人机对话系统实践经验,阐述知识图谱在人机对话系统的核心模块,包括语义解析、聊天机器人、问答系统、会话式推荐等上面的应用。
图11. 刘升平博士作报告
彭鹏博士是湖南大学信息科学与工程学院软件工程系助理教授,目前的研究领域是基于图的分布式RDF数据管理。他的报告“gStore—一种开源图数据库系统及其在企业中的应用”介绍了知识图谱数据管理的存储和查询问题,演示了基于图数据库理论的开源RDF知识图谱数据的存储和查询系统gStore,同时介绍了gStore系统在方正电子的知识出版项目和中科院微生物所的国际微生物数据中心微生物知识图谱项目中的具体应用案例。
图12. 彭鹏博士作报告
丁力博士是海知智能CTO,OpenKG发起人之一。近二十年在知识图谱、语义搜索、政府数据公开、社交网络、机器学习和大数据分析等领域研究和实践并发表上百篇论文。他在报告“cnSchema开放中⽂文知识图谱的数据字典”中阐述了开放中文知识图谱的数据字典,介绍了cnSchema的设计原则,深入浅出地结合理论与实际应用,对基本数据模型和知识图谱API进行了深刻阐述。
图13. 丁力博士作报告
在Panel专题讨论环节,冯志勇教授、王克文教授、鲍捷博士、丁力博士、李元放博士、王昊奋博士、刘升平博士和彭鹏博士与在场的学术界和企业界代表围绕“知识图谱与图数据库新进展”主题,针对“知识图谱是否是一门科学?”、“知识图谱在医疗、法律、金融等行业应用中的前景”、“图数据库如何为知识图谱提供数据管理?”、“知识图谱如何与深度学习结合?”、“知识图谱相关领域人才需要怎样培养?”、“知识图谱的机遇和挑战”等热点前沿问题展开了深入讨论,精彩地回答了与会代表提出的各个问题,Panel专题讨论环节持续近1个半小时,最后各位Panel嘉宾用一句话展望了知识图谱未来的发展前景。
图14. Panel专题讨论环节
本次会议于17:30结束。
本次学术报告会由王鑫博士和张小旺博士共同主持。报告会现场气氛热烈、活跃,听众提问积极踊跃,参会代表与特邀讲者进行了深入交流、讨论。本次学术报告会取得了圆满成功。