Welcome to Data Intelligence!
首届“数据智能与知识服务”研讨会暨“知识服务智能化平台建设”讲习班 April 2, 2019  |  views: 1430

        在数据智能时代,一方面数据量不断增长,愈加呈现出高维度、高阶态和异构性的大数据特点,另一方面,知识构建、机器学习、人工智能等技术在飞速进步。如何对海量数据进行分析、处理、挖掘和表示,获取有揭示性和可操作性的信息,从而为人们在基于数据制定决策或执行任务时提供有效的知识服务,成为全社会共同关注的热点,并因此催生和孵化了一系列基于大数据和知识服务的多领域智能平台。为促进学术和技术交流,展示这一领域的前沿发展态势,以具体场景为例解读跨领域知识服务平台构建的理论基础与建设实践,中国科学院文献情报中心主办首届“数据智能与知识服务”学术研讨会暨“知识服务智能化平台建设”讲习班。

         本次研讨会/讲习班将邀请国内外从事相关研究的知名学者、具有前瞻洞见的业界领袖和精通实战经验的技术大咖,讲授“数据智能和知识服务”的前沿与“知识服务智能化平台建设”的构建,欢迎从事相关研究和实践工作的人员踊跃报名。

一、组织机构

主办:中国科学院文献情报中心

承办: Data Intelligence(DI)编辑部

协办:北京理工大学计算机学院

二、委员会

学术委员会:

James Hendler                        Rensselaer Polytechnic Institute, USA

刘会洲                                      中国科学院文献情报中心

丁颖                                         Indiana University, USA

漆桂林                                     东南大学

组织委员会:

赵艳                                         中国科学院文献情报中心

逄金辉                                     北京理工大学

张小旺                                     天津大学

刘凤红                                     中国科学院文献情报中心

三、已确定的主讲人

Ying Ding

Ying Ding(丁颖),Data Intelligence 共同主编,美国印第安纳大学信息与计算学院教授。她主持或共同主持过NIH, NSF and European-Union 资助项目22项,先后在著名学术期刊和各类学术会议上发表论文200余篇,并担任180多个国际会议的项目委员会成员,受到学术界的广泛关注。丁颖教授目前的研究方向主要包括数据驱动下的知识发现、语义网络、知识图谱、科研合作以及网络技术应用。

 

漆桂林

讲课题目:基于知识图谱的智能问答平台

讲课摘要智能问答通过人机交互方式实现知识获取,在客服、智能音箱等应用中发挥重要的作用。知识图谱技术可以有效提升智能问答的效果,可以有助于用户问题的解析和意图识别和问句的语义匹配,以及为问答提供答案的知识来源。本次报告将介绍一个基于知识图谱的智能问答平台--KGQAer,该问答平台可以同时处理常见问答对的问答以及知识图谱问答,并且支持知识图谱的人机交互式构建。本报告还将介绍该平台在医药知识问答中的应用。

专家简介漆桂林,Data Intelligence执行主编,东南大学计算机科学与工程学院教授,东南大学万维网科学研究所副主任,博士生导师。长期从事人工智能和语义网络的推理方面科研及教学工作。发表高质量学术论文90余篇。其中SCI索引21篇(11篇第一作者),EI索引91篇(33篇第一作者)。作为项目负责人承担了两项国家自然科学基金项目。担任多个国际会议和研讨会的程序委员会成员,同时是多个国际重要杂志编委和审稿人。

 

Cui Tao

讲课题目:Big Biomedical Data Analysis Using Ontology and Semantic Technologies

讲课摘要:The explosively growing big biomedical data provides enormous opportunities to revolutionize the current clinical practices as well as the biomedical research if the accompanied challenges of heterogeneity in knowledge discovery on biomedical big data can be addressed with novel informatics technologies. Our team has been working on developing semantic technologies to normalize, integrate, query, and analyze the massive volumes of biomedical data as well as to infer new knowledge based on what is known. The core technologies we are developing are based on ontologies, the Semantic Web, and natural language processing, and machine learning. Here we share our vision on applying these novel informatics techniques to clinical knowledge and data representation, as well as to retrieve useful information and knowledge from EHR or online resources. In particular, we will introduce our efforts on (1) representing and normalizing large-scale EHR data to enable secondary use of EHR; (2) temporal information modeling, extraction, and reasoning for patient medical history and time trending analysis; and (3) using semantic queries for patient education and communication.

专家简介:Cui Tao(陶萃)博士,美国德州大学休斯顿生物医学信息学院终身教授、美国医学资讯学会、计算机学会(健康医疗信息化组)、电子电气工程师协会会员,国际多家生物信息、计算机科学期刊及出版社编审、特约评论员。多年来从事医疗和生物医学信息学研究。主要研究方向包括本体、语义网、生物医学知识以及数据的挖掘、标准化、整合,以及人工智能在医学数据上的应用。2017年获得奥巴马总统颁发的“青年科学家和工程师总统奖”(PECASE),这是美国政府授予青年科学家和工程师的最高荣誉。

 

李涓子

讲课题目:NewsMiner新闻事件分析挖掘和搜索系统

讲课摘要:报告首先介绍大数据时代知识工程的迫切性和挑战给,介绍基于异构知识资源构建的大规模跨语言知识图谱,最后以新闻事件挖掘为例,介绍知识图谱在新闻挖掘中的应用。

专家简介:李涓子,清华大学计算机科学与技术系教授,博士生导师。中国中文信息学会语言与知识计算专委会主任、中国计算机学会术语委员会执行委员。研究兴趣是语义 Web,新闻挖掘与跨语言知识图谱构建。多篇论文发表在重要国际会议(WWW、IJCAI、SIGIR、SIGKDD) 和学术期刊(TKDE、TKDD)。主持多项国家级、部委级和国际合作项目研究,包括国家自然科学项目重点,欧盟第七合作框架、新华社等项目。获得2013年人工智能学会科技进步一等奖,2013 年电子学会自然科学二等奖。

 

唐杰

讲课题目:AMiner—Mining Deep Knowledge from Scientific Networks

讲课摘要:AMiner is the second generation of the ArnetMiner system. We focus on developing author-centric analytic and mining tools for gaining a deep understanding of the large and heterogeneous networks formed by authors, papers, venues, and knowledge concepts. One fundamental goal is how to extract and integrate semantics from different sources. We have developed algorithms to automatically extract researchers’ profiles from the Web and resolve the name ambiguity problem, and connect different professional networks. We also developed methodologies to incorporate knowledge from the Wikipedia and other sources into the system to bridge the gap between network science and the web mining research. In this talk, I will focus on answering two fundamental questions for author-centric network analysis: who is who? and who are similar to each other? The system has been in operation since 2006 and has collected more than 100,000,000 author profiles, 200,000,000 publication papers, and 7,800,000 knowledge concepts. It has been widely used for collaboration recommendation, similarity analysis, and community evolution.

专家简介:唐杰, Data Intelligence 编委,清华大学计算机科学与技术系副主任、长聘教授、2018年国家自然科学基金杰出青年基金获得者。主要研究领域为数据挖掘、社会网络分析、知识图谱、机器学习和人工智能。他是美国康奈尔大学,香港科技大学,英国南安普顿大学访问学者。在计算机及其相关学科的国际知名期刊和顶级会议上发表论文200多篇,申请专利20项。论文被引超过12000次。他是CIKM’16, WSDM’15大会程序委员会主席,KDD’18大会副主席,ACM TKDD期刊代理主编,IEEE TKDE/TBD and ACM TIST期刊编委。他研发了研究者社会网络AMiner系统,吸引了全球220个国家/地区1000多万独立IP访问。他获得英国皇家学会牛顿高级学者基金奖,中国计算机学会青年科学家奖,国家杰出青年科学基金奖和KDD18杰出服务奖。

 

刘知远

讲课题目:知识指导的自然语言处理

讲课摘要:近年来深度学习技术席卷自然语言处理(NLP)各大领域。作为典型的数据驱动方法,深度学习面临可解释性不强等难题,如何将人类积累的大量语言知识和世界知识引入深度学习模型,是改进NLP深度学习模型性能的重要方向,同时也面临很多挑战。本报告将介绍知识指导的自然语言处理的最新进展与趋势。

专家简介:刘知远,清华大学计算机科学与技术系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011年获得清华大学博士学位,已在ACL、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文60余篇,Google Scholar统计引用超过4000次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、中国计算机学会青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会秘书长,ACL、COLING、IJCNLP领域主席。

 

崔运鹏

讲课题目:自然语言处理技术在图情领域的应用

讲课摘要随着自然语言处理技术的发展,NLP方法和技术在图书情报领域的应用日渐深入。特别是新一代词向量技术的出现,为语义计算提供了强大的技术手段。本报告就中国农科院信息所认知计算研究室近年来在NLP与图情领域相结合所做的一些工作。包括深度学习技术用于人名机构消歧、认知搜索与知识发现、无监督的文本分类方法、聊天机器人框架以及文章论辩结构的抽取。

专家简介:崔运鹏,博士,研究员。中国农业科学院农业信息研究所认知计算研究室主任。  长期从事农业知识管理、农业大数据挖掘分析与认知计算方法、技术研究。主持和参加了国家社科基金、国家863、国家支撑计划等30余项科研项目的。曾获得科技成果奖励4项。其中,北京市科学技术奖三等奖2项、中国农科院科技成果二等奖1项、中华神农科技奖1项。获得软件著作权登记20余项。在国内外核心刊物公开发表论文20余篇。出版专著3部,其中独著1部,主编1部、参与编著1部。

 

顾立平

讲课题目: Data Science with R and Python for Enterprise to Import Artificial Intelligence Technology

专家简介:顾立平,中国台湾,博士,中科院文献情报中心副研究员,中国科学院大学图书情报与档案管理系岗位教授,日本国立情报研究所访问学者。中国科学院文献情报出版领域择优支持人才、中国科学院文献情报中心引进人才、中国科学院文献情报中心科技信息政策研究与服务中心执行副主任、开放科学政策与法律咨询服务中心负责人,已发表学术论文97篇,专著5部,编译著作12部,已开放共享250份研究报告(累计浏览下载25万余次)和200份讲座视频(4,500点击率)。

 

陆伟

陆伟,博士,珞珈特聘教授,博士生导师,首届长江青年学者,教育部新世纪优秀人才计划入选者,现任武汉大学信息管理学院副院长,信息检索与知识挖掘研究所所长。1992年考入武汉大学科技情报专业,2002毕业获管理学博士学位并留校从事教学科研工作。2005年3月至2006年8月被国家留学基金委公派访学英国伦敦城市大学从事XML检索博士后研究工作,2008年破格晋升为教授,2011年11月至2012年8月访学丹麦皇家图书情报学院。近年先后在国内外发表论文80余篇,主持和参与编写著作多部。曾主持和参与国家社科基金重大项目、科技支撑计划项目、863项目、国家自科基金等各类纵横向项目30余项。兼任中国科技情报学会理事,情报研究与咨询专委会副主任委员,湖北省科技情报学会常务理事,《知识管理论坛》副主编,《情报学报》等期刊编委,省制造业信息化生产力促进中心高级咨询顾问,原伦敦城市大学交互式研究中心研究员等。目前主要研究兴趣为信息检索与可视化、大数据智能、AI人机协同、竞争情报方法与技术等。

 

王芳

讲课题目:基于NLP和深度学习的大规模政府公文智能处理系统

讲课摘要:政府公文是一种重要的知识资源。对公文资源的智能处理,实现公文中的知识发现,有利于促进公文的智能知识管理,提高政府公文在拟制、审批、传阅和归档等流转处理中的智能化水平和行政效能,对推进数字政府建设和提升政府治理能力都具有重要意义。但当前,鲜有面向我国政府公文智能处理和知识发现的相关研究。鉴于此,本报告对该内容进行探索与研究。为实现大规模政府公文的智能处理,我们提出了政府公文的内容结构解析、主题自动标引、产生式自动摘要、重点内容提取与排序计算、面向政策/政令/行政执法文书的知识抽取与链接、基于公文的政令任务分解与责任对象自动匹配等处理流程及研究相关技术方法,并在此基础上构建知识发现系统和分析该系统的应用,也对其应用于特定类型公文中的知识发现进行了实例分析。

专家简介:王芳,南开大学商学院信息资源管理系教授、博士生导师,网络社会治理研究中心主任,教育部“长江学者奖励计划”青年学者项目入选人,国家社会科学基金重大项目“网络社会治理研究”(14ZDA063)首席专家,北京大学信息管理系本科、博士,中美富布赖特高级研究学者(2009-2010),联合国教科文组织全民信息计划(IFAP)专家,中国信息经济学会常务理事,中国公司治理研究院政府治理研究室主任,国家信息资源管理研究基地(北京)客座研究员,美国信息与科学技术学会(ASIST)IRC成员,美国信息系统学会(AIS)会员,欧洲电子政务会议(ECEG)委员会委员。《情报学报》、《情报科学》、《电子政务》、《The International Journal of Public Administration in the Digital Age 》编委。先后主持过国家社科重大、国家自然科学基金面上项目 、国家社会科学基金、教育部基金、中国博士后基金、中美富布赖特研究基金、韩国高等教育财团研究等项目,参加过国家自然科学基金重点、科技部软科学重大、国家信息化办公室咨询课题等多项研究。独著与合著共9部,发表中英文论文100余篇。研究方向:电子政务与政府信息资源管理,知识发现与情感挖掘,情报学基础理论,数据管护(Data Curation)与治理。

 

王军

讲课题目:“儒家学术传承”知识图谱的构建与可视化

讲课摘要:儒家学术传承是通过儒学的师生关系所构成的学术传承谱系,知识图谱可以完美地表示和呈现学术传承关系。本研究从“中国历代人物传记资料库”(CBDB)中提取中国历史人物间的学术师承关系和亲属关系,以此为基础构建了一个儒家学术传承的知识图谱。通过该知识图谱可以交互地发现人物、地点、时间之间可能存在的直接或间接联系。在此基础上,实现了一个覆盖六百多支学术谱系的中国古代学术传承查询与可视化平台,并在地图上展现历代门人群体的籍贯和官职的分布,透视古代学术传承的传播范围和对政治的影响。最后,利用历史人物的出生地和死亡地信息,本研究还构建了历史人物的迁徙网络,以唐代为例,直观地展现了唐代三百年间历史人物迁徙的壮观图景。

系统访问网址:http://DH.KVLab.org

专家简介:王军,北京大学计算机科学博士,北京大学信息管理系教授,北京市优秀教师。長期从事数字图书馆、网络知识组织、用户行为、信息产品设计等跨领域的研究和教学工作。他曾承担多项国家自然科学基金、国家社会科学基金研究课题。2005年获美国OCLC/ALISE研究基金的支持。学术成果发表于JASIST、JCDL、CIKM、情报学报、中国图书馆学报、中文信息学报等期刊和会议。2005年入选教育部“新世纪优秀人才支持计划”,2006年荣获教育部人文社科优秀成果奖,2013年荣获“北京市优秀教师”称号。近年来的研究涉及到用户行为分析、电商平台商品组织、知识图谱、数字人文等領域。详情请参见:http://kvlab.org .

 

赵鑫

讲课题目:知识驱动的推荐技术概览

讲课摘要:知识图谱以结构化的方式提供了实体的丰富信息。最近有很多通用知识图谱问世,如Freebase、YAGO等。这些知识图谱包含了大量现实世界的实体,如果能够将这些知识图谱与现实系统打通,就能很好地扩充已有的系统数据,改进研究和应用。本次授课首先介绍如何通过启发式途径将Freebase和YAGO的实体与在线推荐系统中的物品所关联。然后,介绍如何基于这些关联的知识图谱实体信息来改进(1)推荐系统的效果和(2)物品流行度的预测。最后,总结整个授课内容,并且对于未来研究方向进行展望。

专家简介:赵鑫,中国人民大学信息学院副教授。近五年内在国内外著名学术期刊与会议上以第一作者或者第二作者身份发表论文60余篇,其中包括信息检索领域顶级学术期刊ACM TOIS和学术会议SIGIR、数据挖掘领域顶级学术期刊IEEE TKDE和学术会议SIGKDD、自然语言处理顶级会议ACL和EMNLP。所发表的学术论文取得了一定的关注度,据Google Scholar统计,已发表论文共计被引用2000余次,其中以第一作者发表的《Comparing Twitter and Traditional Media Using Topic Models》被引用900余次。担任多个重要的国际会议或者期刊评审,入选第二届CCF青年人才发展计划。曾获得CIKM 2017最佳短文候选以及AIRS 2017最佳论文奖。

 

胡伟

讲课题目:知识集成的技术方法

讲课摘要:知识图谱以结构化的方式描述客观世界中概念、实体及其间的关系,将万维网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解万维网海量信息的能力。知识图谱可以由任何机构和个人自由构建,其背后的数据来源广泛、质量参差不齐,导致它们之间存在多样性和异构性。例如,对于相交领域,通常会存在多个不同的实体指称真实世界中的相同事物。本次授课将首先简要介绍知识图谱及知识集成问题,然后概述主要解决方法,包括本体匹配和实体对齐等内容,接下来介绍近期研究进展,主要涉及基于表示学习的和基于人机协作的实体对齐方法,最后做总结和展望。

专家简介:胡伟,博士、南京大学计算机科学与技术系副教授。主要研究方向为数据集成、知识图谱、Web应用。主持国家自然科学基金面上/青年项目、教育部博士点基金、江苏省自然科学基金等项目。在WWW、SIGIR、AAAI、IJCAI、ISWC等高水平国际会议和期刊上发表多篇论文,他引超千次,还获得过JIST最佳论文奖、ISWC最佳论文提名。担任中文信息学会语言与知识计算专委会委员、计算机学会数据库专委会通讯委员、江苏省大数据专委会委员、江苏省人工智能学会知识工程与服务计算专委会委员、万维网联盟W3C南京大学学术代表,以及International Journal of Big Data Intelligence期刊编委。

 

郑卫国

讲课题目:知识图谱管理系统、查询与检索

讲课摘要:知识图谱已经成为目前数据的重要组织形式,其中一个关键的任务是对知识图谱进行查询和管理,由于知识图谱作为图数据的一种,对于知识图谱的查询、管理与对传统图数据的查询有着密切的联系,同时由于知识图谱所特有的结构和信息,对其的查询与在一般图数据上的查询又有一定的区别。本次授课先介绍知识图谱的存储策略以及典型的图数据处理系统,然后将围绕着查询语言SPARQL、子结构近似查询和分析、关键字查询以及路径查询和社团搜索分别进行讲述。

专家简介郑卫国,博士、复旦大学青年研究员,主要研究领域包括大规模图数据管理和挖掘、自然语言处理,特别是知识图谱、自然语言问答等相关算法设计与应用,相关研究成果已经发表在数据管理与数据挖掘领域的顶级会议学术期刊和会议上,如ACM SIGMOD, VLDB, IEEE ICDE, ACM TODS, IEEE TKDE等。多次担任重要国际会议或者期刊的评审,包括SIGMOD、SIGKDD、VLDB、CIKM、ICDM、TKDE、VLDB J等。

 

冯岩松

讲课题目:基于知识图谱的问答技术

讲课摘要:智能问答已成为多种智能人机交互应用的核心技术之一,其中基于知识的问答技术已受到学术界及工业界的广泛关注。知识问答的基本任务是利用大规模知识资源解答自然语言问题,其主要技术挑战包括如何实现对自然语言问题的语义解析与表示,以及如何从大规模结构化、半结构化知识资源中找到答案。本报告将首先梳理智能问答研究的基本发展脉络、基本概念和技术流派,其次将分别从传统框架和深度学习框架两个方面介绍近年来的主要研究进展,以及衍生出的生成式知识问答研究,最后结合我们研究小组的工作介绍实际实践经验。

专家简介:冯岩松,信息科学博士,北京大学计算机科学与技术研究所副教授。主要研究方向包括自然语言处理、信息抽取以及机器学习在自然语言处理中的应用;已连续三年在面向结构化知识库的知识问答评测 QALD-4, 5, 6 中获得第一名;相关工作已发表在 TPAMI、ACL、EMNLP 、AAAI等主流期刊与会议上。同时,作为项目负责人或课题骨干已承担多项国家自然科学基金及科技部 863 计划项目。分别在 2014、2015 年获得 IBM Faculty Award,及 2016 年 IBM Shared University Research Award。

 

逄金辉

讲课题目:基于知识图谱的科技资讯媒体服务平台

讲课摘要:海量科技资讯新媒体搜索与推送服务,通过人工定义的模式进行知识建模,存在知识体系无法完全覆盖的困境。本报告以典型科技查询搜索为背景,基于知识图谱提出一种自动概念发现知识建模方法。重点讲解科技资讯媒体的多元知识融合算法,包括知识实例、关系、属性等多个层面对知识进行多元融合,快速实现海量科技资讯知识自动融合、内容智能生产等。同时,也将以新能源汽车为例,展示科技资讯媒体服务平台如何实现国家科技计划新能源汽车成果、政策、新闻资讯库的知识热点和新闻热点分析,以及全文本语义查询和智能问答等服务功能。

专家简介:

逄金辉,博士、北京理工大学副教授,北京运筹学会理事、中国运筹学会会员、CCF会员。主要研究领域:博弈论及其应用、复杂决策与对策方法、网络信息挖掘与知识管理、情报学理论与实践。2015年创办了北理工大学大数据创新学习中心,自2016年开始推进知识图谱前沿技术、行业知识图谱和深度学习,主办了30余次的知识图谱技术、自然语言处理与深度学习相关主题的研讨会,累计参会人数逾2万人。

 

四、时间和地点
时间:2019年6月14日-17日(14日,报到,17日,疏散)

6月15日8:40-5:30,6月16日 8:30-5:30

地点:北京理工大学(中关村校区)研究生楼一层报告厅

 (北京海淀区中关村南大街5号)

 

五、注册及食宿

(一)培训费

普通参会者,2000元/人(5月15日前报名并缴费培训费优惠至1600元/人);学生,1000元/人(2019年5月15日前报名并缴费培训费优惠至800元/人)。

交费方式

交款方式

内容

交款日期

备注

银行汇款

户名:中国科学院文献情报中心

账号:0200004509088129221

开户行:中国工商银行海淀西区支行

请注明:数据智能培训班

6月1日之前

报到时领取发票

现金方式

培训现场(不能刷公务卡或银行卡)

6月15日

 

提示:开具发票内容为培训费

  1. 培训费发票是由中国科学院文献情报中心开具的增值税普通发票(电子发票),通过报名登记邮箱发送给参会者,请注意查收邮件。由于设备限制不能刷卡。
  2. 汇款只接受公对公转账,支付宝、微信转账、个人汇款均不能开具单位发票。
  3. 发票抬头请与贵单位财务人员核实,发票一经开出,不能退换。
  4. 根据税务局有关规定,发票丢失不能重开发票,并且不能复印发票,请您知悉。

(二)食宿安排

普通代表:自行选择住宿酒店

培训班提供15-16日午餐和晚餐

 

六、报名方式

邮箱报名:

请将您的姓名、单位、联系电话和开发票信息发送邮箱:data@mail.las.ac.cn

 

七、联系方式

彭老师 13911997306   刘老师 17710233779 

办公电话:+86-010-62537554

电子邮件: data@mail.las.ac.cn