南京大数据技术Meetup第十二次会议
2018年7月21日,南京大数据技术Meetup第十二次会议在南京大学仙林校区成功举行。此次会议由南京大学PASA大数据实验室主办,指导与支持单位包括中国计算机学会大数据专家委员会、江苏省软件新技术与产业化协同创新中心、江苏省计算机学会大数据专家委员会,会议合作媒体CSDN。本次会议邀请了国防科技大学、陆军工程大学曹建军博士、达观数据副总裁王文广先生、星环科技高级工程师李光跃先生、南京小安科技创始人孙斌、牛帆数据研发总监刘文杰、南京大学计算机系PASA大数据实验室 在读博士生麦丞程等六位技术专家进行了报告。除了技术报告之外,还吸引了星环科技、南京领添、小黑鱼APP、杰士欣和南京大学PASA大数据实验室等单位前来布置海报交流。参与人员方面,这次活动吸引了300多位大数据技术资深从业者、高校研究者和技术爱好者参加。他们分别来自华泰证券、苏宁易购、苏宁金融、阿里巴巴、华为、中兴通讯、中兴软创、中国移动、途牛、28所、14所、南瑞集团、览笛科技、江苏国泰新点软件有限公司、Connext、东软集团、焦点科技、江苏银行、领添、苏州乐韵、三厘米网络科技、北明软件、小黑鱼科技、运满满、达观数据、星环科技、南京烽火、嘉和投资、擎天科技、超智慧信息科技、华苏科技、联成科技、天数润科、银平信息、南京云蜻蜓、努比亚、联蔚科技、北京数联道、华坤道威、南京图慧、南京大学、东南大学、国防科技大学、南京航空航天大学、南京理工大学、南京农业大学、南京邮电大学、南京师范大学、河海大学、南京信息工程大学、南京中医药大学、南京工程学院、南京工业大学、江南大学、江苏大学、金陵科技学院等50多家企事业单位。
活动开始后,首先由国防科技大学、陆军工程大学软件工程学科硕士生导师,原解放军理工大学学术方向带头人曹建军教授给大家作了题目为“数据质量控制与数据治理方法研究与实践”的演讲。曹教授在报告中介绍数据质量研究框架,并分析大数据质量带来的新挑战的基础上,重点汇报信息质量研究组(Information Quality Research Group, IQRG)的数据质量控制与数据治理研究与实践总体思路、关键技术研究进展,以及相关系统平台研发和应用情况。曹建军教授的报告视野广阔,对于理论和技术的讲解深入浅出,使得现场观众受益匪浅。
随后,达观数据副总裁王文广先生给大家带来了一场题为“深度学习在自然语言理解和文本智能处理上的应用”的精彩报告。王总认为人工智能在近几年高速发展,理论与技术日益成熟,并逐步向每一个领域渗透,在图像处理,语音识别和合成,以及文本智能处理等领域广泛应用。在这个过程中,深度学习的发展功不可没。王总介绍了深度学习的发展情况,对自编码器,深度网络,卷积神经网络(CNN),递归神经网络(RNN)及其变种LSTM,GRU,残差网络,注意力机制等进行介绍。并且结合自己在自然语言理解和文本智能处理方面的实践,介绍深度学习下的表示学习,深度学习在自然语言理解(NLU)上的应用,以及结合深度学习和自然语言理解技术在金融,科技,法律,媒体等各个行业的具体应用。其幽默、精彩的报告引起了现场观众的阵阵掌声,许多嘉宾与观众在会后与王总进行了深入交流。
接下来,毕业于南京大学计算机系的星环科技高级工程师李光跃给大家带来了一场题为“大数据云的数据交换共享平台的架构探索”的报告分享。报告着重介绍在分布式文件系统、分布式数据库上的大数据共享交换的架构和实现。主要从多租户模型,权限管控,数据管理,任务调度和生命周期管理,工单审批/通知系统以及数据应用等对架构进行阐述,同时描述该架构在高性能、高可用、高并发的方面所做的工作以及下一步迭代改进的方向。最后,通过提问的方式与现场的观众展开了互动,引发了观众对于数据交换共享平台的架构的讨论与思考。李光跃风趣、精彩的报告使得现场的观众对于数据交换共享平台的架构有了更加直观、深入的理解。
中场休息的茶歇环节中本次活动设置了技术海报的展览和交流,一共有来自大数据应用服务、基础平台以及人工智能应用等领域的多个单位带来了他们的优秀成果,大家一边享用精美茶歇,一边交流技术。
活动的下半场,首先,小安科技创始人,孙斌先生给大家带来了题为“企业复杂关系网络大数据系统”的交流分享。孙总在报告中指出企业图谱大数据系统涉及企业之间、知识产权、主要管理人员之间、法律诉讼原被告等复杂网络分析,有模型 6 种:企业图谱、核心族群、关联探寻、最短路径、实际控制路径、最终控制主体构建了最为完整的企业社交关系,直观描绘了企业族群之间千丝万缕的关系,洞悉企业关联谱系,评估整体风险。整合全量社会主体,从企业发展扩张、知识产权、合规表现、商业贸易、人才需求等方面对企业进行多维画像,全方位多角度的动态监控发展变化。孙总让人耳目一新的报告令参加活动的众多大数据技术人员和科研人员都感觉受益匪浅。
随后,牛帆数据研发总监刘文杰先生给大家带来了一场题为“资本市场智能大数据挖掘系统NiuFind”的精彩报告。刘文杰先生介绍了自主研发的NiuFind系统,该系统于资本市场智能大数据挖掘,主要为券商、投资机构、银行提供资本市场大数据服务、投融/并购业务挖掘、投资研究与退出管理服务。处理的数据包括来自于数据提供商和网络的结构化数据、半结构化数据以及公告、新闻、自媒体、UGC内容、机构研报等非结构化数据。数据具有范围广、来源多、噪声大、更新快的特点,要求基于语义实时建立数据间的逻辑关系。报告中,刘先生介绍了NiuFind设计实现过程中采用的一些技术,包括神经网络、决策树、OCR识别、自然语言处理、Hadoop、粗粒度索引技术、ETL高并发计算、Spark框架、监督型机器学习等。为想从事该方向的新人们,提供基础指导意见。
最后,由南京大学计算机系PASA大数据实验室在读博士生麦丞程给大家做了题为“基于关键词抽取的大规模事件发现研究”的报告。麦博士结合自身丰富的实践经验,以政府部门推出的“12345在线”服务平台的实际需求为导向,旨在通过大数据与人工智能技术,对海量的工单数据进行分析,发现其中的热点事件、紧急突发事件及其演变过程,为政府决策提供依据。首先,提出了一种基于改进的点互信息与邻接熵的新词发现方法;然后,提出了一种基于关键词抽取的事件发现方法,从时间、地点、语义以及事件主题等不同的视角对事件进行发现与聚合;最后,提出了一种基于Spark的大规模事件并行化发现算法,形成处理大规模政务文本数据的能力。麦博士的报告引起了现场很多文本大数据专家的关注与讨论。
在现场热烈的研讨中,时间过得飞快,为期半天的南京大数据技术Meet up第十一次会议在大家的交流中圆满结束。本次活动加强了江苏省及周边地区大数据从业者的技术交流,在线上的大数据社区中也收到了良好的反响。技术在分享中进步,创新在交流中迸发。Meetup活动希望能为大数据技术的迭代创新贡献力量。感谢参加活动和为活动作出贡献的同仁,我们下次活动再Meet up!
活动主页:
http://www.huodongxing.com/event/7448261490711