南京大数据技术Meetup第十四次会议
为了推动我省大数据技术研究和应用发展,促进大数据技术和学术交流,江苏省计算机学会大数据专家委员会于2019年7月5日-7月6日在南京江北新区研创园成功召开了第七届江苏省大数据技术学术年会暨第十四届南京大数据Meetup技术交流会。会议到会的院校师生和企业界代表共计200多人,听取了8位专家学者丰富而精彩的学术技术报告。 本次会议由江苏省计算机学会大数据专家委员会主办,由南京大学PASA大数据实验室与江苏鸿程大数据技术与应用研究院联合承办,江苏软件新技术与产业化协同创新中心与南京江北新区产业技术研创园协办,同时中国计算机学会大数据专家委员会是本次活动的指导单位。大会赞助单位包括江苏鸿程大数据技术与应用研究院有限公司、南京杰世欣计算机科技有限公司、南京奥工信息科技有限公司、南京维数软件股份有限公司、江苏国泰新点软件有限公司。
会议于2019年7月6日上午9点开幕。开幕式由中国计算机学会大数据专家委员会副秘书长、江苏省计算机学会大数据专家委员会主任、南京大学黄宜华教授主持。江苏省计算机学会副秘书长游辉敏代表省计算机学会致开幕词。南京市江北新区研创园党工委书记、管办主任蒋华荣也亲临会议致辞。
接着是全天一系列的大数据技术主题报告。本次年会邀请了来自中科院计算所、微软亚洲研究院、上海大学、南京大学、科大讯飞、华泰证券、字节跳动、SHEIN公司的多位专家与学者,做了一系列精彩的大数据与人工智能学术和技术报告。
中科院计算技术研究所大数据研究院院长王元卓研究员作了“大数据与开放知识计算”的主题报告。报告首先介绍了网络大数据的概念,特点和主要分类,然后主要针对网络大数据中内容数据的特点,介绍开放知识网络模型特点和建模方法,最后结合中国古代诗词问答的具体应用场景,介绍了开放知识网络的典型应用场景和应用案例。
微软亚洲研究院资深研究员/经理秦涛博士作了题为“无标数据深度学习研究进展”的学术报告,报告主要介绍了近1-2年来基于无标签数据深度学习的最新进展。首先介绍了如何利用机器学习任务之间的结构对偶属性从大量无标签数据进行学习,包括对偶学习的基本概念、机器翻译中的多智能体对偶学习、语音合成识别中的对偶学习的最新算法。然后介绍了自然语言中基于无标数据的预训练方法,包括针对语言理解任务的BERT算法、针对语言生成任务的MASS算法。报告中介绍的算法在国际机器翻译大赛WMT 2019中的多项赛道获得冠军。
上海大学计算机工程与科学学院雷咏梅教授作了题为“面向大数据的分布式ADMM算法与编程计算框架”的学术报告,在总结介绍交替方向乘子法(ADMM)特点的基础上,介绍了分别从算法层面和实现层面进行的研究工作,设计基于参数服务器架构的分组并行ADMM编程与计算框架,为大规模机器学习中的一致性问题提供解决方案。最后,探讨了构建面向大数据分析处理的编程模型与编程方法。
南京大学PASA大数据实验室博士研究生朱光辉作了“自动化机器学习AutoML技术研究进展”的学术报告。报告介绍了自动化机器学习领域近几年来的研究现状与技术层面,包括自动化超参调优、自动化机器学习流水线设计及模型选择、自动化特征工程、自动化神经网络架构搜索,以及学术界在各个技术层面的最新研究进展。同时,本报告重点了介绍南京大学PASA大数据实验室在AutoML算法和系统方面的最新进展和成果。报告中介绍的AutoML算法连续两次在2018年国际AutoML挑战赛中(PAKDD AutoML2和NIPS AutoML3)取得第三名的优异成绩。
科大讯飞人工智能研究院副院长刘俊华博士作了“基于深度学习和自然语言处理的认知智能进展及应用”的学术报告。报告首先对当前基于深度学习的自然语言认知智能技术的最新进展进行介绍,并结合科大讯飞在认知智能方面的探索,重点介绍了阅读理解、语音交互、文本分析等关键技术,以及相关行业应用情况。最后对认知智能技术当前面临的问题和未来的发展进行了展望分析。
华泰证券大数据平台负责人韦永壮作了“华泰证券大数据平台技术演变之路”的大数据技术报告。报告首先介绍了华泰证券大数据平台建设各阶段的技术演变过程以及平台的组成。其次,介绍券商领域的数据种类特点和潜在的研究价值,以及当前大数据在华泰证券各个业务领域的重要作用,重点介绍了大数据背景下量化投资、行情分析和期权定价等金融行业特有的典型场景,并简要介绍华泰在这些领域所取得的研究成果。最后介绍了华泰证券建设一个集数据采集、资源调度、资产管理、数据开发为一体的数字化大中台。
字节跳动公司数据基础架构部南京研发中心负责人鲍永成作了“云原生在大数据领域技术的应用与实践”的技术报告,介绍了云原生技术及云原生技术对大数据领域的作用,云原生在大数据领域的现状和趋势,以字节跳动为例介绍云原生在大数据的落地实践,以及云原生在组织变革、devops文化推广上所需要的相应变革。主要技术包括支持主流计算框架容器化,按业务形态按需交付独立集群,底层资源统一高效调度,以及简化异构自研管理复杂性。
最后,SHEIN公司的ABC (AI+Bigdata+Cloud)基础平台组技术专家禹平作了“基于PaaS的云上大数据在电商领域的应用与实践”的技术报告,介绍了SHEIN技术部门在PaaS云平台之上建设整个大数据平台的过程与实践。报告在介绍背景与发展历程与对平台建设需求基础上,介绍了公司内部基于k8s自研的PaaS云平台,大数据的整体架构以及基于PaaS平台构建的大数据平台,包括消息平台、实时计算平台、数据服务平台的整个构建过程与使用现状。最后介绍了平台建设中的一些总结以及对未来的展望。
学术报告于下午4:40圆满结束。到会专家和会议代表们普遍认为,本次会议专家们的主题报告内容丰富精彩,学术技术水平高,参会后收获颇多,报告内容对学术界和业界在大数据与人工智能领域的学术研究、技术开发与行业应用,具有很大的指导意义和参考价值。