南京大数据技术Meetup第十次会议
2017年11月4日,南京大数据技术Meetup第十次会议在南京大学仙林校区成功举行。此次会议由南京大学PASA大数据实验室与CCF YOCSEF南京分论坛主办,指导与支持单位包括中国计算机学会大数据专家委员会、江苏省软件新技术与产业化协同创新中心和江苏省计算机学会大数据专家委员会,会议合作媒体CSDN。本次会议邀请了来自东南大学计算机学院周德宇教授、灵犀联云技术总监朱颖航、量子数聚首席数据科学家冯娟、中电普华数据挖掘工程师丁明以及法海数据技术总监李建峰等五位技术专家进行了报告。除了技术报告之外,还吸引了星环科技、先智数据、灵犀联云和南京大学PASA大数据实验室等单位前来布置海报交流。参与人员方面,这次活动吸引了300多位大数据技术资深从业者、高校研究者和技术爱好者参加。他们分别来自华泰证券、苏宁易购、苏宁金融、华为、中兴通讯、中兴软创、中国移动、途牛、28所、南瑞集团、平安科技、Connext、埃森哲、帮投网、东软集团、焦点科技、方天电力、三厘米网络科技、美库尔、网谱数据、江苏欣网视讯、南京烽火、西安烽火、花去科技、华苏科技、金斯瑞生物技术、日冲软件、南京商数、南京拓步、银平信息、南京云蜻蜓、努比亚、上海联蔚科技、北京数联道、新景祥、益客集团、银河电子、南京大学、东南大学、南京航空航天大学、南京理工大学、南京农业大学、南京邮电大学、南京师范大学、河海大学、南京信息工程大学、南京中医药大学、南京工程学院、南京工业大学、江南大学、江苏大学、江阴职业技术学院、金陵科技学院等50多家企事业单位。
活动开始后,首先由东南大学计算机学院周德宇教授给大家作了题目为“大数据时代下的自然语言处理研究进展”的演讲。周教授的报告针对互联网时代下海量的网络文本,围绕自然语言处理的若干技术:关系抽取、事件抽取和情感分析展开阐述。首先,周教授介绍了基于深度学习的药物之间不良反应的信息抽取;然后,阐述了基于概率图模型的热点事件发现及其可视化以及面向网络文本的社会舆情分析等方面的研究;最后,结合工业界具体的应用案例,分析自然语言处理技术可能的发展方向和热点问题。周教授的报告视野广阔,对于理论和技术的讲解深入浅出,使得现场观众受益匪浅。
随后,灵犀技术资深服务器智能运维专家朱颖航对于大数据背景下的服务器智能维护给出了精彩的报告。他首先介绍了大数据时代数据中心维护的重要问题,随着服务器数量大幅度增长,更多的存储需求、更低成本硬盘的使用,以及高温、高存储密度等技术的应用,硬盘故障及报废规模呈明显增加趋势。这对业务稳定、存储成本和运维效率都造成了严重的影响;随后,详细分析了如何使用机器学习技术,挖掘、分析海量数据,打造可自动迭代的故障预测系统,并且能够支持全部厂商所有型号的SATA硬盘故障预测,其准确率超过98%,同时能够与系统调度集成,提前避免故障对业务造成不良影响,有效降低云存储系统的平均故障修复时间(MTTR)。其精彩的报告引起了现场观众的广泛兴趣,并在会后进行了深入交流。
接下来,量子数聚首席数据科学家冯娟给大家带来了一场题为“企业大数据在风控领域的应用与价值挖掘”的报告分享。首先,她指出企业大数据正以星火燎原之态向传统风控领域渗透。在数据来源、数据内涵、覆盖群体和模型思路上,企业大数据都有自己的特点;随后,详细地介绍了如何利用大数据信息对企业进行信用评价,除了可以作为借贷风控领域的有力补充,还可以在政府征信领域用于企业扶持、政府采购、政策评估、企业监管等多个场景;最后,通过实例分析的方式与现场观众进行了热烈的讨论。
中场休息的茶歇环节中本次活动设置了技术海报的展览和交流,一共有来自大数据应用服务、基础平台等领域的多个单位带来了他们的优秀成果,大家一边享用精美茶歇,一边交流技术。
活动的下半场,首先来自北京中电普华信息技术有限公司的数据挖掘工程师丁明给大家带来了题为“数据挖掘思维的基础”的技术分享。首先,他讲述如何在一年内快速入门数据挖掘的心得,从数据挖掘的思维框架讲起,结合自身丰富的数据挖掘比赛经验,从算法框架设计到代码实例实现,详细而全面的介绍了数据挖掘的理论与技术基础;接着,讲解了数据分析的四个常见类型,从多维度、多角度分析分享了自己对于特征工程的理解;最后谈到了数据挖掘优化的工作中常常接触的8种常见的任务类型,为想从事数据科学家的数据挖掘新人们,提供基础指导意见。
最后,法海风控技术总监李建峰和大家分享了题为“AI中的数据清洗”的技术报告。李总监结合自身丰富的实践经验,指出数据清洗,是整个数据分析过程中不可缺少的重要环节,干净的数据是机器学习的基础,其结果质量直接关系到模型效果和最终结论;然后,重点介绍了大数据时代数据清洗的重要性和必要性,通过对于数据清洗相关理论与技术的深入讲解,现场观众对于大数据时代的数据清洗有了更加清晰的认知。
在现场热烈的研讨中,时间过得飞快,为期半天的南京大数据技术Meet up第十次会议在大家的交流中圆满结束。本次活动加强了江苏省及周边地区大数据从业者的技术交流,在线上的大数据社区中也收到了良好的反响。技术在分享中进步,创新在交流中迸发。Meetup活动希望能为大数据技术的迭代创新贡献力量。感谢参加活动和为活动作出贡献的同仁,我们下次活动再Meet up!
活动主页:
http://www.huodongxing.com/event/6411201406400