研究方向

本实验室从多年来的大数据技术研究工作中总结发现,大数据技术具有很强的“行业应用需求驱动”特征,同时,从研究开发的角度观察,大数据具有很强的领域交叉和技术综合的特点。从信息处理系统角度看,大数据是现有诸多计算技术的综合和集成,广泛涉及到大数据并行算法(Algorithms)、软硬件系统(Systems)和大数据应用(Applications)等主要层面,这也是本实验室PASA名称的由来。为了系统化地开展大数据技术研究,本实验室主要关注和开展的研究工作包括:

大数据体系结构和云计算技术 Big data architecture and cloud computing technologies
大数据并行计算模式与系统 Big data parallel computation models and systems
Hadoop/Spark性能优化与功能增强 Performance optimizations and enhancements for Hadoop/Spark
并行化机器学习和数据挖掘算法 Parallel algorithms for machine learning and data mining
大规模Web信息挖掘集成 Large-scale integration of web information mining
大规模文本语义分析挖掘 Large-scale semantic analysis of text mining
大数据行业应用 Application of big data industry

研究项目

近期承担的研究项目 Recent Research Projects

1.Apache Spark 与 Tachyon优化与功能增强

1.Optimization and Enhancement for Apache Spark and Tachyon

UC Berkeley AMP实验室开源联合研究项目

UC Berkeley AMP Lab Joint Open Source Research Project

2014-2015

2014-2015

2.面向大数据的媒体内容分析与关联语义挖掘研究

2.Research on Big Media Data Content Analysis & Associated Semantic Mining

国家自然科学基金专项基金项目(项目号61223003)

China National Science Foundation Special Research Grant(#61223003)

资助额:300万,2013.1-2016.12,项目主要参与者

Funding Amount: RMB 3 Million Yuan, 1/2013-12/2016, Co-PI

3.大数据机器学习与数据分析统一编程模型与关键技术

3.Unified Programming Model and KeyTechniques

国家自然科学基金面上项目(项目号615722)

China National Science Foundation Research Grant(#61572250)

资助额:78万,2016.1-2019.12,项目负责人

Funding Amount: RMB 780,000 Yuan, 1/2016-12/2019, PI

4.大数据分析计算统一编程框架与软件平台

4.Unified Programming Framework and Software Platform for Big Data Analytics

江苏省科技支撑项目

Jiangsu Province Science & Technology Research Grant

资助额:50万,2014.4-2017.12,项目负责人

Funding Amount: RMB 500,000 Yuan, 4/2014-12/2017, PI

5.大规模软件结构智能化分析平台与并行化算法

5.Intelligent Platform and Parallel Algorithms for Large-Scale Software Structure Analysis

中国华为

Huawei,China

资助额:100万,2015.10-2016.10,项目负责人

Funding Amount: RMB 1,000,000 Yuan, 10/2016-10/2016, PI

6.Gradient Boosting决策树Spark并行化训练算法研究

6.Gradient Boosting Decision Tree Parallel Training Algorithm with Spark

百度主题研究项目

Baidu Research Project

资助额:10万,2014,项目负责人

Funding Amount: RMB 100,000, 2014, PI

7.HBase二级索引与查询技术研究

7.Secondary Index and Query for HBase

中兴通讯

ZTE, China

资助额:35万,2013-2014,项目负责人

Funding Amount: RMB 350,000, 2013-2014, PI

8.大规模中文文本语义分析与医疗文本挖掘

8.Large Scale Chinese Text Semantic Analysis and Medical Record Mining

美国Intel Labs大学研究资助项目

USA Intel Labs URO Funding

资助额:US$ 6万,2013.4-2014.3,项目负责人

Funding Amount: US$ 60,000, 4/2013-3/2014, PI

9.复杂结构的精确Web信息抽取集成模型与关键技术研究

9.Research on Model and Techniques for Web Info Extraction & Integration

国家自然科学基金面上项目(项目号61072152)

China National Science Foundation Research Grant(#61072152)

资助额:32万,2011.1-2013.12,项目负责人

Funding Amount: RMB 300,000 Yuan, 1/2011-12/2013, PI

10.精确信息定制服务Web信息抽取集成通用引擎与服务平台

10.Accurate Web Info Extraction and Integration Engine and Service Platform

江苏省科技支撑计划项目(项目号BE2011172)

Jiangsu Province Science & Technology Research Grant (#BE2011172)

资助额:60万,2011.4-2013.12,项目负责人

Funding Amount: RMB 600,000 Yuan, 4/2011-12/2013, PI