研究方向

本实验室从多年来的大数据技术研究工作中总结发现,大数据技术具有很强的“行业应用需求驱动”特征,同时,从研究开发的角度观察,大数据具有很强的领域交叉和技术综合的特点。从信息处理系统角度看,大数据是现有诸多计算技术的综合和集成,广泛涉及到大数据并行算法(Algorithms)、软硬件系统(Systems)和大数据应用(Applications)等主要层面,这也是本实验室PASA名称的由来。为了系统化地开展大数据技术研究,本实验室主要关注和开展的研究工作包括:

大数据体系结构和云计算技术 Big data architecture and cloud computing technologies
大数据并行计算模式与系统 Big data parallel computation models and systems
Hadoop/Spark性能优化与功能增强 Performance optimizations and enhancements for Hadoop/Spark
并行化机器学习和数据挖掘算法 Parallel algorithms for machine learning and data mining
大规模Web信息挖掘集成 Large-scale integration of web information mining
大规模文本语义分析挖掘 Large-scale semantic analysis of text mining
大数据行业应用 Application of big data industry

研究项目

近期承担的研究项目 Recent Research Projects

15.跨平台统一大数据分析处理与可视化编程系统平台

15.Unified Big Data Analytic Platform & Visual Programming System

江苏省科技厅重点项目(项目号BE2017155)

Jiangsu Province Science & Tech Research Program(# BE2017155)

2017-2020,项目负责人

2017-2020,PI

14.证券行情数据回放系统与统一大数据分析平台

14.Securities Market Data Replay System & Unified Big Data Analytic Platform

华泰证券

Huatai

2017-2018

2017-2018

13.基于Alluxio的多HDFS NameNode路由选择和热数据缓存

13.Multiple HDFS NameNode & Hot Data Cache Based on Alluxio

苏宁云商

Suning

2017

2017

12.面向分布式文件系统的统一性能评测与缓存调度优化关键技术研究

12.Research on the key technologies of the distributed file system unified performance evaluation and cache optimization

江苏省自然科学基金青年基金(项目号BK20170651)

National Natural Science Foundation of Jiangsu Province(#BK20170651)

2017.7-2020.6,项目负责人

7/2017-6/2020, PI

11.分布式文件系统通用化性能评测与缓存调度方法研究

11.Research on Unified Benchmarking Framework and Cache Optimization for Distributed File Systems

国家自然科学基金青年基金(项目号61702254)

National Natural Science Foundation of China(#61702254)

2018.1-2020.12,项目负责人

1/2018-12/2020, PI

10.精确信息定制服务Web信息抽取集成通用引擎与服务平台

10.Accurate Web Info Extraction and Integration Engine and Service Platform

江苏省科技支撑计划项目(项目号BE2011172)

Jiangsu Province Science & Technology Research Grant (#BE2011172)

资助额:60万,2011.4-2013.12,项目负责人

Funding Amount: RMB 600,000 Yuan, 4/2011-12/2013, PI

9.复杂结构的精确Web信息抽取集成模型与关键技术研究

9.Research on Model and Techniques for Web Info Extraction & Integration

国家自然科学基金面上项目(项目号61072152)

China National Science Foundation Research Grant(#61072152)

资助额:32万,2011.1-2013.12,项目负责人

Funding Amount: RMB 300,000 Yuan, 1/2011-12/2013, PI

8.大规模中文文本语义分析与医疗文本挖掘

8.Large Scale Chinese Text Semantic Analysis and Medical Record Mining

美国Intel Labs大学研究资助项目

USA Intel Labs URO Funding

资助额:US$ 6万,2013.4-2014.3,项目负责人

Funding Amount: US$ 60,000, 4/2013-3/2014, PI

7.HBase二级索引与查询技术研究

7.Secondary Index and Query for HBase

中兴通讯

ZTE, China

资助额:35万,2013-2014,项目负责人

Funding Amount: RMB 350,000, 2013-2014, PI

6.Gradient Boosting决策树Spark并行化训练算法研究

6.Gradient Boosting Decision Tree Parallel Training Algorithm with Spark

百度主题研究项目

Baidu Research Project

资助额:10万,2014,项目负责人

Funding Amount: RMB 100,000, 2014, PI

5.大规模软件结构智能化分析平台与并行化算法

5.Intelligent Platform and Parallel Algorithms for Large-Scale Software Structure Analysis

中国华为

Huawei,China

资助额:100万,2015.10-2016.10,项目负责人

Funding Amount: RMB 1,000,000 Yuan, 10/2016-10/2016, PI

4.大数据分析计算统一编程框架与软件平台

4.Unified Programming Framework and Software Platform for Big Data Analytics

江苏省科技支撑项目

Jiangsu Province Science & Technology Research Grant

资助额:50万,2014.4-2017.12,项目负责人

Funding Amount: RMB 500,000 Yuan, 4/2014-12/2017, PI

3.大数据机器学习与数据分析统一编程模型与关键技术

3.Unified Programming Model and KeyTechniques

国家自然科学基金面上项目(项目号615722)

China National Science Foundation Research Grant(#61572250)

资助额:78万,2016.1-2019.12,项目负责人

Funding Amount: RMB 780,000 Yuan, 1/2016-12/2019, PI

2.面向大数据的媒体内容分析与关联语义挖掘研究

2.Research on Big Media Data Content Analysis & Associated Semantic Mining

国家自然科学基金专项基金项目(项目号61223003)

China National Science Foundation Special Research Grant(#61223003)

资助额:300万,2013.1-2016.12,项目主要参与者

Funding Amount: RMB 3 Million Yuan, 1/2013-12/2016, Co-PI

1.Apache Spark 与 Tachyon优化与功能增强

1.Optimization and Enhancement for Apache Spark and Tachyon

UC Berkeley AMP实验室开源联合研究项目

UC Berkeley AMP Lab Joint Open Source Research Project

2014-2015

2014-2015