Fluid:开源的Kubernetes原生的分布式数据集编排和加速引擎

Perf
背景:

分布式文件系统是大数据生态环境中不可或缺的一部分,是上层计算框架和应用的基石。随着数据量的爆炸式增长,分布式文件系统得到了越来越广泛地使用,同时也出现了一批又一批新的分布式文件系统。

意义:
对分布式文件系统进行性能评测,能够:
  • 帮助用户为自己的应用选择最合适的分布式文件系统(在不同分布式文件系统上针对某一应用进行测试)
  • 指导开发者对分布式文件系统本身进行优化和改进(在一个分布式文件系统上进行多项测试)
  • 发掘出分布式文件系统研究和发展的方向和趋势(对不同分布式文件系统的测试进行比较)
Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI应用等。通过定义数据集资源的抽象,它的核心功能有:
  • 数据集抽象原生支持
  • 云上数据预热与加速
  • 数据应用协同编排
  • 多命名空间管理支持
  • 异构数据源管理

了解更详细的信息和动态,请点击:http://pasa-bigdata.nju.edu.cn/fluid.