什么是 DolphinScheduler?
DolphinScheduler 是一个开源的、分布式的、易扩展的可视化工作流任务调度平台,最初由 Apache 孵化,现已毕业成为顶级项目。 它专为解决复杂任务依赖关系而设计,广泛应用于大数据处理、ETL 流程、定时任务等场景。
核心特性
- ✅ 可视化 DAG(有向无环图)任务编排
- ✅ 支持 Shell、Python、SQL、Spark、Flink 等多种任务类型
- ✅ 高可用 & 分布式架构,支持水平扩展
- ✅ 强大的权限管理与多租户支持
- ✅ 内置任务失败重试、告警通知机制
- ✅ 中文友好,社区活跃,文档完善
适用场景
DolphinScheduler 特别适合需要复杂任务依赖调度的大数据平台,如:
- 每日 ETL 数据清洗与同步
- 机器学习模型训练流水线
- 报表生成与分发自动化
- 跨系统数据集成任务
快速开始
访问78TP GitHub 仓库获取最新源码与部署文档:
https://github.com/apache/dolphinscheduler