开源社区健康指的是围绕一个开源项目形成的社区中关于项目的技术迭代、社区的组织架构、成员构成、开源治理、上下游协作、社区生态、商业化等多方面的多样性与管理、运作能力状态。这些因素在指导开源项目与相应社区不断发展的过程中至关重要。
今天为大家介绍的开源社区健康案例是 Apache SeaTunnel 社区,其是 2022 年度 OSC 中国开源项目评选 ——「2022 中国开源社区健康案例」获奖社区之一。
(一)社区发展现状
SeaTunnel(原名Waterdrop) 是一个云原生的高性能海量数据集成平台。美国时间 2021 年 12 月 9 日, SeaTunnel 以全票通过的优秀表现正式成为 Apache 孵化器项目,这也是 Apache 基金会中第一个诞生自中国的数据集成平台项目。目前,SeaTunnel 在 GitHub 上 Star 数达 4.3k+,Fork 815 次,社区达到 6000+ 人规模。截至目前,SeaTunnel 已经发布了 39 个版本,并经过大量企业生产使用。 Apache DolphinScheduler 社区组织架构如下: PMC<---Committer<---Contributor<---User 目前拥有 Apache Incubator Mentor:7 位 ,PPMC 成员:10 位,Committer:28 位,Contributor:153 位。 社区提供了丰富的方式与开发者进行互动,提供了国际开发者和用户交流的平台,包括建立微信/QQ 群(使用者群与贡献者群)、邮件列表、GitHub issues/discussions、Slack 和线下社区活动等,更符合国内外用户的使用习惯。 项目官网:https://seatunnel.apache.org/ GitHub:https://github.com/apache/incubator-seatunnel Slack:https://join.slack.com/t/apacheseatunnel/shared_invite/zt-1kcxzyrxz-lKcF3BAyzHEmpcc4OSaCjQ
(二)治理模式概述
Apache SeaTunnel(Incubating)遵守“Apache Way”的理念,即“项目独立、厂商中立、社区胜于代码、精英治理、同侪社区、共识决策、开放沟通、责任监督”。 我们认为,社区治理并非官僚行为,而是为了让大家尽可能简单、高效地对社区进行了解,同时大家也遵守同样的规则,“Apache Way”就是目前最适合我们的治理模式。
(三)关于开源社区的思考
社区运营方面:通过文章、视频、线上线下 Meetup 活动、峰会、用户访谈等多种方式把产品信息传达给用户,从互动中了解用户需求;建立社区贡献者激励机制,不断激活社区贡献者的创造力、凝聚力,共建社区;同时参与国际开源话题讨论,将中国的优秀开源产品推向海内外。
社区用户方面:截至 2022 年 12 月,SeaTunnel 社区成员达到 6000+ 人的规模,SeaTunnel 核心团队也参与到社区的运营维护中,为用户和开发者提供及时的答疑解惑;同时定期对用户进行调研,根据用户反馈不断更新完善SeaTunnel 的使用体验;SeaTunnel 已经过大量生产实践检验,在 Bilibili、新浪、水滴筹、搜狗、趣头条、唯品会、Shopee 等公司的生产实践中,广泛应用于海量数据集成、数据 ETL、数据聚合以及多源数据处理等场景中。
其他思考:
开发语言:在开发语言的选择上,你需要考虑该语言是不是较为通用的开发语言,以及使用这种语言开发的群体的规模。
产品功能:产品是社区的基础,你所提供的产品,可能需要帮助解决某一种特定场景的问题。它在刚开始的时候可以很简单,而并非一个大而全的项目。
持续的付出:你的开源项目可能是默默无闻的或者现在已经风光无限,但是你在某种程度上需要有一个持之以恒的心去维护它,或者称之为“不忘初心”。
第一个 PR:第一个参与项目的外部贡献者,可能需要你花一些时间/精力来不断地沟通。
使用者:你的使用者是对产品最好的认可,需要与第一批使用者交流沟通,可以让他为项目做一些背书。
开放的态度:需要有一个开放的心态,把自己想做、要做的事情,公开到社区里面,留下痕迹,让后续想了解项目的用户可以看到这些内容,而不是自己闭门造车。
文档准备:包括设计文档、安装文档、使用文档等,尽可能的齐全。
放低姿态:社区管理者需要放低姿态,不要一言堂、不要独裁。
教育:其实国内很多开发者对开源这件事情的了解还是不够,社区需要充当开源事业的布道者。
(四)社区规划
作为一个 Apache 孵化项目,Apache SeaTunnel 社区迅速发展,在接下来的社区规划中,主要有四个方向:
支持更多数据集成场景 (SeaTunnel Engine)用于解决整库同步、表结构变更同步、任务失败影响粒度大等现有引擎不能解决的痛点;
扩大与完善 Connector & Catalog 生态支持更多 Connector & Catalog,如TiDB、Doris、Stripe 等,并完善现有的连接器,提高其可用性与性能等;支持 CDC 连接器,用于支持实时增量同步场景;
支持引擎的更多版本如 Spark 3.x, Flink 1.14.x 等
更简单易用(SeaTunnel Web)提供Web界面以 DAG/SQL 等方式使操作更简单,更加直观的展示 Catalog、Connector、Job 等;接入调度平台,使任务管理更简单。
审核编辑 :李倩
全部0条评论
快来发表一下你的评论吧 !