刚刚!Apache 董事会宣布终止 Apache Sqoop 项目
2021年05月06日,Apache Sqoop 的 PMC venkatrangan 给 Sqoop 项目的 dev 邮件列表发送了一篇名为《Seeking inputs on the Apache Sqoop project》的邮件:
如果想及时了解Spark、Hadoop或者HBase相关的文章,欢迎关注微信公众号:过往记忆大数据
不过几天过去了,看起来好像没有人有新的 roadmap。紧接着,5月14日,venkatrangan 又给社区发了一个投票《VOTE: Move Apache Sqoop to attic》
最后有三个 PMC 投票同意这个决定。
在6月16日举办的 Apache Board Meeting,董事会一致决定:Terminate the Apache Sqoop project(终止 Apache Sqoop 项目)!
Apache Sqoop 发展历程
Apache Sqoop 是一种用于 Apache Hadoop 和结构化数据存储(如关系数据库)之间高效传输批量数据的工具。我们可以使用 Sqoop 将数据从外部结构化数据存储导入到 Hadoop 分布式文件系统或相关系统,如 Hive 和 HBase。相反,Sqoop 可用于从 Hadoop 中提取数据并将其导出到外部结构化数据存储,例如关系数据库和企业数据仓库。
Sqoop 于 2009 年 5 月作为 Apache Hadoop 的贡献模块开始,最开始由 Aaron Kimball 开始贡献代码,参见 HADOOP-5815。随着项目的发展,Aaron 决定将 Sqoop 从 Hadoop 代码中分离并将其托管在其他地方,以加快开发和发布周期。因此,在 2010 年 4 月,Sqoop 从 Hadoop 中删除,具体参见 MAPREDUCE-1644,并由 Cloudera 公司以 Apache Licensed 开源协议在 GitHub 上维护。
在接下来的一年中,Sqoop 获得了广泛采用,并发布了 4 个版本和 191 个补丁。Sqoop 早期引入了一个扩展 API,允许开发高速第三方连接器,以便从专用系统(如企业数据仓库)快速传输数据。结果,很多供应商使用它开发了相关的连接器。为了支持这个由用户和第三方连接器供应商组成的新兴社区,Cloudera 决定把它贡献给 Apache。Sqoop 在 2011 年 6 月被 Apache 孵化器接受。一年后,2012年3月,Apache Sqoop 顺利毕业,称为顶级项目。
从2012年顺利毕业后,Apache Sqoop 一共发布了十三个版本,最后一个版本发布是2019年01月18日。截止到当前,已经两年多没有版本发布了。
董事会宣布停止 Apache Sqoop 项目
由于 Apache Sqoop 项目已经超过两年没有活跃,按照 Apache 的项目生命周期,其应该是 reached its end of life;所以需要将其从 Apache 项目移到 Apache Attic 项目中。一个项目可以通过两种方法进入 Attic:
•项目管理委员会(Project Management Committee,PMC)决定将项目移到 Attic 项目;•Apache 软件基金会的董事会解散 PMC 并选择将项目移到 Attic 。
而 Apache Sqoop 是通过第一种方式进行的。在这个月的 Apache 董事会会议中,一致决定停止 Apache Sqoop 项目。
对我们有啥影响
一个 Apache 项目被宣布从 Apache 中移到 Attic 项目并不是意味着这个项目不行了;也可能是这个项目太成熟了,以至于没有其他任何新的特性、Bug 修复,Apache Sqoop 应该就是这个。而且 Apache Sqoop 项目在国内外有很多用于在使用,是把关系型数据库的数据导到 Hadoop 上一个重要的工具。虽然 Sqoop 已经被宣布移到 Apache Attic,但是其实并不影响用户的使用,只不过以后就不会有官方来发布新的版本或者 bugfix,所以大家还是可以放心使用的。后面如果真的遇到 bug,可以自己维护个分支进行修复。
--end--
扫描下方二维码 添加好友,备注【交流】 可私聊交流,也可进资源丰富学习群
更文不易,点个“在看”支持一下👇