查看原文
其他

中国对PostgreSQL的贡献约等于零吗?

冯若航 非法加冯 2024-01-11

飞总今天发了一篇《2023年,中国对PostgreSQL的贡献≈0!!!》,振聋发聩。所以我特意去扫了一遍 PostgreSQL 生态的开源项目,看一看这里中国人或者中国公司作为主导者,或主要贡献者的到底有多少。

内核贡献者

不幸地是,在内核贡献上也许让飞总言中了 —— 对于 PostgreSQL 这样堪称全世界最成功的开源项目之一:没有什么中国的公司,中国人,在里面扮演了重要的角色 —— 别说 PostgreSQL 核心组(Core Team)了,就连一个主要贡献者(Major Contributor)都没有。当然可以出于政治正确的原因,把来自中国台湾的主要贡献者 Julien Rouhaud 算进去 —— 但这就有点自欺欺人了。

PostgreSQL全球贡献者名单

次要贡献者中,并非没有来自中国的身影。比如《PostgreSQL国际社区授予PG 16版本贡献者荣誉奖章》里就有 15 位中国人的身影。我们也经常能看到 Pivotal 系,阿里,瀚高,成都文武等几个公司的人出现在其中作出自己的贡献。

从 PostgreSQL 社区的观点来看  —— 如核心组成员 Jonathan Katz的《展望PostgreSQL的2024》,PostgreSQL 社区不仅仅关乎数据库内核代码仓库,而关乎整个社区的方方面面 —— 包括相关的开源项目活动和社区发展。那么在这方面中国又做的怎么样呢?

生态开源项目

OSSRank 是一个收录开源项目的网站,其中收录了 188个 PostgreSQL 生态开源项目。我依次扫过了这 188 个项目的贡献者名单,看看有没有中国公司/中国人主导的。标准很简单:贡献者前五名,或者只要至少有十几条贡献的,名字疑似中文或难以确定的贡献者,我就点进去看。

https://ossrank.com/cat/368-postgresql-extension


可惜的是,在这个榜单上的 PG生态开源项目中,只有四个项目满足这一标准,分别是:


36名 Pigsty:冯若航@北京

51名 duckdb_fdw:alitrack@杭州

75名 zhparser:amutu@深圳

118名 pg_roaringbitmap:陈华军@苏宁


这几个项目我都很熟悉,Pigsty 就是我自己写的,提供开源PG发行版与本地RDS。duckdb_fdw 提供对 duckdb 的外部数据源包装器。zhparser 提供中文分词能力,pg_roaringbitmap 提供 RoaringBitmap 压缩位图数据类型,这俩扩展还是我自己编译打包发行,收录在 Pigsty 扩展包里的。

当然,你还是可以把台北的 PG 主要贡献者 Julien Rouhaud 算进来。那么又多了五个项目:Powa, HypoPG, pg_qualstats, pg_stat_kcache, pg_track_settings ,只不过还是那句话:自欺欺人罢了。

活动与社区发展

那么 PostgreSQL 的社区建设与活动又如何呢?相比国际同行,PostgreSQL 在中国的使用率是严重偏低的。例如在2023年全球开发者调研中, PostgreSQL 已经超越 MySQL 成为最流行的数据库了( 45.6% vs 41.1%,专业开发者中更是达到 49.1%)。但是在中国,MySQL 的用户群/实例数/流行度约是 PostgreSQL 的五倍,与全球水平严重脱节,说一句社区失职并不为过。

中国确实有不少关于 PostgreSQL 的活动,比如每年的 PostgreSQL中国技术大会,各种沙龙与城市巡讲。不过很多活动都沦为厂商推销产品的展销会,纯技术或者管理最佳实践越来越少,这一点也是很让人扼腕。

当然,这些现象也可能跟中国搞信创安可自主可控有关。近三百多款“国产数据库”,有百分之三四十是基于 PostgreSQL 换皮、套壳、魔改的。中国基于开源产品 “研发” 了那么多的数据库,而绝大多数却没有对开源社区有任何方式上的回馈 —— 反而经常出现分裂社区,劣币驱逐良币的情况。

如果这些是真的自主可控解决卡脖子问题也就算了。然而问题在于,和真正吃了制裁的俄罗斯一比 —— 人家就是开源的 PostgreSQL 自主替代吃遍天,哪有这种乱象呢?

再这么大炼数据库搞下去,恐怕美国不制裁,中国自己就脱离开源社区球籍 —— 断了技术输液管,开心的只能是垄断关系户,而受损的是用户和国家了。


《数据库真被卡脖子了吗?》


参考阅读

展望PostgreSQL的2024 (Jonathan Katz)

2023年度数据库:PostgreSQL (DB-Engine)

PGSQL x Pigsty: 数据库全能王来了
PostgreSQL:世界上最成功的数据库
AI大模型与向量数据库 PGVECTOR
更好的开源RDS替代:Pigsty
PostgreSQL 到底有多强?
为什么PostgreSQL是最成功的数据库?
PG好处都有啥?

MySQL的正确性为何如此拉垮?

数据库应该放入K8S里吗?
把PG放入Docker是一个好主意吗?
向量数据库凉了吗?
EL系操作系统发行版哪家强?
基础软件到底需要什么样的自主可控?
如何看待 MySQL vs PGSQL 直播闹剧
向量是新的JSON 【译评】
分布式数据库是伪需求吗?
数据库需求层次金字塔

重新拿回计算机硬件的红利

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存