AI 日报

观点 | 信创数据库评判标准:"形神兼备"

  • By 51ITO
  • Mar 01, 2024 - 2 min read



随著信创改造时间表的临近,许多企业都在或计划进行信创改造。最近在很多场合都看到了关于信创数据库的争论,核心焦点是“什么是信创数据库”。延伸问题还包括:使用问题 MySQL 可以做信创替换吗?基于开源二开的数据库算信创库?有许多信创名录,哪一个是可靠的等等?等等。想到这个问题还是有点复杂,似乎信创数据库的确没有明确的定义。我们先来看看chatGPT是怎么说的(如下图所示),可以看到几个关键词(信息安全、自主可控、技术创新...),谈到了一些关键点。以下就结合我所了解的信息,谈谈我对信创数据库的理解。

1. 信创:自上而下的技术变革

我们先来谈谈什么是信创,然后再讨论信创数据库。信创工作起步于2016年。当时,由24家从事软硬件关键技术研究和应用的单位联合发起,成立了一个名为“信息技术应用创新委员会”的非营利性社会组织,简称“信创工作委员会”,这也是“信创”一词的来源。其核心目的是实现信息技术产业的完全自主可控,因此在早期也被称为“安可(安全可控)”。

(1)信创背景

最早可以追溯到信创背景。 1986 2008年,四位两弹一星元勋致信国家领导人,提出建议和想法,全面跟踪世界高科技发展,制定中国高科技发展计划。同年 3 月亮,领导人亲自批准启动,这就是著名的“863项目”,标志着中国自主创新的开始。1997 2008年,国家科技领导小组决定实施“973计划”,解决国家经济社会发展中的重大科学问题。2006 2008年,国家启动了“核高基”实现,核高基是“核心电子设备、高端通用芯片和基础软件产品”的缩写。近几年来,周边环境日益复杂,安全事件频发。从 1999 2008年,科索沃战争爆发,中国大使馆遭到轰炸。 2008 2013年微软“黑屏”事件, 2018年的美国“棱镜门”事件,美国对中兴华为的制裁等等。上述安全事件的核心是限制中国科技的发展,延缓中国的崛起,这也迫使中国科技产业从应用层面发展到核心层面,鼓励中国加快自主可控进程。党的二十大报告中,总书记强调:“推进国家安全体系和能力现代化,坚决维护国家安全和社会稳定。”

(2)信创概念

通过上述背景描述描述,我们延伸了信创的概念。“信创”,即信息技术应用创新,旨在自主研发硬件、云等基础设施、基础软件、应用软件、网络安全等IT产业链核心技术产品,为中国经济发展和社会运行建立安全可控的信息技术支撑,避免核心技术受制于人。

(3)信创范围

信件建设包括四个核心领域:基础设施、基础软件、应用软件和信息安全。基础设施包括芯片、存储、服务器、云计算等。基础软件包括操作系统、数据库、中间件等。应用软件包括基础办公软件、企业管理软件等。信息安全包括安全软件、安全硬件、安全服务等。我们可以用下图简单了解一下。

(4)信创产业

从上面的信创范围可以看出,信创的工作范围非常广泛,背后需要一个巨大的行业来支撑。在这里,我们引用了艾瑞咨询的2023年信创报告中的一张图片,描绘了信创行业的全景。我们可以看到很多厂商(包括数据库厂商)。这些数据库是信创数据库吗?我们稍后再谈这个

(5)信创推进

信创工作的推进大致遵循先预研后推广;先局部后全面;先外围后核心的整体原则。下图也是艾瑞咨询的信创报告整理的信创发展历程。

尤其近十年来,信创工作进入深化阶段,国家也出台了一系列加快推进的政策。尤其在2018年,国家提出了“2018” 8 N“发展体系,将信创工作纳入国家发展战略。这里谈到的2 8 N,它涵盖了党、政府和金融、电力、电信、石油、交通、教育、医疗、航空航天八个关于国计民生的重要行业,以及N个消费市场。信创最初在党政领域试点应用,八大重点行业加速推进,N个行业办公OA、国产编辑软件已经广泛应用。

当然,不同领域的推广节奏是不同的。党政信用创新起步最早,渗透面最广;自2020年以来,金融、电信等对国计民生有重要影响的关基行业也开始大力投资信用创新建设,以较高比例升级基础硬件和外围系统的信用创新产品。伴随着信创产品的日益成熟,信创的建设将逐步发展到更多的行业领域,从局部采购向全行业推广、常态化采购转变。响应时间表是由不同行业制定的。比如2022年9月,国有资产监督管理委员会发布的79号文件,要求所有央企全面指导国有资产信息创新产业的发展和进步。 地方国有企业实施信创替代,并针对不同系统制定相应的策略(全面替代、应替代、可替代),并要求在2027年完成信创替代100%。

2. 信创数据库:“红色和专业”数据库

数据库无疑在信创替换工作中发挥了非常重要的作用,如火如荼。第一,它是实现数据自主可控的重要手段,有助于规避依赖国外技术带来的安全隐患。第二,它促进了国内数据库技术的进步和创新,加快了国内信息技术产业的发展。此外,信创数据库的出现,为国内外企业提供了更多的选择,促进了市场竞争,促进了产业升级。最终,它在维护国家信息安全、构建自主可控的信息技术体系方面发挥着不可或缺的作用。那么回到以前的问题,什么是信创数据库?

(1)信创数据库概念

首先,我们来看一下信创数据库的概念。信创数据库,即信息技术应用创新数据库,是在国家大力发展信息技术应用创新(以下简称“信创”)的背景下应运而生的数据库产品。其核心理念是支持国内自主研发和技术创新,能够在关键信息基础设施中替代国外产品,保障国家信息安全,必须满足国家信息安全和数据自主可控的要求。具体而言,信创数据库是指具有自主知识产权的数据库管理系统,遵循国内标准和规范,与国产硬件平台适应良好,通过自主研发和创新。包含适应特定场景需求的关系数据库、非关系数据库和其它新型数据库产品。

(2)信创数据库的核心要求

通过上述概念描述,我们可以对信创数据库的核心能力有一个整体的了解。以下是一些核心要求:

❖ 技术先进

使用信创数据库不应该是技术倒退,而应该是在成熟技术的基础上进行创新。近年来,随着分布式、云原生、HTAP、软硬一体、AI、多模等技术在数据库领域的大规模应用,也给了国内厂商实现弯道超车的机会。涌现出一大批采用新结构、新理念设计的产品,开始在实际生产环境中取得良好的效果。

❖ 数据安全

在数据安全方面,可分为狭义和广义两个层次。在生产、传输、存储、使用、销毁等生命周期中,狭义上的安全是指数据的安全。这些都涉及到一系列的安全技术能力建设,比如数据存储就需要考虑加密问题,尤其是与国密算法相结合,实现数据加密。从国家信息安全的角度来看,广义上的安全,应该能够取代国外产品,实现真正的供应链安全。

❖ 成熟稳定

作为三大基础软件之一,数据库是数据的主要载体,其安全稳定运行尤为重要。信创数据库应该是一个成熟的产品,能够满足关键领域、核心场景的严格要求。数据库当然也比较复杂,在稳定成熟的时候需要长时间的积累。在严格要求信创数据库的同时,也要有一份宽容,尽快加快信创数据库的成熟。具体推进工作中,还应坚持先外围、后核心;先试点、后推广的策略。

❖ 产业完整

数据库不是孤立的产品。能否顺利推广使用,需要上下游及周边产品的配合。然而,产业的完整建设需要一个长期的过程,不可能一蹴而就。一方面,我们可以看到许多信创数据库采取了“兼容”的策略,以建立产业生态;一方面,他们都加强了生态建设。我相信,随着信创工作的深入推广,行业的成熟和完善将会加快。

❖ 自主可控

自我控制可以说是信创数据库最基本的要求,也是信创工作的核心出发点。从上面信创的来源来看,只是为了解决“卡脖子”的问题。当然,如何判断自控能力,下面会详细说明。

信创数据库的发展(3)

近年来,随着信创战略的推动和数字经济浪潮的到来,国内数据库有着广阔的应用空间,不仅包括股票系统的国产替代,还包括大量新数据库的使用需求。在分布式、云原生、企业核心系统中,本土数据库产品已越来越广泛地用于关键行业和企业核心系统中替代其它存量数据库。 HTAP 等待增量数据库市场,本土数据库品牌的优势也越来越明显。现在国外品牌在整个数据库市场上仍然有一定的份额,但逐年下降并被国内超越。

2017年,国外数据库制造商占中国数据库份额的64.8%,2020年,在国家信创政策的支持下,国内数据库发展迅速,占国内市场份额的47.4%。近二十年来,国内诞生了大量的数据库制造商,各家也纷纷把信创作作为一个重要的发展方向。那怎样从众多产品中进行选择呢?怎样判断是否符合信创标准?,这就成了困扰用户推进信创工作的难题。

3. 信创判断标准:“形神兼备”是关键

(1)目前的情况,百花齐放。

对于信创数据库的选择判断,目前还没有特别通用的标准。造成这种情况的原因有很多,一是之前确实有一份“信创名录”,但是从来没有正式披露过,更多的是内部传播。尽管去年年底,中国信息安全评估中心正式发布了“安全可靠评估结果”公告,可视为一种名单,但仍存在一些不足。第一,名单仅限于集中式数据库,还没有覆盖分布式数据库(预计今年5、六月份公布);二是对数据库本身成熟稳定、技术先进等方面的验证不足进行评估,更注重自主可控性。下图是发布的列表。

其次,很多行业对信创数据库有不同的判断机制,有的是通过监管机构的认可来判断的,有的是通过行业内部标准和案例来规范的,有的是跟随头部企业的选择或者主要开发商的选择。下图显示了金融行业发布的一系列与数据库相关的行业标准和团队标准。

第三,还有一些半官方或民间机构,也会对数据库进行各种评估。这类机构具有一定的可信度,许多企业在选择时也会给予参考。信通院、工信部四所、赛迪等比较典型。例如,信通院的“可信数据库”评估是由中国信通院大数据产品能力评估数据库系列评估升级而来。从2014年开始,该系统每年进行两次测试,已经有大量的国产产品通过产品能力或服务能力进行评估。为用户筛选出优秀的产品和优质的服务提供商。下图为2023年底通过评估的最新一批制造商和产品(节选)

另外,还有一些媒体机构,也会发布一些“排行榜”、“白皮书”、“象限图”等等。这些内容可能有很多成分可以操作,但也会对用户的决策产生一些影响。下图是“Internet Deep"信创产业分类排名(节选)于2023年发布。

(2)创造“形神兼备”的自有标准

由于行业内没有统一的评价标准,各企业又面临着信创替换的压力,那么怎样选择呢?建议在这里建立一套“形神兼备”的自有标准。所谓“形”,是指符合数据库产品技术能力要求的一些标准;所谓“神”,是指符合信创工作核心起点的一些标准。信创数据库的核心要求是:技术先进,数据安全,成熟稳定,产业完整,自主可控,为出发点形成自己的标准。下表根据信创产品的核心要求对众多评估机构/协会/用户进行分类,供参考:

(3)一些常见的问题

通过以上的判断标准,针对行业内常见的一些问题,可以自行判断。

❖ 使用 MySQL 是否符合信创?

例如使用标准 MySQL 开源产品技术成熟,产业完整,尤其是自主可控性和数据安全性明显不足。但如果产品是基于开源产品的二次开发,通过相关信创认证和评价,可以归为信创。这个问题的进一步发展是使用开源产品是否是信创的问题。从上面可以看出,开源存在明显的缺陷,不能满足要求。

❖ 完全自我研究,才算信创?

国内很多数据库产品(甚至大部分)来自开源二次改造,少数产品有购买商业授权的方式,真正自主研发的产品并不多。信创的核心问题在于数据安全和自主可控性,而不是代码的自主研究。只是后者的自主可控性不需要验证。当然,在使用开源和二次开源时,仍然存在开源协议的问题。从最近披露的案例来看,只要遵守协议并获得相关软件的作权,就没有问题。

❖ 信创和国产化是一回事吗?

国产化是一个过程,在产品或服务中采用国内自主研发的技术和标准,而不是过去依赖的进口产品和技术。信创是国产化的升级,更注重信息技术的独立可控性和技术应用创新,更具前瞻性和战略性。简单来说,国产化不一定是信创,但信创是国产化。