“技术创新背后是宏大的历史背景@@。中国蓬勃发展的数@@字经济带来自主创新的历史机遇@@,数@@据@@库@@是数@@字经济发展的底座和@@基石@@,云和@@恩墨@@抓住产业机遇@@,实现@@中国创造@@。”——云和@@恩墨@@创始人兼总经理@@、鲲鹏@@MVP盖国强@@

国际和@@国内环境的变化让我国信息产业自主创新更具时代意义@@,而基础软件的国产化是重点@@,数@@据@@库@@则又是重中之重@@。

数@@据@@库@@领域又以@@openGauss开源社区为典型代表@@,其打造了一个高性能@@@@、高安全@@、高可靠@@、高智能@@的开源数@@据@@库@@产品以及@@蓬勃发展的生态体系@@。

近日@@,openGauss Summit 2023在京成功召开@@,在主题为@@“耕获菑畬@@,创变未来@@”的云和@@恩墨@@数@@据@@库@@技术创新与@@应用实践@@分论坛上@@,云和@@恩墨@@分享@@了他们对于数@@据@@库@@产业的思考和@@实践@@@@。

持续技术创新@@,打造让用户真正用起来的产品@@

作为@@openGauss社区的首批理事单位之一@@,云和@@恩墨@@以其在商业数@@据@@库@@领域的深厚积累而著称@@,通过提炼自身的技术储备和@@抽象数@@据@@库@@领域的前沿洞察@@,云和@@恩墨@@致力于@@“将商业数@@据@@库@@的能力带入社区@@”,而这一努力的结晶就是@@MogDB数@@据@@库@@。

MogDB是云和@@恩墨@@基于@@@@openGauss开源内核进行增强提升@@,推出的一款@@“安稳易用@@”的企业级关系型数@@据@@库@@@@。

伴随@@openGauss三年多的开源历程@@、1000多个日夜@@,MogDB达成了超过@@1001项优秀品质@@,这其中包括超过@@1000项的特性@@增强和@@@@1套一体机解决方案@@。

● 1000多个特性@@增强包括兼容性改进@@、内核特性@@增强@@、可靠性增强等@@;

● 1套一体机方案@@,通过存算分离@@、多节点并发写入@@,结合云和@@恩墨@@的优势产品@@zData X和@@zCloud,能够为用户提供了一体化的极致性能@@、极致易用性的应用体验@@。

配合行业客户的数@@字化转型@@升级步伐@@,为了让@@MogDB在用户中真正用起来@@,云和@@恩墨@@还围绕实际应用场景配备整套工具链@@,方便用户进行新系统部署或者国产化替代@@。

云和@@恩墨@@·本原数@@据@@技术合伙人@@、数@@据@@库@@产品事业部总经理张皖川在演讲中介绍说@@,在替代场景中@@,MogDB提供了完整的迁移工具链@@,包括兼容性评估@@、离在线迁移以及@@最后的数@@据@@一致性校验@@,形成覆盖数@@据@@库@@迁移全生命周期的稳健支持@@@@。而在迁移后@@,MogDB提供包括高可用@@组件@@、安装部署工具和@@监控图形化工具等套件帮助用户实现@@安全@@、便捷的数@@据@@库@@管理@@。

为简化用户因不同应用场景而产生的大量改造工作@@,云和@@恩墨@@针对不同的应用场景特点和@@数@@据@@类型@@,推出了多样化的产品形态和@@部署模式@@。比如针对客户私有云容器化场景@@,云和@@恩墨@@推出了容器化部署的产品形态@@;针对物联网场景@@,云和@@恩墨@@在@@openGauss内核基础上进行了多模的拓展@@,开发了时序引擎和@@超融合时序数@@据@@库@@@@Uqbar,打造一站式物联网数@@据@@处理平台@@@@。

张皖川表示@@,经过三年多的研发@@,MogDB不仅继承了@@openGauss“四高@@”(高性能@@、高可用@@、高安全@@、高智能@@)特性@@,同时面向客户痛点并结合自身对成熟商业数@@据@@库@@的理解与@@技术洞察@@,围绕极致高可用@@@@、高性能@@密度@@、兼容能力增强@@、易用性提升等核心产品价值点@@,推出了大批创新特性@@并积极回馈社区@@。

今年年中@@,MogDB 6.0将正式推出@@。张皖川介绍道@@,新版本将提供全新迁移工具@@,在效率方面大幅提升@@——全量数@@据@@迁移峰值可达到每小时@@600GB,并做到不停机@@;增量迁移实现@@每秒三万条@@;通过采用更高效的校验算法@@,校验效率可以达到一小时@@500GB,使@@整个迁移过程更短@@、更加平滑@@,同时也支持@@断点续传的能力@@。

MogDB 6.0还将进一步完善异构数@@据@@库@@迁移割接长周期双轨并行@@,支持@@Oracle、MySQL等多种异构数@@据@@库@@到@@MogDB之间的双向结构与@@数@@据@@同步@@。在业务割接期间以及@@割接后@@,提供双轨并行能力@@,让异构迁移更安全@@,用户更放心@@。

Oracle兼容性在@@MogDB 6.0中将获得大幅增强@@@@,形成从@@上层客户端工具@@、驱动协议到底层内核的一套完整的端到端能力@@,具体表现在@@:

● 客户端工具层面@@,支持@@SQLPlus、SQLLoader、Pro*C;

● 驱动协议层面@@,大幅增强@@Python,ODBC、JDBC以及@@SQL API的兼容性@@;

● 语法接口层面@@,实现@@包括@@PLSQL在内的大量的语法适配和@@功能兼容@@;

● 内核层面@@,实现@@DDL和@@DML的行为兼容@@,DDL会自动提交@@,DML行为也会表现得跟@@Oracle完全一致@@。

“从@@可见的语法接口到不可见的行为机制@@,MogDB致力于全面保障业务的平滑迁移和@@正确运行@@。”张皖川做了强调@@。

在查询优化方面@@,MogDB 6.0中新增的扫描预读能力消除了@@IO延迟@@,扫描效率等同于全缓存扫描@@,达成最高@@2倍@@提升@@;哈希算子的优化则利用@@CPU缓存预取达成@@3倍@@加速@@,哈希连接端到端提升@@2倍@@,效率可比肩国外大型商业数@@据@@库@@@@。

在架构@@升级方面@@,MogDB 6.0将推出资源池化@@/存算分离的@@A-A(多活@@)架构@@。此架构@@将在极致高可用@@@@(RTO<10s),高性能@@密度@@(100T 级别@@OLTP核心系统@@)及系统弹性扩展方面极大提升产品竞争力@@,结合前面提到的兼容能力升级和@@查询优化增强@@,使@@MogDB具备了在大型核心系统@@场景平替国外商业数@@据@@库@@的能力@@。

目前@@,MogDB正加速在各行业中落地和@@普及@@。例如@@四川天府银行在现有容器平台@@@@上部署@@MogDB Container (MogDB容器版@@)集群来承载当前业务@@,同时配合@@MogDB集群统一运维管控平台@@@@MogDB Stack,形成覆盖数@@据@@库@@全生命周期的管理和@@监@@ 控能力@@;在此基础上与@@上层应用对接@@,构建出一套自主创新的@@“全栈容器化数@@据@@库@@管理新模式@@”,即@@:容器平台@@@@+MogDB container+MogDB Stack+APP container,实现@@全栈资源的统一调度@@、分配与@@管理@@。

不管是功能更新还是行业实践@@@@,MogDB在兼容性与@@性能优化方面的持续迭代@@,彰显了中国数@@据@@库@@技术持续突破的蓬勃生命力@@。

张皖川总结道@@,驱动创新的关键是找到并利用变量因素@@,比如硬件更新@@、算法换代@@、资源模型变更@@、用户应用需求拓展等@@。“硬件革新推动了向量化查询及无锁并发等算法换代@@以提升资源利用率@@,资源云化催生了云原生弹性架构@@@@,大模型及用户应用的多元化推动了多模数@@据@@库@@的发展和@@关系型数@@据@@库@@的能力拓展@@。”MogDB在数@@据@@库@@创新的路上让人充满期待@@。

认真看未来@@,云和@@恩墨@@走了一条与@@众不同的道路@@

图灵奖获得者@@James Gray曾说过@@,“如果你有眼光@@,就一定要追求有远见的研究@@。尽可能花时间去做自己引以自豪的事情@@,尽量不做无意义的事情@@。”

如果着眼于未来@@,我们能够洞察多久远的未来@@?云和@@恩墨@@创始人兼总经理@@、鲲鹏@@MVP盖国强@@说@@,当我们认真看未来@@的时候@@,我们真的可以看得很远@@。

云和@@恩墨@@投身到@@openGauss生态里面@@,融合学术和@@产业积累@@,深入数@@据@@库@@领域@@,做让自己自豪的事情@@。

例如@@云和@@恩墨@@的智能算法团队正在进行智能化相关探索@@,基于@@大模型进行@@DB-GPT训练@@,实现@@基于@@知识库体系的智能问答@@,并通过开放@@API和@@外部应用对接@@,满足数@@据@@库@@运维@@、DBA诊断等工作需要@@。而基于@@@@MogDB知识库训练@@的@@DB-GPT实践@@,能够解答关于数@@据@@库@@特性@@的具体问题@@,而不需要翻阅文档@@。

盖国强@@表示@@,AI和@@大模型@@,智能化和@@数@@据@@库@@@@,我们需要在精确性和@@模糊性之间寻找平衡@@。大模型智能代理@@(LLM Agent)能够持续助力提高问答精准性@@。例如@@,提供精确证据@@(Precise Evidence)是一种有效的方法@@;其次@@@@,引入外部知识库进行信息补充或确认也是一种可行的方式@@。

传统情形下@@,数@@据@@是以存储为中心的@@,而非面向用途@@。存储模型决定了数@@据@@如何被使@@用@@。而当模型更换时@@,模型之间的巨大差异可能导致之前的工作需要推倒重来@@。那么有没有更好的方法@@,能让开发者声明数@@据@@使@@用的意图而非数@@据@@存储的格式@@,然后让数@@据@@库@@根据应用场景生成匹配的数@@据@@格式和@@@@API?

数@@据@@意图语言@@(DIL,Data Intent Language)应运而生@@,用来描述数@@据@@的用途和@@格式@@,可以转变数@@据@@应用模式@@。SQL域是一种属于模式的字典对象@@,它封装了一组可选属性和@@约束@@,用于常见值@@。SQL域提供约束@@、显示@@、排序和@@注释属性@@。在定义一个@@SQL域之后@@,你可以定义与@@该域关联的表列@@,从@@而显式地将该域的可选属性和@@约束应用于这些列@@。因此@@,SQL域用于向存储的列@@(JSON或关系型@@)提供附加信息@@,并因此@@用于定义和@@验证数@@据@@@@。

受此启发@@,云和@@恩墨@@在@@数@@据@@库@@的可观测性@@、自动化运维@@、智能运维等方面进行了增强@@,将自身对于行业的洞察@@、理解和@@来自于用户的需求变成产品力@@。例如@@MogDB内置了时间模型@@,支持@@活动会话输出的负载模型@@;基于@@zCloud实现@@的@@MogDB运行监@@ 控可视化@@,支持@@实时预警@@,将可观测性提升到和@@国外大型商业数@@据@@相当的能力水平@@;在自治智能方面@@,基于@@故障树的智能诊断和@@基于@@机器学@@习@@的智能基线@@,实现@@从@@简化运维到@@DBAless。

在公司发展模式上@@,盖国强@@谈到@@,云和@@恩墨@@走了一条与@@众不同的道路@@。从@@数@@据@@库@@管理服务切入@@,扩展到数@@据@@库@@管理软件@@,进而打造核心产品@@MogDB,然后围绕@@MogDB构建完整的生态矩阵@@。

目前@@,云和@@恩墨@@与@@硬件@@/整机@@、云基础架构@@@@、芯片@@、操作系统@@、中间件@@、备份存储@@、应用软件厂商展开广泛的生态合作@@,公司多款产品陆续完成与@@众合作伙伴产品的兼容适配@@,为客户构建全方位的解决方案@@。在分论坛现场@@,云和@@恩墨@@与@@百信完成战略合作签约@@,并推出全栈国产数@@据@@库@@一体机解决方案@@。

“未来的世界是智能世界@@,智能世界的驱动力是数@@据@@@@。我们将自己定@@ 位成智能的数@@据@@技术提供商@@,助力用户实现@@数@@据@@驱动的智能未来@@。在这个愿景下@@,云和@@恩墨@@正在加倍@@努力@@,一步一步将智能的数@@据@@技术带到我们的产品中来@@,助力用户数@@字化建设和@@智能化演进@@。”盖国强@@最后说@@。

责任编辑@@:whybine