News Center

Adhering to AI foundation software innovation, DataCanvas becomes the first member to join the large model ecological cooperation community

2023.07.13Source: C114通信网

C114讯 7月13日消息(陈宦杰)WAIC 2023期间,中国信通院宣布发起成立大模型生态合作共同体,旨在构建政、产、学、研、用各方共同参与的开放合作平台,助力我国人工智能大模型的研发和产业化进程,提升我国在人工智能领域的国际竞争力。专注于AI基础软件自主研发与技术创新的九章云极DataCanvas作为通用大模型代表企业,成为大模型生态合作共同体首批创始成员单位。

07131.png

在接受C114的采访时,九章云极DataCanvas联合创始人尚明栋以AI基础软件的重要性为切入点,介绍了未来模型训练的新范式,并就九章云极DataCanvas对于推动AI技术跨越最后一公里鸿沟的思考与实践进行了分享。

07132.jpg

大模型时代下,AI基础软件地位更加凸显

自年初以来,ChatGPT点燃了全民对大模型的热情。人们将大模型视作能够革新现有APP的底层工具,有望重新定义消费习惯,衍生出新一代互联网流量入口。在尚明栋看来,大模型时代更需要完整基础设施的升级,而不是依靠单个大模型解决所有问题。

算力、数据、AI基础软件是构成人工智能基础设施不可或缺的三要素,三者相辅相成,缺一不可,各要素的每一次提升与优化都关乎大模型能否实现跨时代的发展。

算力方面,中国正整合网、云、数、智、边、端、链等多层次算力资源,大力推进算力网络建设。未来,算力成本下降的程度会快于模型大小的增长,算力将不会是鸿沟。数据方面,世界知识,行业知识,企业知识的三层边界依然存在,数据有效存储、计算和流通仍有较大的成长空间。

尚明栋表示,未来随着算力性能逐渐同质化和标准化,数据的差异性和企业需求的个性化逐渐加大,AI基础软件将成为模型训练效率和算力使用效率的决定性因素。作为模型生态系统的中坚力量,AI基础软件将会成为大模型应用落地的最主要的效率支撑。

尚明栋介绍,“未来,是大模型+小模型的时代,大模型和小模型的融合使用,大模型的小型化,或者以大模型为底座的小型化微调,这种模型训练新范式,能够有效降低模型的产生门槛,帮助客户在不同的场景实现成本、效果、收益的平衡。”

New AI·New Data·New Software,加速大模型落地

值得注意的是,大模型在业务中发挥价值不是简单的拿来主义,依然要解决落地的最后一公里和业务价值。强大灵活的基础软件,开放弹性的白盒模型,理解业务的从业人员,能够加速实现最后一公里的跨越。以此为目标,九章云极DataCanvas于近期发布了AIFS人工智能基础软件和DataPilot数据领航员两大AI产品体系。

据介绍,AIFS是一款人工智能应用构建基础设施平台,主要包括DataCanvas Alaya九章元识大模型、DataCanvas APS机器学习平台、DataCanvas BAP面向业务自动建模平台、开源DAT自动机器学习软件、开源YLearn因果学习软件等工具,覆盖了大模型的训练、精调、压缩、部署、推理和监控以及小模型的全生命周期过程。它为数据科学家、应用程序开发人员和业务专家提供了一套工具,使不同角色的人员可以相互协作,轻松地处理数据并使用这些数据来开发、训练和部署任何规模的模型。

其中,DataCanvas Alaya九章元识大模型,具有“通识+产业”系列模型矩阵、多模态大模型、优化的训练机制和友好的开源协议管理等特点。在开源支持方面,九章元识不仅支持Apache 2.0协议,还为用户提供白盒模型。

DataPilot数据领航员是一款数据架构工具产品,其特性包括多模“向量海”数据架构,按需自动化数据集成、代码生成、流程编排和分析计算,以及基于自然语言的数据获取、分析和机器学习建模能力。DataPilot能够大幅降低数据集成、治理、建模、计算、查询、分析、机器学习建模全链路的技术门槛,打造一种数据处理新范式,赋能用户实现数据在建模过程中的全生命周期的智能化与自动化。。

随着AI技术不断演进,全球正在经历从“软件”时代向“思维件”时代的跨越。传统“软件”围绕着需求分析、产品设计、代码实现三个环节不断迭代的过程,是一种“被动响应需求”的范式。而“思维件”,则是以“思维”为核心的软件进化新范式。目前,九章云极DataCanvas已成功研发“思维件”实验性产品TableGPT。该产品可通过对自然语言的识别与处理,响应数据使用者需求,整个数据分析过程用户无需了解任何技术细节,可大大降低结构化数据分析的难度。

发力“云中云”,打造基础软件核心竞争力

为了打造在基础软件赛道的核心竞争力,持续壮大自主创新的产业生态,九章云极DataCanvas敏锐地意识到,需要将自主研发的基础软件及相关AI能力,嵌入到千行百业的行业云、区域云、企业云、联盟云等千朵云中,形成“千云之中的AI云”。

“我们认为,中国将来一定不是一个三朵云的生态,会是一个百朵云,甚至是千朵云的生态。云本身还代表了生态的协作,有的厂商提供芯片算力,有的厂商提供数据架构数据库、数据仓库等组件。在此之上的AI层,一定需要基础软件的支撑。”

尚明栋指出,通过九章云极DataCanvas的人工智能基础架构和AI能力入驻千行百业的千朵云中,将实现AI能力的成倍输出,满足不同云生态的需求。与此同时,入驻的产品间还可以互联互通,不同的企业共享一个模型市场或数据市场,能够充分释放潜在的商业价值。

目前,九章云极DataCanvas正处于行业云深入落地的阶段,已经和多家政府、银行、运营商、云厂商达成合作,共同推进云化工作。

在采访的最后,尚明栋表示,九章云极DataCanvas坚持AI基础软件供应商的定位,以“开放、自动、云原生”为核心产品理念,在大模型+小模型的时代下,不断创新产品体系和产品功能,践行AI技术的融合创新,为我国自主开源生态构建输出中坚能量,持续不断地赋能千行百业各类业务场景的数据价值。