中科曙光(603019):曙光消息财产股份无限公司向不
|
综上所述,公司本次募投项目所涉及的产物均具有广漠的市场空间,且跟着人工智能行业的成长其市场增速较着。公司正在相关产物及使用范畴均已积极结构,同类产物推出市场后取得了优良的市场反馈,公司正在场景使用、客户拓展、生态合做等方面均成立了本身的行业劣势,可充实支持募投项目产物的市场发卖。
本项目研发国产化先辈存储系统,其具有高并发、低时延、高靠得住的焦点特质,和人工智能锻炼取推理营业对海量数据高速读写、极致低时延、高带宽的需求精准婚配,可以或许全方面计较芯片的算力,满脚海量多模态数据的处置需求,为人工智能所需要的焦点底层存储能力供给支持。
本项目研发面向企业级市场的AI大模子一体机软件平台,通过建立一个集模子仓库、智能训推、可视化微调、场景化使用于一体的全栈软件系统,将复杂的AI根本设备取专业手艺封拆为“开箱即用”的尺度化产物。该平台分为五个次要模块:焦点平台取资本办理、低代码训推办事、可视化微调锻炼、场景化使用取集成套件、平安合规取运营保障。
正在算力集群产物范畴,部门行业头部企业也持续投入研发,近年来推出雷同产物并迭代升级,例如英伟达NVL72产物、海潮消息元脑SD200超节点产物、新华三H3CUniPoDS80000和H3CUniPoDF80000超节点产物等。取同业业公司比拟,中科曙光面向人工智能的先辈算力集群系统项目标合作劣势表现正在。
颠末前述研究堆集,公司经审慎研判认为正式实施本次募投项目标机会曾经成熟,并完成项目立项。本次各募投项目均构成了相关的产物储蓄、环绕霸占手艺难点曾经构成了必然手艺储蓄及人员储蓄,项目实施具有的根本。
超节点是先辈算力集群里的根本积木块,是面向高机能计较取人工智能场景设想的高密度异构融合计较节点。超节点正在单一物理机箱内集成多颗AI加快芯片、高速片间互连链、高带宽内存取I/O模块,并采用一体化供电取散热架构,构成具备计较、通信、存储拜候能力的高机能计较单位。其焦点价值正在于通过高速片间互连降低多芯片协同计较的通信延迟,提拔算力密度取能效比,是建立超大规模先辈算力集群的根本摆设取安排单位。
正在全球及国内人工智能算力需求呈现持续快速增加的趋向下,先辈算力集群系统做为软硬件深度协同、集成手艺立异、具备更高机能和更优能效的环节算力根本设备,将具有愈加广漠的市场空间。
本次募投项目扶植次要为现有产物研发工做的延续和升级,公司已有岗亭人员技术总体满脚项目需求。募投项目投入的人员将以公司现有研发人员为从,正在特定范畴还会针对项目特点新引进部门专业人才,扩充研发实力。公司现有研发团队具备取募投项目相关的手艺堆集,可以或许无效支持项目推进。
如前所述,面向人工智能的先辈算力集群系统项目录要研发或升级超节点硬件系统、高速互连络统、系统级根本软件栈、异构算力资本办理运营平台等环节手艺,努力于提拔先辈算力集群系统全体机能。项目录要冲破算力大、通信强场景带来的算力不脚、散热能耗高、带宽不敷、和谈不兼容、算力安排难等瓶颈问题。目前,公司已控制算力集群相关的焦点手艺,正在相关范畴具有充脚的手艺堆集,已取得发现专利跨越600项。公司正在先辈算力集群范畴已构成一支行业领先的高程度研发团队。公司于2025年发布的scaleX640超节点是全球首个单机柜级640卡超节点,并初次以超节点概念建立万卡超集群。公司将基于现有的scaleX超节点手艺、scaleFabric互连收集手艺、DeepAI深算智能引擎软件栈进行继续开辟。本项目扶植的下一代产物正在延续当前总体硬件架构根本上,支撑下一代更高算力的国产GPU卡并兼容分歧厂家产物,超节点规模从当前的640卡向1024卡及更多卡迈进,收集接口速度从400Gbps向。
公司演讲期内推出的全闪存产物的FlashNexus8000系列凭仗登顶 2025年SPC-1的优胜机能、RAID-QC的高盘级冗余策略,正在金融、 通信、医疗、能源等范畴均实现了市场落地。本项目基于FlashNexus 集中式全闪存产物进行升级。针对部门产物利用国外芯片、拓展度受 限的环境,将硬件改版改换PCIeSwitch芯片为国产,并调整PCIe拓 扑,提拔双节制器最大可支撑的数据盘数能够达到175pcs,硬盘扩展 框可支撑级联,降低零件扩容成本。导入新一代国产CPU,预期可提 升带宽能力,降低功耗。节制器内25块盘的总带宽机能可最大提拔 30%,降低零件工做功耗10%以上。
先辈算力集群系统将芯片、算法、框架等软硬件环节环节整合,构成高效协同的处理方案,能够更好地满脚国内AI使用场景的多样化需求,推进国产先辈算力集群系统研发能无效降低对外部手艺的依赖,提拔财产链的自从可控能力,是实现人工智能财产自从可控及高质量成长的必然选择。
面向人工智能的先辈算力集群系统是专为大模子锻炼、推理、多模态使用、科学智能(AIforScience)等使命设想的超大规模分布式计较根本设备,焦点是把成千上万以至十万以上规模的AI加快芯片通过高速收集和智能安排整合成一台“超等计较机”,为AI计较供给海量、高效、不变的算力,是AI时代的“算力发电厂”。其将来的典型使用场景包罗:万亿参数通用大模子锻炼;金融、医疗、工业、从动驾驶等行业大模子微调/推理;文生图、文生视频、数字人、元衬着等多模态AI使用;天气模仿、药物研发、基因测序、高能物理等科学智能使用等。
1、升级超等地道手艺,因为文件系 统的IO拜候径较块拜候更为复 杂,且需要引入锁多客户端一 致性语义,相较于块存储和谈存正在 机能丧失,需要针对性进行机能调 整。正在块存储达到高机能的根本 上,对文件系统的机能进行优化, 达到NFS和谈下7读3写场景200 万IOPS,亚毫秒级延时的结果。 2、升级索引办理手艺,连系文件系 统及AI拜候特点,将配额统计、 计数统计融入到索引办理框架中 来,更好地支撑租户配额、用户配 额等功能。
请刊行人申明:(1)连系募投项目标次要扶植内容、使用场景,取现有营业正在手艺、设备、客户等方面的区别及联系,申明本次募投项目取现有营业的协同性,能否属于投向从业;连系行业成长趋向、市场所作环境、客户需求以及募投项目标手艺难点、公司手艺、人员储蓄及研发进展等,申明募投项目扶植能否具有需要性、项目实施能否存正在严沉不确定性;(2)本次募投项目投资形成的测算根据,本钱化收入比例取公司其他研发项目和同业业公司的比力环境,本钱性收入的认定能否精确;(3)本次募投项目效益测算中单价、销量、毛利率、净利率等环节目标及确定根据,能否合适刊行人现有营业及行业成长趋向,效益测算能否审慎;(4)自本次董事会决议日前六个月至今,公司能否存正在实施或拟实施财政性投资(含类金融营业)的环境,并连系现有资金余额、将来资金需求等申明本次融资规模的合。
做为数据载体的存储系统,实现环节焦点存储部件、存储软件、操做系统的国产化,正在当前国际合作款式下对于财产链平安具有严沉意义。
(A)实现训推一体+三形态全笼盖,同时面向锻炼(全参数预锻炼、大规模微调)取推理(MoE、长上下文)进行深度优化,产物矩阵涵盖8卡平衡型、16卡规模化、桌面级液冷工做坐,满脚从研发到出产、从单卡到集群的全场景需求。
按照锻炼和推理的分歧使用场景需求,本项目将研发可弹性扩展的超节点高速计较平台,物理上采用条理化的布局设想,基于计较部件超高速分歧性互连和谈的计较架构,构成包罗高机能通用途理器取人工智能处置器、节点、超节点、超节点间互连的先辈算力系统,可以或许按照需求动态调整计较资本规模和机能,旨正在应对人工智能使用中不竭变化的工做负载、数据规模以及模子复杂度。
综上,正在面向人工智能的先辈算力集群系统范畴,中科曙光产物市场根本优良、客户承认度高,并通过建立生态深化了财产合做,为本次募投项目产物的发卖打下了的根本。
募投项目产物取现有产物的下逛均次要摆设于企业机房或数据核心环 境,满脚各行各业对于私域大模子锻炼、推理功能的需求,客户为千 行百业具有AI模子摆设需求的企业,以中小企业为从。本项目标桌面 级液冷工做坐用于企业小我桌面使用,进一步拓展了下逛使用场景。
1、实现底层通信取算子优化:针 对MoE(夹杂专家模子)稀少通信 特点,优化底层通信库并适配8/16 卡拓扑,跨卡延迟降低30%以上; 对GroupGEMM等环节算子进行硬 件级手写调优,效率达理论峰值 80%以上,端到端推能提拔 50%以上。 2、实现专家并行取负载平衡:引 入EP+DP/TP夹杂并行策略,动态 专家拜候热度,从动复制抢手 专家、迁徙冷门专家,实现多卡负 载平衡,集群全体吞吐量提拔30% 以上。
1、适配K8s生态,可做为存储底 座对接上层AI使用; 2、通过冗余设想、镜像缓存,供给 软件靠得住性,数据靠得住;同时 支撑文件系统快照达到防的效 果、支撑防,以AI生态 下的数据平安。
本项目正在先辈算力超节点硬件系统、高速互连络统的根本上,通过软硬连系的体例,自底向上建立完美的根本软件栈以及使用生态系统。起首,从最底层的硬件笼统层和驱动法式入手,针对国产AI芯片和加快器的特征进行深度优化,确保硬件计较能力获得充实阐扬。正在此根本上,将建立包含编译器、运转时系统、机能阐发取调试调优东西链、根本算子库取AI算子库等焦点组件的系统软件层,为上层使用供给高效、不变的运转支持。此外,将进一步向上成长,支撑从模子锻炼到推理摆设的全流程开辟需求。同时,通过成立尺度化的接口规范和平台,吸引泛博开辟者和行业用户配合参取使用生态扶植,构成涵盖根本模子、行业处理方案、开辟东西和办事平台的完整生态系统。
当前,AI大模子使用摆设面对手艺门槛高、成本不成控、周期漫长三大焦点挑和。手艺门槛上,要求摆设大模子的企业需同时具备硬件选型、算法调优、系统集成等跨范畴专业能力。硬件闲置、持续运维及人力投入显著推高总持有成本,很多企业因设置装备摆设耗时过长或模子精度不脚而中止使用摸索。保守方案从设置装备摆设到模子锻炼需数月以至更长时间,导致项目周期耽误取资本华侈。
我国正处正在AI硬件场景落地“最初一公里”环节,本项目是建立合作壁垒、抢占AI算力财产制高点的必然选择。
该平台可以或许智能适配从单卡工做坐到多卡集群的算力,支撑用户间接从外部模子仓库平安拉取模子,并通过极简的可视化设置装备摆设,快速完成从百亿到千亿参数模子的训推办事摆设或范畴微调,从而大幅降低企业使用大模子的手艺门槛、摆设成本取运维复杂度,帮力企业快速建立专属的AI能力。
先辈算力集群系统将聚焦软硬件协同优化,冲破访存分歧性、高带宽低延迟互连、动态可沉构夹杂拓扑等环节手艺,将实现较保守松耦合集成系统机能上的大幅提拔。通过软硬连系的体例,自底层硬件系统向上建立完美的根本软件栈以及使用生态系统,使先辈算力集群系统全体手艺程度取国际支流产物对齐,破解我国当前面对的算力瓶颈问题。
(一)连系募投项目标次要扶植内容、使用场景,取现有营业正在手艺、设备、客户等方面的区别及联系,申明本次募投项目取现有营业的协同性,能否属于投向从业。
针对万级节点、十万级加快卡办理难 度大、算力安排低效、运维成本高档 问题,需要进行深度优化,使典型运 行场景下,办理响应延迟降低至 100ms以内,节点形态精确率提 升至99。9%以上,常规毛病排查耗时 缩短至30分钟/次以内,集群运维人 员取算力节点配比优化至1!200。
集群办理手艺:通过软硬件共同的先辈竞从技 术,使集群正在呈现单点毛病时,办事可以或许及时迁 移到未毛病的节点上,用户的营业不会中缀。该 手艺也可使用于正在线升级、以及扩容时的压力均 衡,无效应对AI时代数据爆炸、滑润扩容的需 求。 办事质量节制手艺:通过先辈的智能自顺应办事 节制方案,为用户的环节营业供给下限保障。提 供突发流量节制手艺,支撑短时间获得冲破上限 的机能,处理雷同于大量虚拟机同时施行开机启 动、沉启、恢复或克隆摆设,激发全体营业卡 顿、启动超时以至集群雪崩的突发流量处置问 题。
此外,为破解国产算力生态碎片化难题,公司做为国度先辈计较财产立异核心牵头组建单元,正从硬件供应商向生态平台转型,合做收集普遍而深切。
项目研发需要硬件架构师、硬件研发工程师、固件软件架构师、 BMC工程师、BIOS工程师、布局设想工程师、散热设想工程 师、工业设想工程师、运转时系统研发工程师、编译器开辟工程 师、数学库研发工程师、异构算子研发工程师、AI锻炼框架研发 工程师、AI推理研发工程师、架构师、算法工程师、开辟工程 师、硬件测试工程师、处理方案工程师、测试开辟工程师、产物 司理等岗亭人员。
scaleX超节点手艺:实现了单机柜级640卡超节 点设想(scaleX640),并以此为根本建立了可 摆设10240块AI加快卡、总算力超5EFlops的 scaleX万卡超集群系统。该超节点通过了30天 以上的长稳运转测试,具备向十万卡级规模滑润 扩展的能力。 淹没液体相变冷却手艺:可将数据核心PUE值 降至1。04,比拟保守风冷节能跨越30%,并支撑 单机柜功率密度最高达750kW的极致摆设。该 手艺为应对万卡级GPU集群的散热取能耗瓶颈 供给了靠得住、高效的处理方案。
本项目扶植的异构算力资本办理运营平台通过建立支撑异构资本办理和调焦点资本办理取办事能力,为用户供给先辈算力系统建成后的规模化运营办事,为人工智能的多样化场景供给高效保障。
本项目基于高机能X86国产处置器开辟全闪存储系统平台,依托现有的集中式全闪存阵列FlashNexus的相关环节手艺,参考业界支流全闪存产物的功能和设想架构,自从实现“盘控一体”“盘控分手”两种形态的全闪阵列,支撑双节制器、四节制器的分歧规格设置装备摆设。本项目正在现有全闪存阵列根本上,适配升级下一代X86国产处置器,针对部门产物利用国外芯片、拓展度受限的环境,将硬件改版改换PCIeSwitch芯片为国产、并调整PCIe拓扑,提拔双节制器最大可支撑的数据盘数,硬盘扩展框支撑级联,以降低零件扩容成本。
针对大模子锻炼推理效率低、行业场 景适配不脚、缺乏同一尺度等问题, 需要深度适配支流大模子取行业场 景,典型场景下单卡推理生成效率显 著提拔,焦点交互延迟节制正在1秒以 内,单卡无效锻炼吞吐量大幅提拔, 显存操纵率提拔至85%以上,使引擎 取支流大模子的对接耗时缩短至1个 工做日/个模子以内。
当前,全球科技巨头已加快结构AI训推一体机市场。国内企业则次要以“通用办事器+GPU”模式参取合作,尚未构成“场景深度适配+生态高度整合”的劣势。本项目聚焦“垂曲行业定制化”取“国产化生态融合”,通过三大差同化策略建立合作壁垒:手艺壁垒上,采用异构计较架构(CPU+GPGPU),较保守方案大幅度提拔算力效率;生态壁垒上,结合芯片厂商、算法商、ISV(软件开辟商),成立“硬件-算法-使用”认证系统,笼盖90%以上支流行业场景;成本壁垒上,通过模块化设想取规模化出产,显著降低单元算力成本。
公司现有AI办事器产物以硬件零丁交付的形式为从,取软件使用的集 成度较低。客户需自行投入工程师进行复杂的二次开辟和调优,手艺 门槛高,摆设周期长。公司现有AI办理平台正在大模子适配和量化优 化、大模子推理办事接口毛病恢复和不变性、大模子机能评估取高效 运维等方面仍有提拔空间。 本项目深度打制合用于AI训推一体机的办理平台,出格是针对大模子 适配、量化优化、推理办事接口、毛病恢复、不变性、大模子机能评 估和高效运维等层面,进一步针对性设想和优化,削减大模子多样化 和快速迭代对大模子摆设和现实利用形成的影响,实现模子极速加载 取毫秒级启动,摆设门槛降至5分钟内,推理吞吐提拔3–4倍,并具 备及时精准运维能力。 本项目通过扶植针对AI训推一体机高机能算子库、编译器及推理引擎 优化系统,笼盖AI加快卡根本能力、量化推理、长上下文及分布式场 景,实现软硬件深度协同取生态兼容,配套完美调优东西,告竣全链 机能取摆设门槛降低。
本项目扶植内容能够分为四个次要模块:先辈算力超节点硬件系统、高速互连络统、系统级根本软件栈、异构算力资本办理运营平台。本项目拟通过算力芯片、互连芯片、硬件、软件全面紧耦合,大幅提拔先辈算力系统机能,为人工智能各行业供给高效、易用、可扩展的AI能力支撑,鞭策人工智能手艺的财产化成长。本项目四个次要模块的具体环境和扶植内容如下。
国度数据局局长刘烈宏正在中国成长高层论坛2026年年会上暗示,2024年岁首年月,中国日均Token挪用量为1,000亿;到2025岁尾,跃升至100万亿。
800/1600Gbps甚至更高速度演进,供电架构向800V高压曲流成长,持续优化淹没式液冷或全冷板式液冷手艺,提拔模子使用能力及算力安排能力。公司关于先辈算力集群的手艺根本结实,可以或许无效支持项目研发。面向人工智能的先辈算力集群系统产物具有广漠的市场空间,公司产物已实现贸易化落地,具有较高的客户承认度及明白的市场需求。
计谋摆设、打制新形势下智能算力手艺系统护城河的主要行动,是新一轮科技和财产变化下公司的计谋投入标的目的。公司高度注沉本次募投项目扶植,正在项目立项前,为本次募投项目标论证开展了大量的研究工做,进行了浩繁前期研发勾当堆集。2023年至2025年,公司正在本次募投项目相关范畴已进行的前期研究进展具体如下。
AI一体机硬件是大模子使用落地的基石。连系大模子分歧摆设规模、算力需求及场景特征,本项目研发8卡一体机、16卡一体机、桌面级液冷工做坐三种形态的下一代高机能AI训推一体机。8卡一体机和16卡一体机为尺度办事器形态,可以或许按照具体场景和机房扶植需求扩展,以满脚分布式锻炼取推理需求,支持大中型模子的规模化落地。8卡一体机为面向中等规模大模子锻炼、推理、微调的一体化硬件方案,比拟保守零星多卡办事器,焦点特点正在摆设便利、机能平衡、成本可控、运维简单、场景全笼盖。16卡一体机次要面向大模子锻炼、高并发推理、长上下文处置的一体化方案,比拟8卡一体机,其焦点特点为单机算力密度翻倍、超大显存池支持全参数锻炼、多卡协同效率高、场景笼盖更全面、TCO更优,适合企业锻炼千亿级参数模子、摆设高SLA推理办事。桌面级液冷工做坐聚焦中小型模子的轻量化摆设,破解算力门槛高、摆设空间无限的难点,可做为AI算法工程师或研究员的“小我超等计较机”。
募投项目产物取现有产物的下逛均次要摆设于各类数据核心、企业机 房等需要进行海量数据存储的场景,特别是人工智能使用下对于高端 存储需求的场景,无较着差别。
项目扶植内容能够分为四个次要模块:国产化全闪存阵列、新一代分布式存储及高速并行文件存储、适配AI生态的智能存储取云原储、自从可控、极致机能的国产化先辈存储软件系统,别离申明如下?。
本项目以国产化全闪存阵列为根本,正在使用标的目的上,将多个全闪存阵列通过scale-out手艺组合为一个集群,可对外供给同一定名空间的存储办事。该集群能够分析集群内所有阵列的存储取拜候能力,表现更高的容量和并发机能,以顺应AI所需的海量多模态数据存储、稠密并发读取时低延时响应的。项目产物支撑文件系统和谈拜候,并支撑通过NFS/SMB等和谈进行拜候,可顺应部门AI使用需要接入文件系统和谈的,可以或许供给权限节制能力、WORM、加密等能力,保障数据集的平安。
scaleFabric高速互连收集手艺:该手艺从底层 SerDesIP、互换芯片到网卡、互换机及办理软件 实现100%自研,填补了国内空白。供给400G 超高带宽和低于1微秒的端侧通信延迟,票据网 互连规模可达十万卡,并能将收集总体成本降低 30%。该收集已成功摆设于国度超算互联网郑州 节点,不变支持着6套万卡级集群的运转。
AI训推一体机是打制智能计较系统的主要载体。本项目通过自从研发“芯片+算法+零件”全栈方案,可打通国产AI硬件取上层使用的协同链,鞭策构成“芯片-零件-场景”的财产闭环,有帮于提拔AI算力使用效率。
AI训推一体机是集成了人工智能软硬件手艺的公用设备。它将高机能计较硬件、优化的算法模子、配套软件及行业处理方案事后整合于单一系统中,焦点劣势正在于开箱即用、软硬协同优化,用户无需复杂的设置装备摆设即可摆设AI使用。当前,我国AI算力受限于生态碎片化等问题,大量一体机是“计较平台+推理框架+预拆模子”的简单打包,难以满脚行业特定需求,客户需自行投入工程师进行复杂的二次开辟和调优,手艺门槛高,基于国产AI计较平台的大模子摆设难以规模化落地。
二、本次募投项目投资形成的测算根据,本钱化收入比例取公司其他研发项目和同业业公司的比力环境,本钱性收入的认定能否精确。
摆设于各类数据核心、企业 机房等需要进行海量数据存 储的场景,特别是人工智能 使用下对于高端存储需求的 场景。
先辈算力集群系统涵盖从芯片到零件集成、再到使用软件开辟的完整财产链条,正在大模子锻炼推理等使命中具有强大的计较能力、规模纵向和横向扩展性以及优良的生态兼容性,适合正在科研、金融、互联网、工业等环节范畴实现规模化国产化替代,有益于实现“手艺冲破—国产替代—市场繁荣”的正向轮回,为人工智能财产高质量成长建立根本。
募投项目将基于公司现有的scaleX超节点手艺、scaleFabric互连收集 手艺、DeepAI深算智能引擎软件栈进行继续开辟。scaleX超节点手艺 将进一步提高互连速度和扩展规模,分歧性互连和谈和接口,支 持更大都量、更高算力国产GPU卡的高密度集成。方针是将单卡 TCO较现无方案降低30%以上,处置千亿参数模子时每Token能耗降 低50%,让高机能算力得以普惠。scaleFabric手艺将来将聚焦于更大 规模扩展、底层芯片持续优化、工程能力深化以及使用生态拓展四个 焦点维度,打算将互连收集的支撑能力从当前的十万卡摆布进一步扩 展,并对准将来百万卡集群的升级,以满脚AI算力指数级增加的需 求。下一代软件栈将超越单一硬件绑定,努力于建立跨CPU、GPU等 多元算力的同一编程模子取深度优化编译器,实现用户代码一次编 写,即可正在异构集群上从动生成最优施行方案。
1、现有单节点面对算力不脚、硬件架 构封锁、依赖单一芯片、供电效率低 等问题,需要实现单机柜算力密度达 到1EFlops以上,兼容不少于3家国 产芯片,支撑800V高压曲流供电。 2、针对算力节点密度提拔导致散热压 力大、散热能耗高、余热华侈、不符 合低碳要求等问题,需要支撑 2 120W/cm的超高热流密度,确保芯片 工做温度不变正在75℃以内,支撑单机 柜功率密度超1000kW,实现余热回 收操纵率80%以上,持续降低制冷能 耗取园区碳排放。
Scaleup指单个超节点内部多个AI计较卡的互连扩展。系统基于超高速Scaleup互换机将多个异构计较节点互连为超节点计较系统,通过高带宽域互连提拔系统机能并支撑2层组网,构成从32卡到1024卡高带宽域互连的可弹性扩展超节点算力系统。超节点内采用高带宽低延迟分歧性互连和同一的内存编址方案,将全局的计较芯片地址同一编址为一个地址空间,正在容纳所有可能的计较芯片的同时,连结简单性和可扩展性。
正在AI一体机产物范畴,部门行业头部企业也持续投入研发,近年来推出雷同产物并迭代升级,例如海潮消息AIStation一体机、新华三灵犀Cube大模子争劣势表现正在。
硬件靠得住性手艺:供给BBU备电功能,当外部 供电消逝时,共同BBU进行数据及时固化,能 够缓存数据不丢失;工做非常的部件可及时 下电隔离,避免干扰一般运转的部件,正在信号质 量、冗余部件均不足量设想,呈现硬件毛病时, 客户营业不会遭到中缀,保障了办事质量。 亚健康检测手艺:智能硬盘诊断,识别当前仍可 工做,但毛病风险/机能风险较高的硬盘,从系统 中隔离。亚健康盘的拜候时延最高可达一般的20 倍,极大影响系统效率;而且有呈现毛病的风 险,提前识别隔离能够保障数据的靠得住性,而且 避免系统机能由于亚健康盘呈现全体下降。
项目扶植内容能够分为四个次要模块:高机能AI训推一体机硬件、大模子一坐式摆设取办理平台、训推加快东西链、大模子一体机办事平台,别离申明如下。
Gridview集群智能安排取数字孪生运维手艺:通 过物理集群的数字孪生,实现毛病定位、修复的 全流程可视化智能办理;其智能安排引擎可办理 万级节点、十万卡级算力资本,支撑每秒1万个 以上计较使命高速安排。这套软件系统无效保障 了超大规模AI集群的不变、高效运转,将复杂 的硬件资本为易于安排和利用的办事能力。
公司现有AI办事器及一体机相关研发团队跨越600人,硕 士、博士比例跨越65%,研发团队笼盖了从底层芯片适配、硬件 设想到上层AI软件平台的完整手艺栈,涵盖了硬件开辟、软件开 发、AI算法、测试等焦点岗亭。 团队次要结业于国表里出名院校,具有多名正在硬件设想、算 子开辟、训推东西链研发等相关手艺范畴有十年以上研发经验的 资深工程师。近年来,团队先后承担了多项国度级严沉科研任 务:参取中国科学院计谋性先导科技专项“国产平安可控先辈计 算系统研制”;2021年起参取科技部科技立异2030—“新一代人 工智能”严沉项目“博弈智能匹敌练习训练场根本理论取平台”及“博弈对 抗练习训练场平台”等。团队研发的《基于国产异构加快卡的大模子解 决方案》荣登2023年中国开辟者影响力年度榜单。团队荣获 智源人工智能研究院颁布的《生态共建杰出》,成为《中国移 动听工智能大模子合做生态》合做伙伴。 团队近年研发获得专利500余项(含授权和审查中),自研软件 栈获得计较机软件著做权一项。
综上所述,本次募投项目扶植取公司现有营业存正在较高的协同性,为现有产物的研发升级,属于投向从业。
通过一坐式摆设取办理平台破解模 型迁徙难、摆设繁、适配性差的痛 点。供给智能数据标注、领导式微 调、全流程、从动评测(含AI 打分)和高机能推理办事,构成“训 练→评估→优化”从动化闭环。微调 使命摆设时间降至分钟级别。
全球范畴内,全闪存产物的市场占比已跨越50%。国内的全闪存存储的市场占比取全球程度比拟,具备显著的提拔空间。按照保守预期,2026年国内全闪存存储市场规模将跨越27亿美元,正在国表里部存储总体市场占比将达到30%。
通过前期研究,公司已构成AI办事器全栈自研手艺、模子市场 浏览器手艺、根本软件栈手艺、高机能算子库、框架安排优化手艺、 异构资本安排手艺等研发,可做为本项目标手艺根本。 公司现有AI办事器产物以硬件形式交付,有待进一步提拔和软 件使用的集成度,将AI模子取国产算力平台进行融合,研制推出能 够实现AI模子高度集成、深度整合取协同优化的AI训推一体机,并 正在更普遍的范畴实现规模化使用。
1、实现文件系统和谈及SMB和谈 支撑,供给高速并行的文件系统访 问能力。可以或许婚配AI使用对文件 系统的需求,可以或许接入云平台、智 能计较等上层使用,添加存储的应 用广度。 2、支撑文件和谈取块和谈共用存储 资本,提拔存储资本的操纵效率。 将每种和谈利用一组节制器及硬 盘,转换为多种和谈共用统一组控 制器及硬盘,硬盘数量相较各和谈 独有利用削减50%,降低存储成 本。
升级DeepAI深算智能引擎,深度 支撑万亿参数以上甚至十万亿级 参数基座大模子的分布式锻炼取 推理,深度适配500+业界支流大 模子更新升级取100+行业场景, 结合合做伙伴开辟金融、制制、 医疗、科研等范畴的行业大模子 取处理方案,从导制定相关国度 尺度取行业规范。
本年3月,已冲破140万亿,两年增加超千倍。Token的迸发式增加,素质上反映了AI推理需求的指数级扩容,间接驱动对底层算力集群的火急需求。
本项目将研发下一代高速互连络统,处理算力大、通信强带来的瓶颈问题,支持分布式锻炼、并行计较、海量数据互换,次要研发内容包罗:Scaleup(纵向扩展)多人工智能芯片互连架构取组网,以添加单个超节点的机能;Scaleout(横向扩展)多节点互连架构取组网,以添加超节点数量等。
升级现有智能安排平台、数字孪 生平台、AI算力安排取买卖平 台,更好的支撑十万卡级超大规 模算力资本的同一办理、运维和 办事。
贵所于2026年4月27日出具的《关于曙光消息财产股份无限公司向不特定对象刊行可转换公司债券申请文件的审核问询函》(上证上审(再融资)〔2026〕115号,以下简称“《审核问询函》”)收悉,曙光消息财产股份无限公司(以下简称“公司”“刊行人”或“中科曙光”)、中信证券股份无限公司(以下简称“保荐人”)、大信会计师事务所(特殊通俗合股)(以下简称“申报会计师”)对审核问询函所列问题进行了逐项落实,现对审核问询函答复如下,请予审核。
8卡AI训推一体机、16卡 AI训推一体机、桌面级液 冷工做坐、大模子一坐式 摆设取办理平台、训推加 速东西链、大模子一体机 办事平台。
一、连系募投项目标次要扶植内容、使用场景,取现有营业正在手艺、设备、客户等方面的区别及联系,申明本次募投项目取现有营业的协同性,能否属于投向从业;连系行业成长趋向、市场所作环境、客户需求以及募投项目标手艺难点、公司手艺、人员储蓄及研发进展等,申明募投项目扶植能否具有需要性、项目实施能否存正在严沉不确定性!
中科曙光先辈存储产物正在市场、手艺、生态合做方面均已获得充实承认,本次募投项目产物实现预期发卖具有可行性。
募投项目产物取现有产物的下逛均次要面向超算核心、智算核心等大 规模AI计较使用场景,无较着差别。 超节点及超集群系统做为新兴产物,其复杂度远高于保守办事器,目 前处于大规模商用摆设的初期。通过本项目扶植,下一代产物将大幅 实现成本优化及兼容,让高机能算力得以像水、电一样实现普惠 使用。
异构资本安排手艺:支撑办事节点、AI加快卡、 模子权沉及镜像的同一纳管,实现模子办事的自 动拉取取一键启动;通过团队取授权办事实现精 细化权限管控,办理员可对用户及智能体进行模 型token配额办理。 低代码推理办事手艺:通过资本办理模块成立节 点、加快卡取模子的联系关系关系,用户仅需设置装备摆设访 问地址即可快速启动推理办事。
(A)硬件平台取软件全面自研,并利用国产CPU、闪存颗粒、内存、网卡等焦点硬件,具有优良的生态兼容性。
金融范畴需及时处置海量买卖数据以防备风险,医疗场景需快速阐发影像取病历以提拔诊断效率,智能制制则依赖及时设备取预测性以降低停机丧失,这些刚需场景为AI训推一体机供给了明白的市场定位取广漠的使用空间。
按照IDC发布的《2025年中国人工智能计较力成长评估演讲》,2024年中国智能算力规模达725。3EFLOPS(每秒百亿亿次浮点运算次数),同比增加74。1%,估计正在其后数年内,将以46。2%的年均复合增加率维持高速增加态势。
项目、下一代高机能AI训推一体机项目和国产化先辈存储系统项目,三个募投项目标次要扶植内容别离申明如下!
正在先辈存储系统产物范畴,部门行业头部企业也持续投入研发,近年来推出雷同产物并迭代升级,如海潮的HF18000系列全闪存储、新华三UniStor系列全闪存储、中兴ZXCLOUD系列全闪存储等产物。中科曙光采用全栈自研软件+自研焦点架构+国产自从硬件的手艺线,硬件平台取软件全面自研,焦点硬件采用国产化组件,适配国产化的同时,连结了优良的生态兼容性。中科曙光正在国产化先辈存储系统项目具有的合作劣势次要表现正在?。
按照中国信通院《大模子一体机使用研究演讲(2025年)》预测,国内2026年至2027年大模子一体机需求量将别离达到39万台和72万台,对应的市场空间将从千亿级别敏捷扩张。据信通院调研,当前市场呈现以下款式:仅推出推理一体机的企业约34。0%,仅推出训推一体机的企业约17。0%。78%的中大型企业将“当地化摆设能力”列为采购焦点目标,61%用户明白暗示因一体机可同步支撑锻炼取推理而放弃分离式算力采购。
全闪存存储双控/四控阵列 产物、新一代分布式存储 产物、高速并行文件存储 产物、智能存储产物、云 原储产物。
(B)内置模子市场、可视化微调、智能体编排、全链、平安合规取许可证查抄等企业级功能,供给“开箱即用”的出产级体验,无需用户二次开辟或集成。
公司现有AI办事器产物是本项目拟研制的AI训推一体机的根本产物,已实现规模化发卖,使用于金融、医疗、教育、科研、互联网等浩繁范畴。该产物目前仅以硬件形式交付,有待进一步提拔和软件使用的集成度。
EP跨专家,DP跨数据,TP跨张 量,三种并行叠加后发生大量小动静 通信和全局同步,容易死锁或资本浪 费。需要精细化调优DP-EP并行下 的负载平衡问题,提高计较资本操纵 率,提高推理全体机能。
800,000。00万元(含本数),用于“面向人工智能的先辈算力集群系统项目”“下一代高机能AI训推一体机项目”和“国产化先辈存储系统项目”。
异构算力资本办理运营平台面向多集群、多坐点,旨正在通过建立支撑异构资本办理和安排能力的平台底座,供给大规模资本安排、先辈算力办事、智能运维办事等焦点资本办理取办事能力,支持同一的算力资本办事取运营,实现算力资本的高效办理,为用户供给普惠易用的算力办事。
(二)连系行业成长趋向、市场所作环境、客户需求以及募投项目标手艺难点、公司手艺、人员储蓄及研发进展等,申明募投项目扶植能否具有需要性、项目实施能否存正在严沉不确定性。
金融、医疗、制制等焦点行业对智能化转型有火急需求,要求相关行业企业规模化摆设垂曲场景私域大模子,这间接催生了对AI训推一体机的海量需求。
从贸易化径看,AI训推一体机通过“硬件+软件+办事”的一体化模式,可成功破解保守AI摆设成本高、周期长、手艺门槛高的难题,其即插即用的特征可大幅缩短交付周期,而模块化设想取尺度化接口则能实现从尝试室到出产的无缝跟尾,使企业可以或许快速将AI手艺为现实出产力。
本次募投项目前期已构成充脚的手艺堆集,正在响应的手艺范畴已别离取得数百项发现专利。具体详见本题“一”之“(二)”之“2”之“(1)募投项目标手艺难点取公司手艺储蓄环境”。
软件靠得住性手艺:采用镜像缓存功能,共同硬件 供给的BBU供电能力,通过写前记实日记、缓 存数据鄙人、上电时向持久化存储的写入取加 载,外部供电消逝时,数据是分歧且无效 的。同时利用缓存多副本手艺,数据的准确 性取无效性。
先辈算力集群系统是专为大模子锻炼、推理、多模态使用、科学智能 (AIforScience)等使命设想的超大规模分布式计较根本设备,焦点 是把成千上万以至十万以上规模的AI加快芯片通过高速收集和智能调 度整合成一台“超等计较机”。超节点是先辈算力集群里的根本积木 块,是面向高机能计较取人工智能场景设想的高密度异构融合计较节 点。公司于2025年发布的scaleX640超节点是全球首个单机柜级640 卡超节点,它基于“AI计较架构”,通过算、存、网、电、冷 的一体化紧耦合系统设想,实现了超高密度集成。 本项目扶植的下一代产物正在延续当前总体硬件架构根本上,将支撑下 一代更高算力的国产GPU卡并兼容分歧厂家产物,超节点规模从当前 的640卡向1024卡及更大规模迈进,收集速度从400Gbps向 800/1600Gbps甚至更高速度演进,供电架构向800V高压曲流成长, 并采用板级垂曲供电手艺以削减损耗,持续优化淹没式液冷或全冷板 式液冷手艺,以应对单芯片功耗持续上升(如达3KW)的挑和。
近年来,公司正在现有AI办事器根本上,已测验考试进一步将AI模子取国产算力平台进行融合,并正在部门场景实现落地案例,例如:公司正在政务范畴取天翼云结合打制“智能政务使用翼政通驱动的夹杂云智算一体机”,正在工业范畴取瑞风协同结合研发aiEF大模子一体机,旨正在打制“AI+工业”范畴标杆处理方案。
公司现有的算力集群产物已实现贸易化落地。过去十年,中科曙光已扶植了20多个大规模算力集群,累计摆设超50万张异构加快卡。公司正在全国智算新基建中占领焦点地位,已正在全国30多个城市参取扶植及运营超算/智算核心,累计扶植及运营的智算算力规模超30EFLOPS,获得了从国度计谋层面到各行业头部客户的普遍承认。最新一代基于超节点的旗舰产物scaleX万卡超集群正在2025年12月初次实机表态后,市场反应积极,2026年2月,公司承建的3套scaleX万卡超集群系统正在国度超算互联网郑州焦点节点同步上线万卡,建成我国单体最大规模的国产AI算力池。scaleX万卡超集群正在单机柜算力密度、PUE(可低至1。04)及高速互连收集等目标上表示凸起,部门手艺能力被评价为已超越海外头部企业。市场层面,公司做为“算力国度队”,深度参取国度“东数西算”工程,是国度级超算核心及算力枢纽节点的焦点承建方之一。此次郑州6万卡算力池的建成,间接支持万亿参数模子锻炼、高通量推理等大规模AI计较场景,证了然公司产物正在最高需求范畴的可用性取靠得住性。公司的客户群笼盖政务、科研、金融、互联网等多个环节范畴。
1、研发千卡规模超节点,推进 HVDC高压曲流电源(400– 800V)规模化使用,建立不绑定 单一芯片的硬件架构,更好 地支撑超大规模智算集群系统建 设。 2、研发新一代低沸点、高潜热氟 化液配方,优化淹没式机柜密封 取冷凝系统,优化淹没+冷板夹杂 散热方案,升级智能运维系统, 进一步建立液冷+绿电的零碳智算 核心方案。
公司正在存储范畴进行研发结构二十余年,总研发人员跨越600 人,硕士、博士学历占比跨越40%。团队正在存储范畴有深挚积 累,具有多名十年以上的存储行业从业经验的资深研发人员,正在 文件-块-对象存储范畴存储软件研发、存储硬件研发等标的目的均有丰 富的手艺堆集。存储团队近年来的项目ParaStor存储获2022 年度AI出产力立异——云取聪慧城市,2024年度AI取闪存融 合立异使用,并正在2022年11月获得权势巨子的世界级存储排行榜 IO500榜单第一名,将世界记实提高146%,充实展示研发团队的 手艺能力;FlashNexus存储正在2024年的世界互联网大会上获“新 光”产物称号,并正在2025年以32控,超3000万IOPS的机能刷新 SPC-1世界记实,正在普遍视为企业级存储机能的“黄金尺度”的 SPC-1榜单中登顶,展现出中国存储正在高端范畴的领先力。
异构算力资本办理运营平台的次要扶植内容是:算力资本办理平台底座,通过精细化资本办理实现底层资本纳管;大规模算力安排系统,通过大规模智能安排实现资本正在多集群之间的高效、均衡操纵;先辈算力资本办事,通过融合科学计较、工程计较及人工智能计较建立同一计较办事;智能运维系统,通过从动化、智能运维手艺实现高效资本办理取毛病快速修复,保障算力办事不变高效运转。
超等地道手艺:包含一系列对内存、使命的处置 优化,以及盘、收集高速拜候的设想优化,正在块 存储下可以或许达到32控3000万IOPS,0。202ms延 时的极致机能结果,是SPC-1登顶的手艺根本。 本项目将使用此手艺,来优化文件系统拜候下的 IOPS能力及延时。 索引办理手艺:现有手艺中利用了高效的KV管 理机制,并针对全闪存阵列的拜候特点进行针对 性优化,实现高效的读写拜候、冷热统计、空间 统计的结果。
存储系统是人工智能规模化成长的焦点底层支持。大模子锻炼、多模态数据处置、海量样本调试取及时推理均依赖高机能、低延时、高并发、高靠得住的存储能力。存储机能是实现算力的操纵率及模子的锻炼效率的环节要素,而算力对存储的可扩展性、吞吐能力、海量非布局化数据的处置也提出了更高的要求。
2025年9月,公司协同20多家财产链企业发布了国内首个AI计较架构,多项焦点手艺能力,并牵头扶植“AI计较架构结合尝试室”,联袂生态伙伴环绕和谈、同一根本软件栈等标的目的进行结合攻关,旨正在打破“硬件墙、软件墙、生态墙”。正在2025年12月的首届光合组织人工智能立异大会上,公司取商汤科技、大晓机械人等多家企业告竣了计谋合做,协同鞭策软硬一体的“算力根本设备+世界模子+具身智能”生态扶植。
本项目扶植的先辈算力超节点硬件系统次要包罗超节点硬件系统架构和绿色计较人工智能算力集群架构,别离申明如下。
1、利用国产PCIeSwitch芯片替代 博通芯片,进一步推进环节器件国 产化。 2、导入新一代国产CPU,预期可 实现节制器内25块盘的总带宽机能 提拔30%,降低零件工做功率10% 以上。
人工智能手艺的成长,需要具有以下能力的高端存储系统:可以或许供给海量存储能力以支撑大数据存储;能供给极致机能以达到超高带宽取超低拜候延迟、应对推理运算中发生的高频数据读取;婚配GPU/TPU的芯片能力,削减算力闲置;支撑矫捷扩展,以应对数据激增环境下的滑润过渡,使人工智能阐扬更大的能力。
本项目以国产CPU、国产存储芯片、国产网卡为焦点硬件,建立自研全闪阵列的全体架构,并研发具有自从学问产权的国产化全闪阵列硬件系统,建立自从可控、极致机能的国产化先辈存储软件系统。正在上述国产化全闪存阵列及国产化先辈存储软件系统的根本上,多个阵列通过scale-out手艺构成一个阵列集群,支撑文件系统和谈,支撑NFS/SMB和谈,建立新一代分布式存储及高速并行文件存储;适配AI生态,实现云原生兼容,建立智能存储取云原储。
颠末持久研发堆集,公司曾经打制了一支高学历、高手艺布景且具备国际视野的专业化研发团队。截至2025年12月31日,公司研发人员跨越3,000人。
公司现有全闪存产物FlashNexus系列取南大通用、金仓、达梦、瀚高档国产数据库,服、金山云、紫光云、航天云宏等国产云平台已完成兼容互认证,充实适配国发生态。产物正在金融、通信、医疗、能源等范畴均实现了市场落地。正在国内某证券公司的全项测试验证中,产物通过了高频买卖、突发毛病、高并发复杂营业、长时间高强度持续负载四大环节场景的模仿测试。
项目研发需要系统架构师、硬件架构师、Layout开辟工程师、 BIOS工程师、BMC工程师、散热设想工程师、布局设想工程 师、工业设想工程师、软件研发架构师、软件研发工程师硬件测 试工程师、系统测试工程师、使用适配及优化工程师等岗亭人 员。
DeepAI生态适配取模子优化手艺:提出了“AI计 算架构”,全面兼容CUDA等支流软件生 态。目前,已完成跨越400个支流大模子、世界 模子的深度适配优化。这种兼容的策略极大 地降低了开辟者的迁徙门槛,使得海量现有AI 使用能够“使用无感”地迁徙到曙光平台上,为技 术的普遍落地扫清了生态妨碍。
通过前期研究,公司已构成超等地道手艺、硬件靠得住性手艺、软 件靠得住性手艺、亚健康检测手艺、集群办理手艺、办事质量节制手艺 等研发,可做为本项目标手艺根本。 公司正在该范畴的初代产物FlashNexus全闪存储产物正在2025年以 32控、超3000万IOPS的机能刷新SPC-1世界记实,表现出正在高端 存储范畴的杰出机能。
B、项目建立的芯片、硬件、软件全面紧耦合是提拔系统机能的主要路子持久以来,我国使用于人工智能算力范畴的国产软硬件产物正在成熟度、兼容性、不变性方面较国外先辈产物存正在必然差距,正在根本软件平台、生态和行业尺度方面存正在较大提拔空间。
(C)全面适配国产算力,基于国产高机能处置器取多款国产AI加快卡深度优化,算子库、编译器、推理引擎均针对国产架构定制,同时兼容支流开源生态,确保自从可控取生态的均衡。
本次向不特定对象刊行可转债拟募集资金总额不跨越人平易近币800,000。00万元(含本数),募集资金总额扣除刊行费用后用于以下项目。
项目研发需要硬件架构师、硬件工程师、电设想工程师、散热 工程师、BMC工程师、BIOS工程师、软件开辟工程师、编译器 开辟工程师、AI算子研发工程师、AI算法工程师、AI锻炼框架 研发工程师、大模子优化工程师、安排研发工程师、硬件测试工 程师、系统测试工程师等岗亭人员。
本项目将以提拔大模子训推机能、降低时延、提高算力操纵率为焦点,开展训推引擎的全栈深度优化,冲破焦点手艺瓶颈,建立高效、不变、矫捷的训推加快系统。具体而言,本项目将针对AI模子全体特点,连系软硬件特点,设想一套针对性的高机能训推引擎分层架构,以顺应快速多变的多模态使用场景,包罗根本软件栈、高机能算子库、训推框架三部门,以及用户训推场景下通用性、易用性的训推东西链,以支撑最上层分歧模子收集布局和使用场景高机能训推要求,同时研发多模态大模子高机能训推引擎优化手艺。
FlashNexus产物正在中国挪动2025-2027年全闪存存储集采项目中中标,2025年2月,国际存储机能委员会(SPC)发布SPC-1V3基准测试最新成就,曙光存储集中式全闪FlashNexus以32控、超3000万IOPS的杰出机能刷新记载,登顶全球榜首。FlashNexus集中式全闪存储正在2025年4月获得赛迪参谋新一代消息手艺立异产物的称号。
人工智能正在AI锻炼、推理、数据留存全环节中,需要对海量的数据进行处置取阐发,对存储的容量及处置能力提出更高的要求。人工智能的快速成长为国产化高端存储产物带来庞大的市场需求。
将来,越来越多的行业正在“人工智能+”的政策鞭策布景下将普及和深化模子使用,对实现AI模子高度集成、深度整合取协同优化的AI训推一体机的市场需求将呈现快速增加,为公司本项目标研发和财产化奠基优良的市场根本。
如前所述,国产化先辈存储系统项目录要以国产CPU、IO节制器、收集节制器等焦点部件为根本,研制国产化全闪存阵列、新一代分布式存储取高速并行文件存储、智能存储取云原储等先辈存储系统,打制自从可控、极致机能的国产化先辈存储软件系统。项目录要冲破节制器高速互连、缓存镜像、掉电等若干环节手艺,处理AI生态下存储的平安靠得住风险、响应时耽误、操纵效率低等问题。公司已正在存储范畴深耕多年,正在分布式存储、全闪存储范畴均具有行业领先地位。公司已控制包罗超等地道手艺正在内的多项焦点手艺,相关范畴取得发现专利跨越200项。公司的FlashNexus全闪存储产物正在2025年以32控,超3000万IOPS的机能刷新SPC-1世界记实,正在普遍视为企业级存储机能的“黄金尺度”的SPC-1榜单中登顶,展现出中国存储正在高端范畴的领先力。公司将基于现有手艺根本,进一步适配AI生态,支撑文件系统和谈等更多和谈场景,实现平安靠得住下更低时延、更高操纵效率、成本更优的存储方案。公司关于国产化先辈存储系统的手艺根本结实,可以或许无效支持项目研发。
本项目将研发绿色计较人工智能集群系统架构所需的各项环节根本能力,将绿色计较取人工智能算力集群相连系,建立高效、节能、环保的人工智能计较根本设备。集群系统正在供给强大AI计较能力的同时,出格关心能源效率、碳排放削减、资本轮回操纵等方面,以实现可持续成长的高机能计较。因而,该系统将采用先辈的液冷冷却方案,降低冷却系统的能耗,提高全体能效;采用超高密度的架构设想,合理设置装备摆设CPU-GPU比例,利用高带宽低延迟的内存和互连手艺;利用高效的数据格局、模子压缩手艺、量化计较等方式削减计较和内存需求,优化分布式锻炼算法,削减通信开销;摆设先辈的能源办理系统,和阐发能耗数据,实现精细化办理;操纵AI预测负载变化,动态调整供电策略,如按需冷却、智能安排等。
面临这些挑和,AI训推一体机通过软硬件协同优化取场景化定制,正成为破局环节。它以“开箱即用”的便利性大幅缩短交付周期,通过模子压缩取弹性扩容手艺均衡机能取成本,为金融风控、医疗诊断、智能制制等高范畴供给自从可控的即插即用方案,显著降低大模子摆设门槛,无效化解数据平安取效率瓶颈,从而加快AI从“头部示范”向“普惠落地”渗入,满脚千行百业智能化转型的刚需。
超节点硬件系统采用柜级一体化正交架构,通过优化的供电、散热、信号设想提拔柜级算力密度,并通过将多个异构计较节点以Scaleup(纵向扩展)体例互连为超节点提拔系统全体机能,支撑CPU、人工智能处置器、内存分歧性拜候。同时,超节点间支撑采用高速Scaleout(横向扩展)收集进行更大规模的扩展。
AI训推一体机是集成了人工智能软硬件手艺的公用设备。它将高机能计较硬件、优化的算法模子、配套软件及行业处理方案事后整合于单一系统中,焦点劣势正在于开箱即用、软硬协同优化,用户无需复杂的设置装备摆设即可摆设AI使用。
根本软件栈手艺:针对AI加快卡供给软件根本 能力支撑,包罗各类高机能算子库、运转时库、 编译器等。通过国产AI加快卡取软件栈深度耦 合,构成软硬一体化的协同优化范式,实现对 CUDA算子跨越99%的笼盖度,闪开发者可以或许平 滑迁徙、无感开辟。 高机能算子库:针对训推场景算子的高机能实 现,包罗attention算子、量化融合gemm算子、 访存稠密型融合算子等手写高机能算子库,以AI 加快卡高机能算子库、大模子推理量化高机能算 子库等算子库的形式尺度化输出,便利用户取 用。 框架安排优化手艺:通过流水线并行、动态批处 理、异步推理取缓存安排,实现计较取传输深度 堆叠、芯片运转正在机能甜点、以查代算,最大化 异构算力操纵率,保障低延迟取高吞吐。
近年来,全球外部存储市场规模一直连结不变增加。中国不只是全球最大的市场之一,也是全球增速最快的市场之一。按照IDC发布的2024年度《中国企业级外部存储市场演讲》,2024年中国企业级外部存储市场全体回暖并进入增加周期,发卖额达69。2亿美元,占全球市场份额的22。0%。此中,全闪存阵列(AFA)发卖额以20。7%的迅猛增加实现对各细分市场的领跑,市场份额增至27。8%,达19。24亿美元。
(B)焦点手艺自从可控程度高。自研的scaleFabric高速收集、SLiquid淹没式液冷等手艺打破海外垄断,无需依赖外部焦点组件,供应链平安更有保障;(C)架构的生态劣势。通过DTK+DeepAI东西链实现CUDA代码平。
模子市场浏览器手艺:成立核心化镜像仓库,实 现模子权沉取计较资本的从动化挂载取协同调 度,对国表里支流开源AI大模子全面兼容,满 脚用户差同化需求。一体机可保障当地私无数据 不出域,并建立营业智能体,处理数据无法 上云的痛点。
(A)超算基因带来的工程化劣势。公司具备万卡级集群的实和落地经验,已正在国度超算互联网郑州焦点节点实现6万卡规模不变运转,系统靠得住性和规模化摆设能力行业领先。
文件和谈取块和谈的数据办理体例不 同,共用存储资本时,需要对盘上的 数据进行无效编排,削减资本占用, 且和谈语义完整,可以或许同时对外 供给无效的块、文件办事。
AI办事器全栈自研手艺:支撑国产高机能处置器 和国产AI加快卡,通过自研从板实现硬件兼 容。依托全栈自研能力,实现从从板、高速互连 到BMC办理系统的完整手艺闭环。面向万亿级 参数模子,满脚CPU-AI加快信带宽提拔4 倍,收集无堵塞。电源分手供电设想、风道解耦 设想、能效提拔至多20%。领先架构,GPU、AI 加快卡、I/O、散热、存储、电源模块化设想, 一机多芯、多元算力兼容。
AI训推一体机是集成了人工智能软硬件手艺的公用设备。它将高机能 计较硬件、优化的算法模子、配套软件及行业处理方案事后整合于单 一系统中,焦点劣势正在于开箱即用、软硬协同优化,用户无需复杂的 设置装备摆设即可摆设AI使用。 公司目前已具备8卡GPU办事器零件设想、出产能力,且有必然的市 场拥有率,可搭载多款国产AI加快卡。本项目以现有8卡GPU办事!
次要摆设于超算核心、智算 核心、大数据核心等,为各 类AI大模子锻炼、高通量推 理、AIforScience等大规模 AI计较使用场景供给高效、 平安、普惠的算力办事。
面向小我开辟者和小微团队,供给 一键安拆的使用模板、小我学问 库、从动化帮手及生态适配器,零 代码搭建AI使用。模板笼盖20+常 见场景。
正在现有高靠得住性的手艺储蓄根本上, 进一步对平安性进行,需要添加 对文件系统防的支撑,防止或尽 早发觉软件对数据的恶意加密或 劫持,达到进行无效的检测、拦截勒 索的结果。
2024年国内市场规模达到190亿美元,同比增加86。9%,2025年估计达到259亿美元,同比增加36。2%。
本项目将建立全自从研发并使用于国产化全闪存阵列的软件系统,承继并使用现有的以“超等地道”为焦点的一系列内存办理、协程安排、高速盘、收集拜候的先辈手艺,并针对全闪存阵列的特点进行进一步的优化升级,正在拜候延时、吞吐能力长进行优化提拔,同时对硬件毛病等进行冗余设想、供给双活及异地容灾的能力,以满脚焦点正在线营业系统的极致机能、靠得住性及营业持续性要求,满脚人工智能锻炼和推理营业对于极致低延时、高带宽的机能要求。
K8s生态系统是现代云原生架构取AI根本设备的尺度。以国产化全闪存阵列为根本,正在使用标的目的上,添加对CSI/CDR的集成,可以或许丝滑接入K8s生态系统。通过适配,可以或许让项目扶植的存储产物无缝接入AI生态,并兼容支流云平台,正在人工智能+、数据上云中充任优良的存储底座,无需用户额外的适配成本。
承继现有的“超等地道”为焦点的次要手艺,正在新一代分布式存储及高 速并行文件存储中,添加支撑scale-out功能,支撑文件系统和谈,支撑 NFS/SMB和谈,支撑文件和谈取块和谈共用存储资本,优化分歧设置装备摆设 下的机能,供给高速并行的文件拜候能力。正在适配AI生态的智能存储 取云原储中,添加对K8s生态的接入,进行CSI/CDR容器集成, 以适配AI生态。正在国产化先辈存储软件系统中,添加配额、防病毒、 NAS双活、多租户认证等功能的开辟,提拔文件系统下的机能表示, 实现高效的读写拜候、冷热统计、空间统计。
为高效实现大模子落地,建立模子“拉取-转换-评估-利用”的全流程扶植,本项目将研发大模子一坐式摆设取办理平台,破解模子迁徙难、摆设繁、适配性差等痛点。该平台次要包罗模子市场浏览器(内嵌聚合支流开源模子平台,建立同一的模子资产办理系统)、多格局模子当地化仓库(通过正在各计较节点成立当地化资本仓库,系统支撑多格局、多版本的资产当地化管理)、模子转换取优化引擎(通过图形化东西实现原始模子向高机能推理格局的从动化转换)、模子评估取基准测试(针对新拉取或转换后的模子从动施行全方位的基准测试,测试维度涵盖训推机能、资本耗损及精度目标三个焦点层面)四部门,打制开箱即用的模子办事能力。
力度不竭加大。正在政策导向和企业平安认识的双沉感化下,数据平安营业的需求量高速增加,数据平安手艺财产快速成长。
综上,公司AI办事器及AI模子使用落地的市场根本为本项目AI训推一体机的规模化商用供给了无力支持。
Scaleout指多个超节点间的互连扩展。Scaleout高速收集需分析考虑高带宽、低延迟、可扩展性、高可用性等焦点需求,需要处理多和谈支撑、高机能互换、超大规模组网等问题。每个异构计较节点支撑高速网卡接入Scaleout收集,采用动态可沉构的夹杂拓扑,通过大都据平面、分组层级化毗连,降低全局跳数,支撑大规模节点扩展,满脚超节点间更大规模的高速互连需要。
本项目基于国产CPU、国产AI加快卡,供给高密度、高能效的AI算力,建立开箱即用、软硬协同的下一代高机能AI训推一体机;依托国产AI加快卡,通过同一计较框架实现CPU和AI加快卡的高效协同,并基于硬件平台、系统软件、训推引擎取东西链的深度整合,打制涵盖AI模子开辟套件、全链调试取机能优化东西、全生命周期运维正在内的软硬一体处理方案。
如前所述,下一代高机能AI训推一体机项目录要建立开箱即用、软硬协同的下一代高机能AI训推一体机。项目录要打破AI一体机“沉硬件、轻软件、难利用”的窘境,冲破AI模子迁徙难、摆设繁、适配性差的瓶颈,处理计较资本操纵率低的问题。目前,公司已具备AI办事器全栈自研能力,控制AI大模子摆设、使用、安排相关的软件、东西及相关手艺,正在相关范畴取得发现专利跨越200项。公司将正在现有AI办事器产物根本上,研发8卡一体机、16卡一体机及桌面级液冷工做坐硬件。依托国产AI加快卡,通过同一计较框架实现CPU和AI加快卡的高效协同,并基于硬件平台、系统软件、训推引擎取东西链的深度整合,打制涵盖AI模子开辟套件、全链调试取机能优化东西、全生命周期运维正在内的软硬一体处理方案。公司现相关于AI训推一体机的手艺根本结实,可以或许无效支持项目研发。本项目产物具有明白且火急的需求,市场空间庞大,公司AI办事器产物及AI模子使用落地已构成优良的市场根本。
正在波动的营业负载下,需智能维持服 务质量取资本成本的最佳均衡,建立 一个及时、精准预测、快速响应 的系统,将静态算力为弹性、经 济的AI办事能力。
当前,AI模子正派历从百万参数到万亿参数的指数级增加,算力需求的迸发式增加导致全球范畴内呈现严沉的算力供给欠缺和资本设置装备摆设失衡问题。建立高效的算力资本协同安排供应能力,已成为处理算力碎片化、提拔资本操纵率、应对能源挑和和满脚多样化场景需求的必然选择,对鞭策AI手艺普惠化使用、推进绿色低碳成长具有计谋意义。
公司现有算力集群系统的研发团队跨越700人,根基笼盖项目所 需各类研发岗亭。团队中博士、硕士占比达52%,多来自清 华大学、大学、中国科学院等出名院校,持久承担并完成了 多项国度和处所严沉科研使命,具有雄厚的研究根本和研究实 力。包罗:2016年国度沉点研发打算高机能计较沉点专项“E级高 机能计较机原型系统研制”项目,2018年中科院计谋性先导科技专 项“国产平安可控先辈计较系统研制”,2021年国度沉点研发打算 高机能计较沉点专项“曙光8000高机能计较机系统研制”项目等。 项目团队研制的高机能计较机产物已有2台实现机能全球领先、5 台机能全球前十,均摆设于国度超等计较核心。相关手艺经 判定“全体手艺达到国际领先程度”,部门手艺“居于国际领先水 平”。项目团队多次荣获省部级科技励,包罗:市科技前进 一等(2021年)、世界互联网领先科技(2019年,世界互 联网大会)、科技立异一等(2022年,中国科技财产化推进 会)、云计较核心科技杰出(2022年,中国电子节能手艺协 会)、数据核心科技一等(2022年,中国工程扶植尺度 化协会)等。
研发8卡、16卡一体机及桌面级液 冷工做坐硬件,实现国产AI加快 卡间低延迟高带宽(400G以上) 全互连,液冷工做坐集成静音液冷 取硬件级平安。8卡一体机、16卡 一体机、桌面级液冷工做坐别离支 持千亿、万亿、百亿参数模子推 理。
(C)机能方面,中科曙光先辈存储系统的前序产物FlashNexus正在2025年登顶SPC-1榜单,表现了其机能劣势。
为了建立愈加不变靠得住的自从财产链,国内企业需要继续正在产物本身立异、产物生态合做、尺度制定等方方面面加大投入、持续堆集,以实现实正的可持续成长。本项目基于国产的焦点存储部件研制国产化的先辈存储系统,从自从手艺链、生态圈到财产链,从底层环节软硬件到顶层使用,提拔我国正在高端存储手艺范畴的焦点实力,实现财产链自从可控的需求。
AI模子落地面对框架格局碎片化、 优化策略复杂及量化摆设门槛高档问 题,针对PyTorch、TensorFlow等不 同框架锻炼模子,TensorRT、ONNX Runtime等高机能引擎,优化策略依 赖对硬件和框架的深切理解,需供给 图形化、从动化的转换东西来实现高 机能推理的无缝摆设。
存储财产是数字经济成长的基石,对数据平安发生间接影响。实现存储环节手艺的自从研发,实现数据根本设备的手艺可控性和供应链平安才能从底子上保障数据平安。本项目基于国产的焦点存储部件,研制国产化先辈存储硬件及软件系统,实现数据根本设备的自从可控性,提拔国度数据平安取消息平安的保障能力。
AI的次要矛盾正在于存储的拜候能力 无法婚配GPU的算力,导致GPU算 力华侈,需要借帮新兴的高速拜候标 准提拔存储的拜候效率,减小文件系 统的读延时至亚毫秒级别。 AI时代内存成本急剧上升,需要控 制系统的资本占用,利用无限内存发 挥更好的机能,热点数据的缓 存,平均每索引查询仅读盘一次,减 少读盘比例60%。
研发 800G/1600G 速度原生 RDMA网卡取互换机。摸索算力 芯片取收集芯片曲通(Chip-to- Chip)方案,研策动态拓扑沉构 手艺,升级无损流控机制,进一 步提拔系统互连规模。
通过前期研究,公司已构成scaleX超节点手艺、淹没液体相变冷 却手艺、scaleFabric高速互连收集手艺、DeepAI生态适配取模子优化 手艺、Gridview集群智能安排取数字孪生运维手艺等研发,可做 为本募投项目标手艺根本。 公司正在该范畴的初代产物scaleX640于2025岁尾表态后市场反应 积极,2026年2月,公司承建的3套scaleX万卡超集群系统正在国度 超算互联网郑州焦点节点同步上线万卡,建成我国单体最大规模的国产AI算力池,为将来十万卡级别 节点线性扩展能力的实现奠基根本,同时为百万卡级及以上集群扩展 预留手艺空间。
集群节点间通信面对带宽不敷、和谈 不兼容、收集扩展性不脚等问题,需 要提拔收集接口带宽到800G/1600G, 实现对RoCEv2/v3的深度兼容,支撑 十万卡以上规模系统扩展,并对准未 来百万卡集群的升级需求。 |
