开始:猎云网
近日,AI算力界限的新锐企业容芯致远获云岫老才略投数千万元种子轮融资。本轮融资将主要用于容芯致远智算新品的研发及量产委派,加快AI推测架构与国产芯片技艺的深度交融。云岫老本也将络续为容芯致远在产业发展、资源对接与后续融资等方面做事。
北京容芯致远科技有限公司缔造于2024年5月,专注于推测机体捆绑构的翻新与缱绻,费力于于成为中国AI界限的SuperMicro。紧合手国度信创和AI Infra两大产业发展机遇,容芯致远凭借在“数据加快技艺”界限的深厚累积与中枢上风,翻新GPU体捆绑构,优化国产做事器数据措置,快活高并发分娩应用启动需求,扫尾客户IT资源成果的最大化。
冲突“不成能三角”:以AGC架构重构AI基础才略大模子带来了纷乱的AI算力需求,同期也对传统以CPU为中心的推测机架构(ACC)提议了前所未有的挑战。
在高性能推测(HPC)、大模子查验/推理等场景应用中,GPU比拟CPU,手脚中枢加快推测部件,具有功耗更高、启动温度更高、故障率更高的“三高”特征,对GPU算力的分娩级可用性、运维方便性、使用寿射中组成了要紧挑战。异常据标明,某海外著明GPU在非7*24小时使用情况下的故障率为1-3%,在高负荷场景下故障率高达5-8%。弥远高温高能耗现象的GPU平均寿命仅有1-3年,这对平方架构智算整机而言,单卡故障会径直导致整机住手做事,收复时期需2小时以上。是以,更高效地辅助AI时期MOE模子查验推理,需要对推测机体捆绑构进行变革。
面临大模子海浪下传统CPU中心架构(ACC)的遵守瓶颈,容芯致远于2024年缔造之初就提议内行首创AGC智算架构——以GPU为中枢重构推测机系统,突破传统AI推测中“成本、成果、天真性难以兼得”的行业困局,扫尾GPU热插拔、GPU-RAID高可用、GPU节能延寿等三大技艺突破,让GPU发扬更大算力成果,同期更具成本上风和天真实稳健性。
当今,容芯致远的AGC智算家具已适配主流国产GPU,包括天数智芯、寒武纪、燧原、登临科技、墨芯、沐曦、希姆、海光DCU、摩尔线程等,同期也适配了DeepSeek、文心一言、Llama、Qwen、ChatGLM等主流大模子。
家具矩阵:遮蔽端侧推理到千亿级查验的全场景算力基于AGC架构,容芯致远推出了通算+智算双线家具,构建从数据措置加快到超大限度模子查验的全栈智力。
在智算家具线方面,旗舰机型K20辅助20卡GPU集群,通过张量并行优化技艺扫尾DeepSeek 671B全量模子单机满血启动,大幅裁减硬件插足与运维复杂度,适配多种主流开源大模子。场景化家具K2禁受双卡静音缱绻,搭载预置推理环境并辅助RAG检索,为企业提供即用型AI算力末端。
通算家具线方面则手脚数据加快引擎,禁受了硬件级安全加快技艺,通过独处双阵列RAID保护与I/O卸载技艺,进步CPU做事器数据读写性能超3倍。该家具线辅助全栈国产技艺阶梯,可天真选配数据加快单位以适配不同场景需求。
计谋布局:技艺-生态双轮驱动国产算力解围容芯致远凭借信创国产化与AI Infra升级机遇,构建起三大中枢壁垒:技艺纵深上,深度优化推测机体捆绑构并衔尾自研推理框架,突破国产GPU集群成果难题;生态定约方面,联袂互助伙伴共建RISC-V开源生态,推动端边云协同算力收罗落地;成本重构则通过架构翻新替代硬件堆叠,助力客户扫尾IT资源诈骗率最大化。
5月9日,容芯致远采集中国绽开教唆生态(RISC-V)定约在北京晓谕缔造RISC-V国产智算体捆绑构翻新专科组,现场300多东说念主参与会议。容芯致远一举发布5款禁受AGC架构缱绻的智算新品,从辅助双卡到辅助20卡不等,成为内行首家单机全面适配DeepSeek各模子尺寸家具的企业。
容芯致远CEO 王成江示意:“云岫团队因其在AI界限架构技艺的深厚累积与前瞻性洞见,成为本轮融资奏凯落地的珍爱辅助。手脚公司种子轮计谋股东,云岫不仅通过产业资源整合助力构建垂直生态系统,更络续输出专科计谋引诱与运营法子论,为企业在技艺迭代、买卖化旅途及商场布局等维度注入发展动能,夯实面向异日竞争的弥远价值基础。”
云岫老本创始搭伙东说念主兼CEO精采无比示意:“容芯致远团队在体捆绑构层面的颠覆性翻新ag九游会官网,直击AI算力成本与成果痛点。AGC架构展现的“单机跑deepseek全量模子”智力,有望成为国产算力“ 换说念超车”的要害支点。期待容芯致远在在AI算力界限的络续翻新与突破,莽撞为我国乃至内行的东说念主工智能发展孝顺更多力量。”