九章云极方磊:智算操作系统,推进算力迈入普惠智算新时代
WAIC2024世界人工智能大会暨人工智能全球治理高级别会议正式拉开帷幕,面向世界徐徐展示人工智能技术最前沿的理念和成果。九章云极DataCanvas公司董事长方磊受邀参加大会开幕式,并在“迈向AGI:大模型焕新与产业赋能”论坛发表主题演讲,分享最新智算产业洞见。
“迈向AGI:大模型焕新与产业赋能”论坛作为WAIC2024的重要主题论坛,由中国信通院承办,论坛定位为“AI大模型顶尖盛会”,邀请人工智能领域国内外知名院士、科技圈网红大咖,和阿里云、九章云极DataCanvas公司等业内领军企业领袖,以及顶尖高校与科研机构专家,与来自行业主管部门、国家实验室、国际组织等各界重磅嘉宾齐聚一堂,共探大模型驱动新质生产力发展的新潜能。
九章云极DataCanvas公司董事长方磊发表演讲
方磊受邀发表《智算操作系统——迎接软件定义算力的新世界》主题演讲,布道“智算操作系统”这一智算中心刚需的AI软件,展现人工智能基础软件在算力经济时代的突破创新和无限可能。
智算操作系统——构建上下游算力消纳生态,普惠算力时代“新解”
智算中心作为我国AI基础设施建设新版图,正在AI生态链前所有未的凝聚力下加速建设进程。随着大模型的全民体验普及、行业大模型的爆发,如何为算力使用者高效输出更好的算力资源的同时释放智算经济价值,成为当下智算中心面临的多样挑战。
算力用户的灵活需求逐步增加,GPU使用效率急需提升,智算中心无法仅通过裸金属做到“可度量、可切分、可转换”的算力来精准匹配消费需求。在硬件同质化趋势下,作用在硬件之上的AI软件就成为了智算“新解”。智算操作系统,作为智算时代创新升级的AI软件产物,九章云极方磊:智算操作系统,推进算力迈入普惠智算新时代不只是传统意义上硬件和软件的桥接,更是构建上下游算力消纳生态、助力AI行业发展的关键一环。
那么,高性能的智算操作系统面临哪些挑战,又应当具备何种性能?
方磊介绍,新一轮的底层计算变革由大模型的崛起而引发,高速灵活算法的需求和底层相对固定硬件的匹配成为智算操作系统的核心挑战。新时代的智算操作系统面临异构算例资源纳管困难,大规模集群算力调度能力不足、利用率低,AI加速优化能力不足,以及AI大模型训练微调门槛高等复合挑战。因此,这一高度工程化的操作系统研发仍有较高门槛,需要成熟、标准化的AI产品直击痛点。
此外,随着AI行业的迅猛发展,行业信息差的加速消除,区别于通过购租“裸金属”获得算力的单一方式,未来算力将作为社会普遍的“资源”,以“好用,用好”的普惠形态服务算力消费者。构建可持续发展的上下游算力消纳生态,需要AI基础硬件、AI基础软件和大模型应用的共同发展促成,其中作为AI基础软件的智算操作系统在中间层将发挥至关重要的变革作用。
AlayaNeW智算操作系统——全栈AI创新,推动AI技术繁荣
凭借九章云极DataCanvas公司十余年在人工智能平台、“通识 产业”大模型矩阵以及前沿Agent智能体的AI软件产品实力积淀和行业理解,内置算力管理内核、人工智能服务、大模型和智能体的AlayaNeW智算操作系统,通过自上而下的一体化创新,直击痛点,加速赋能智算中心发展。
●NeWArchitecture面向AI的新软硬一体架构
AlayaNeW凭借先进的异构纳管技术实现全面支持各厂家GPU算力,通过高性能的IB、RoCE网络架构配置优化的网络集合通讯算法,专为大模型设计的高性能存储设施,以及Serverless弹性高性能计算架构,全透明的资源调度管理,让用户得以从硬件资源管理中抽身、只专注AI核心训练和推理任务。
●NeWKernel先进的AIDCOS系统内核
AlayaNeW实现了跨中心算力智能调度,设置全功能Kernel和轻量Kernel来全面纳管不同类型算力中心和集群;面向大模型任务,AlayaNeW提供专用调度算法和策略,并通过故障感知、拓扑感知调度、GANG调度、动态公平调度等能力实现更进一步的调度优化,全面提升算力可用性。
●NeWStorage专为大模型设计的存储设施
AlayaNeW为大模型需求匹配强大的跨越多智算中心的数据平台NeWDingo,通过多中心存储、语料专用压缩算法、文件系统物化视图、文件系统与向量数据库融合、原生安全策略等存储技术,不仅实现70%-90%的空间节省,50%的网络IO节省,其语料处理速度同时提升高达10倍。
●LMInfra大模型基础设施
AlayaNeW通过开箱即用的高性能模型训练及推理服务(通过算法加速、编译优化、内存优化、通信加速实现训练效率提升100%、GPU利用率提升50%、推理速度提升4倍),安全的高性能私有化模型仓库,以及动态模型推理服务和资源共享,成为高性能、高可用的大模型软件基础设施。
●NeWAgentTeamUponDemand
AlayaNeW内置强大的FoundationAgent基座,全面支持知识管理、数据分析、多模态智能体开发;完整的Agent开发工具链,面向开源社区高度兼容和开放;支持一键部署Agent,以及弹性、灵活的运行时环境支持,为多样化Agent在各行业业务场景应用按下加速键。
方磊指出,AlayaNeW可谓是划时代的前沿人工智能技术融合创新之作。AlayaNeW提供前所未有的交互模式,从Infra到Agent的各层AI能力,AlayaNeW都能够以便捷交互的操作系统形式呈现。AlayaNeW不再是简单的AI软件,不单能够操作算力的纳管、调度、调优,它更是一个或一组Agent,用户通过简单的交互指令即可实现复杂的大模型训练等AI任务,可以说是用户专属的“数字化人工智能专家团队”。AlayaNeW正在通过全新的交互变革,打破大模型和Agent应用壁垒。
中国始终积极拥抱智能变革,大力推进人工智能创新发展。九章云极DataCanvas公司的智算操作系统产品,正是公司十余年创新人工智能基础软件研发和服务的又一力证,未来,公司将以AlayaNeW智算操作系统为抓手,与人工智能生态伙伴加速构建稳健可持续的智算产业生态,为我国智算经济发展输出自主创新的AI动力!