人工智能算力资源池技术规范.docx
《人工智能算力资源池技术规范.docx》由会员分享,可在线阅读,更多相关《人工智能算力资源池技术规范.docx(9页珍藏版)》请在第壹文秘上搜索。
1、ICS35.240CCSL70标准T/STSIXXXX-XXXX人工智能算力资源池技术规范TechnicalSpecificationsforArtificialIntelligenceComputingPowerResourcePool(征求意见稿)在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。XXXX -XX-XX 发布XXXX-XX-XX实施中关村新兴科技服务业产业联盟发布目次前言II1范围12规范性引用文件13术语、定义和缩略语11I术语和定义1Q0缩略语24总体架构25总体要求36功能要求3A1池化管理功能3fti)池化调度功能3fiQ提供任意规格算力资源功能3R4虚
2、拟算力资源隔离功能3RK业务热迁移功能3RA横向扩展功能47兼容性要求48组件通信要求4Q1管理平面网络4Ri)数据平面网络59部署集成要求5Q1部署要求5D0集成要求510安全和可靠性要求51安全要求5InD可靠性要求6,.l.lZl,A刖三本文件按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中关村新兴科技服务业产业联盟提出并归口。本文件起草单位:本文件主要起草人:人工智能算力资源池技术规范1范围本文件规定了人工智能算力资源池的总体架构、总体要求、功能要求、兼容性要求
3、、组件通信要求、部署集成要求及安全和可靠性要求。本文件适用于人工智能算力资源池的设计、开发和运维。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T41867-2022信息技术人工智能术语GB/T42018-2022信息技术人工智能平台计算资源规范3术语、定义和缩略语11术语和定义GB/T41867-2022.GB/T42018-2022界定的以及下列术语和定义适用于本文件。为方便使用,以下重复列出了GB/T42018-2022中的一些术
4、语和定义。3.1.1人工智能力口速卡artificialintelIigenceacceleratingcard专为人工智能计算涉及、符合人工智能服务器硬件接口的扩展加速设备。来源:GB/T42018-2022,3.63.1.2物理计算资源physicalcomputingresource为人工智能应用提供信息处理能力(如存储、计算等)的实体设备。示例:人工智能服务器、人工智能加速卡和人工智能加速模组等。来源:GB/T42018-2022,3.33.1.3虚拟计算资源VirtUalCOmPUtingresource为人工智能应用提供信息处理能力(如存储、计算等)的逻辑设备。示例:逻辑设备是物理
5、设备的虚拟化形态,它与物理设备间存在映射关系。来源:GB/T42018-2022,3.43.1.4Al算力池化AlcomputingpowerpooIing对物理计算资源进行抽象,软件化后形成一个统一的资源池,方便用户按需对计算资源进行有效调用,无需关注实际物理计算资源的大小、数量、型号以及安插的物理位置。a9缩略语下列缩略语适用于本文件。AI:人工智能(ArtificialIntelligence)API:应用程序编程接口(APPliCatiOnProgrammingInterface)ASIC:专用集成电路(ApplicationSpecificIntegratedCircuit)CPU:
6、中央处理器(CentralProcessingUnit)FPGA:现场可编程逻辑门阵列(FieldProgrammableGateArray)GPU:图形处理单元(GraphicsProcessingUnit)KVM:基于内核的虚拟机(Kernel-basedVirtualMachine)4总体架构人工智能算力资源池总体架构见图1。人工智能业务O55图1总体架构其中: 人工智能业务:基于自然语言处理、计算机视觉、机器学习等技术实现的业务应用;一异构算力资源池:通过软件定义的方式将多种异构算力变成可动态管理的资源池; 运行时:一套兼容各类计算资源的APl编程环境的运行环境,模拟APl编程的运行时
7、接口,实现与上层AI框架的对接和管理; 调度控制服务:资源池的核心管理、调度模块,实现对节点IP地址、物理计算资源信息、虚拟计算资源信息以及应用任务信息等的汇总管理; 运维管理:提供图形用户界面,实现资源池全方位管理与监控; AI算力池化服务:发现并管理节点上的物理计算资源,将物理计算资源池化,将计算能力提供给集群中各个物理节点,以及各个物理节点上的虚拟机、容器; 异构算力:GPU、FPGA、ASlC等多种计算资源。5总体要求耳1资源池应采用分布式架构、模块化设计,在架构及功能方面应具备良好的系统可扩展能力,使得系统在为用户提供服务的过程中能实现平滑扩展,持续运行。59资源池应支持纳管GPU、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 资源 技术规范