【招标公告】GPU服务器(清采比选20241165号)采购公告
【招标公告】GPU服务器(清采比选20241165号)采购公告:本条项目信息由剑鱼标讯北京招标网为您提供。登录后即可免费查看完整信息。
基本信息
地区 | 北京 北京市 | 采购单位 | 清华大学 |
招标代理机构 | 项目名称 | GPU服务器(清采比选20241165号) | |
采购联系人 | *** | 采购电话 | *** |
采购项目名称:GPU服务器
采购项目编号:清采比选20241165号
对外联系人:本项目不接受咨询
联系电话:本项目不接受咨询
采购单位:清华大学
物资名称:GPU服务器
采购数量:1
计量单位:台
单价:¥350000
技术参数及配置要求:1、 提供现场安装调试部署(网络、原有数据导出导入,集群软件,开发使用环境等),为方便后期运维,需本地供应商提供保修期内的三年软硬件免费上门巡检服务且提供售后服务承诺函。 2、提供集群管理软件,要求集群管理与作业调度为第三方产品,不与服务器品牌绑定,提供所需服务器节点的永久正式版授权license,支持64位Linux和Windows系统。 3、配置: 4U机架式服务器 CPU: Intel Xeon 6442Y(24C,225W,2.9GHz)*2 内存:64GB DDR4 *8 硬盘:960G M.2(RAID1)+ 7.68TB u.2*2 RAID:PM8204 2G缓存 带电池 网络:双口万兆网卡 电源:3000W*4 GPU:RTX4090 24GB*8 (另外需冷备3块紧急情况下使用使用) 服务:三年原厂商质保服务、硬盘不返还服务; 4、集成软件指标: 1、安装环境:平台支持裸机安装、虚拟机两种方案、其中裸机与虚拟机安装提供定制操作系统ISO镜像,ISO系统镜像安装过程中自动部署管理节点服务,提供系统快速安装手册。 2、底层架构:底层全自研,非k8s,非基于k8s等开源调度系统二次开发,并解决在限制任务内存硬盘过程中,因算法占用内存或硬盘超过配额限制而重启的问题,提供厂商盖章承诺书或技术证明资料。 3、框架支持:预装主流学习框架,例如:tensorflow、caffe、mxnet、pytorch、paddlepaddle等主流的学习框架,提供截图证明。 4、在线开发:支持在线模型开发功能,提供JupyterLab、JupyterNoteBook、VS Code,Terminal等在线编程环境,提供截图证明。 5、分布式训练:支持单机多卡、多机多卡等分布式训练机处理,支持MPl,Horovod等训练模式。 6、资源虚拟化:采用轻量级容器虚拟化技术,实现对CPU、内存、磁盘等资源的虚拟化和统一管理。针对人工智能领域的特定需求,提供GPU等异构计算资源管理接口,实现对GPU等异构计算资源的虚拟化统一管理,支持为容器以直通方式挂载GPU等异构计算资源。 7、无卡模式:当GPU数量不足时,允许用户当前关机的任务可以使用无GPU卡模式启动,任务ID以及任务中的数据不丢失,提供截图证明。 8、配额管理:支持NFS、GlusterFS、CephFs、Minio等存储,并提供配额功能,提供截图证明。 9、训练配额:支持对用户使用资源规格数量进行限制,提供截图证明。 10、AI训练设备管理:支持添加AI训练设备,并通过BMC控制设备关机、重启等操作,提供截图证明 11、存储设备管理:支持添加NFS、GlusterFS、CephFs、Minio等存储,同时可以配置存储绑定的计算节点设备,提供截图证明。 12、资产管理:支持定时收集用户服务器资产,提供资产报表导出功能,同时支持对服务器的耗电量进行统计,提供截图证明。 13、告警事件:支持通过BMC收集服务器故障日志。及时将故障通知给用户。 14、工单管理:支持用户在使用过程中遇到问题及时通过工单进行沟通,方便运维人员进行处理,提供截图证明。 15、用户管理:支持主用户与子用户功能,子用户只需要专注于业务,方便团队内部或者小组内部使 用,提供截图证明。 16、数据标注:支持图片数据标注功能,内置基于web的图片数据标注功能,可多点圈选图片特征区域,一次指定多标签,提供截图证明。 17、提供原厂人工智能计算资源管理平台软件对应软著证明,如出现兼容性问题客户可要求全额退款;
详情请访问原网页!
采购项目编号:清采比选20241165号
对外联系人:本项目不接受咨询
联系电话:本项目不接受咨询
采购单位:清华大学
物资名称:GPU服务器
采购数量:1
计量单位:台
单价:¥350000
技术参数及配置要求:1、 提供现场安装调试部署(网络、原有数据导出导入,集群软件,开发使用环境等),为方便后期运维,需本地供应商提供保修期内的三年软硬件免费上门巡检服务且提供售后服务承诺函。 2、提供集群管理软件,要求集群管理与作业调度为第三方产品,不与服务器品牌绑定,提供所需服务器节点的永久正式版授权license,支持64位Linux和Windows系统。 3、配置: 4U机架式服务器 CPU: Intel Xeon 6442Y(24C,225W,2.9GHz)*2 内存:64GB DDR4 *8 硬盘:960G M.2(RAID1)+ 7.68TB u.2*2 RAID:PM8204 2G缓存 带电池 网络:双口万兆网卡 电源:3000W*4 GPU:RTX4090 24GB*8 (另外需冷备3块紧急情况下使用使用) 服务:三年原厂商质保服务、硬盘不返还服务; 4、集成软件指标: 1、安装环境:平台支持裸机安装、虚拟机两种方案、其中裸机与虚拟机安装提供定制操作系统ISO镜像,ISO系统镜像安装过程中自动部署管理节点服务,提供系统快速安装手册。 2、底层架构:底层全自研,非k8s,非基于k8s等开源调度系统二次开发,并解决在限制任务内存硬盘过程中,因算法占用内存或硬盘超过配额限制而重启的问题,提供厂商盖章承诺书或技术证明资料。 3、框架支持:预装主流学习框架,例如:tensorflow、caffe、mxnet、pytorch、paddlepaddle等主流的学习框架,提供截图证明。 4、在线开发:支持在线模型开发功能,提供JupyterLab、JupyterNoteBook、VS Code,Terminal等在线编程环境,提供截图证明。 5、分布式训练:支持单机多卡、多机多卡等分布式训练机处理,支持MPl,Horovod等训练模式。 6、资源虚拟化:采用轻量级容器虚拟化技术,实现对CPU、内存、磁盘等资源的虚拟化和统一管理。针对人工智能领域的特定需求,提供GPU等异构计算资源管理接口,实现对GPU等异构计算资源的虚拟化统一管理,支持为容器以直通方式挂载GPU等异构计算资源。 7、无卡模式:当GPU数量不足时,允许用户当前关机的任务可以使用无GPU卡模式启动,任务ID以及任务中的数据不丢失,提供截图证明。 8、配额管理:支持NFS、GlusterFS、CephFs、Minio等存储,并提供配额功能,提供截图证明。 9、训练配额:支持对用户使用资源规格数量进行限制,提供截图证明。 10、AI训练设备管理:支持添加AI训练设备,并通过BMC控制设备关机、重启等操作,提供截图证明 11、存储设备管理:支持添加NFS、GlusterFS、CephFs、Minio等存储,同时可以配置存储绑定的计算节点设备,提供截图证明。 12、资产管理:支持定时收集用户服务器资产,提供资产报表导出功能,同时支持对服务器的耗电量进行统计,提供截图证明。 13、告警事件:支持通过BMC收集服务器故障日志。及时将故障通知给用户。 14、工单管理:支持用户在使用过程中遇到问题及时通过工单进行沟通,方便运维人员进行处理,提供截图证明。 15、用户管理:支持主用户与子用户功能,子用户只需要专注于业务,方便团队内部或者小组内部使 用,提供截图证明。 16、数据标注:支持图片数据标注功能,内置基于web的图片数据标注功能,可多点圈选图片特征区域,一次指定多标签,提供截图证明。 17、提供原厂人工智能计算资源管理平台软件对应软著证明,如出现兼容性问题客户可要求全额退款;
详情请访问原网页!
剑鱼标讯北京招标网收集整理了大量的招标投标信息、各类采购信息和企业经营信息,免费向广大用户开放。登录后即可免费查询。