梧州学院电子信息与人工智能学院
项目背景
客户需要将已采购的二十多台服务器资源管理起来,用于老师科研,并且需要在平台上对不同型号的GPU服务器做监管,其中包括购买的华为服务器和华为升腾显卡,上百万的服务器一直没有用起来,处于闲置状态,另外学院还有Intel 、AMD的服务器无法统一管理。
华为服务器:CPU配置4*huawei 鲲鹏920,内存:1t,显卡:8*昇腾910B(32G显存)
华三服务器:CPU配置2*Intel 5320,内存:4*64GB,显卡:NVIDIA 7*A10(24GB显存)
通过AI Paas在虚拟机中安装华为AI 大模型,将服务器资源利用起来
华为服务器4块显卡直通、4块显卡做虚拟化,底层部署欧拉虚拟机
不同架构CPU、显卡在同一平台管理,实现资源灵活调用,科研老师通过申请定制周期桌面,使用后自动释放桌面资源
项目概况
电子信息与人工智能学院由原来的大数据与软件工程学院和电子与信息工程学院合并,教师科研力量提高,和华为共建广西首个“华为开发者创新中心”,和京东科技共建“梧州学院-京东AI智能实验室”,学院对高算力资源需求增大,但是如何高效利用这些算力资源是个难题,尤其是在华为服务器中部署AI 大模型,满足训练与科研使用,同时,学院不同老师使用的资源大小不一,资源什么时候释放也没有平台做统一管理,因此需要将异构服务器能够统一纳管,灵活调度。
应用场景
-
部署华为AI大模型,用于AI日常训练及项目科研
-
资源纳管包括:移动渲染显卡、高性能数据处理工作站、国产服务器、GPU服务器、NVIDIA TESLA A100 80G GPU、NVIDIA RTX3090 24G GPU、NVIDIA A40 48G GPU计算卡、NVIDIA Tesla A10 24G GPU计算卡
-
教学平台系统:人工智能设备智能机器人、大数据开发平台、机器视觉教学研究创新实验平台等
应用价值
-
将服务器不同的显卡资源动态分配出去并且能够回收
-
能够实现公网映射,不同账号分配对应显卡资源,并且管理平台能够对不同显卡资源统一管理
-
满足教师科研使用之后,可以开放给学生教学使用,提高资源利用率
建设效果
|
|
|

