云海麒麟深度学习平台Cloudkirin Deeplearning 2017支持分布式的深度学习算法产品。在CPU和GPU混布计算集群上,深度学习算法产品进一步提升高性能计算的分布式能力,海量数据得以在多机多卡间并行处理,大幅提升训练收敛速度。
产品特性:
➤B/S架构图形界面,支持中英文界面
➤通过Web GUI实现硬件监控,配置资源管理,实时监控CPU负载、内存使用率和网络流量等状态
➤快速网络自动部署整个集群系统
➤多种服务(DHCP, NTP, NIS, DNS等)配置
➤系统备份和恢复节点到默认设置
➤智能化任务调度,实现资源预留,任务回填,动态优先级和集群分区等功能
➤全面的错误报告和日志
➤具有安全机制的并发工具,方便集群的管理和使用
➤支持多网络配置
➤提供更加强大的命令行接口(CLI)
➤提供优化的并行编程环境:MPICH, LAM,openmpi
➤按需开关机
➤由于计算节点硬件故障导致的作业中断可以重新提交作业
➤支持用户定制化开发
➤支持并行GPU计算,能够实现GPU并行作业调度管理。
平台版本说明:
系统架构说明:
免责说明:此方案中软件部分非本公司品牌,由第三方合作伙伴提供。若您所使用的软件并非从本公司或经软件厂商官方授权的第三方获取,本公司将无法保证软件的合法正常使用,您因此遭受的损失与本公司无关。