400-025-7877

Platform overview

坤前AI算力整合解决方案

在过去几年,全球的数据量以每年58%的速度快速增长,类型也不断丰富,模型训练拥有海量的优质样本, 但更大的挑战来自于算法和硬件计算架构,为此,坤前提出了基于深度卷积神经网络的图像、语音、文字识别软硬件一体化解决方案。

图像识别指用视觉传感器(摄像头)和计算机来模拟人眼和大脑,进行物体识别、跟踪和测量, 进而做图形处理让计算机理解真实世界。图像识别技术有很多应用场景,如:人脸识别、拍照识别、物体识别等等。

基于深度学习的图像识别技术发展痛点

用来训练识别模型的样本数据不足,使得模型精准度往往不高;

图像识别算法不够先进,还主要停留在浅层训练的机器学习阶段;

计算机集群性能不够,计算用时太长,大大拉长了研发周期、拖慢产品进程。

Solution architecture

方案架构

人工智能推理与训练全流程图

图片1 (1).png

软件架构:坤前AI管理平台

坤前深度学习平台.jpg

坤前AI管理平台从基本业务需求出发,支持主流机器学习框架(如TensorFlow、Caffe、Torch、Keras等)。 提供深度学习的算法库(LeNet、MLSTM、Alexnet、Googlenet、ResNet、GAN、Faster R-CNN等)、 标准数据集(ImageNet、COCO、PASCAL VOC、CIFAR、Open Image、Youtube-8M)。 同时该平台可将CPU资源、内存、GPU资源、存储资源虚拟化后进行统一管理, 结合不同深度学习框架(如:Tensorflow、Caffe),实现快速创建机器学习应用,聚焦于算法本身, 更好地针对用户目前的深度学习算法,做硬件适配性算法迁移和升级优化,帮助用户提升算法训练速度。

硬件架构:IB网络+GPU集群+并行存储

以坤前KI4200G为代表的GPU服务器产品,在同CPU计算力下,GPU横向扩展数量要比业内大多数4U机型多,能够充分满足深度学习进程中训练和推理的双重需求。 根据深度学习多并行,高I/O需求,坤前推出Kstor并行存储系统,能够满足高带宽和高并发的海量文件存取的需求,为用户带来前所未有的存储性能体验。

坤前深度学习平台-1.png

该方案在保证系统稳定性前提下,能够使GPU计算能力得到充分发挥,帮助用户大幅提升线下模型训练速度,降低每个计算核心的TCO。同时, 配合坤前的AI管理平台,使用户在图像识别类应用上能够快速调用GPU资源,加速关键业务产品化进程。

返回顶部