Penguin Solutions™ 旨在设计、构建、部署和管理人工智能,并且大规模加速计算基础设施,2024年6月18日,这家公司宣布开拓OriginAI®解决方案,其中经过验证的预定义人工智能架构,并且融入了英伟达(NVIDIA)的技术支持。在Penguin智能集群管理软件和专家服务的支持下,OriginAI基础架构简化了人工智能的实施和管理,实现了可预测的人工智能集群性能,支持客户从数百到数千GPU规模的集群中获得投资回报。
Penguin Solutions总裁Pete Manca说,“设计、部署和运营人工智能工厂是一项极其复杂的工作。我们的OriginAI解决方案以Penguin广泛的人工智能基础设施专业知识为基础,降低了这种复杂性,加快了投资回报。我们的OriginAI解决方案在为首席执行官和首席信息官提供大规模部署和管理高要求人工智能工作负载所需的基本可靠基础设施方面迈出了重要一步。”
OriginAI解决方案结合成熟的架构、最新一代硬件、先进的集群管理软件和专家专业服务,为关键的、高要求的工作负载提供可靠的基础架构。这些架构基于1-pod、4-pod和16-pod配置,可从256个GPU扩展到16000多个GPU。OriginAI解决方案采用了英伟达(NVIDIA)H100 GPUs、Penguin的Scyld ClusterWare® 12.2软件以及业界领先的网络和存储选项,并由Penguin的全方位托管服务提供支持。
IDC(International Data Corporation,国际数据公司)企业基础设施研究高级副总裁马特·伊斯特伍德(Matt Eastwood)指出,“更好的 GPU 性能和可控成本是当今客户最关心的问题。凭借Penguin Solutions在设计、集成、安装和配置人工智能基础设施方面的实践专长,经过验证、可扩展的OriginAI架构可同时实现这两个目标。Penguin将继续通过其创新的高性能解决方案和服务,为要求最苛刻的环境提供人工智能工作负载。”
OriginAI解决方案基于成熟的架构,利用Penguin创新的工厂内预烧和集成环境来验证人工智能集群的性能,并在发货前确认生产就绪状态,确保客户从部署的那一刻起就能获得预期的性能和投资回报。通过将这些架构与Penguin的Scyld ClusterWare软件及其专家管理服务(可预测性地监控集群健康状况并管理解决方案的吞吐量)相结合,OriginAI可实现95%以上的整体集群效率,同时推动比传统方法更高的GPU吞吐量。
Penguin Solutions是英伟达认证的精英OEM(Original Equipment Manufacturer,原始设备制造商,也称为定点生产,俗称代工(生产))和DGX AI计算系统解决方案提供商以及DGX-Ready管理服务合作伙伴,自2017年以来一直在大规模交付AI工厂。Penguin拥有 25 年以上的 HPC 经验(High performance computing,高性能计算),迄今已部署和管理超过 75,000 个 GPU,是佐治亚理工学院、Meta、桑迪亚实验室和美国海军等领先组织在 AI 和 HPC 解决方案和服务方面值得信赖的战略合作伙伴。
关于Penguin Solutions
Penguin Solutions™产品组合包括Penguin Computing™和Penguin Edge™,利用HPC、AI和IoT(Internet of Things,物联网)等新兴技术的力量,通过横跨边缘、核心和云的解决方案和服务,加速客户的数字化转型。通过设计高度先进的基础设施、机器和网络系统,我们帮助全球最具创新精神的企业和政府机构构建自主未来、推动探索并放大人类潜能。
(机器翻译,轻度译后编辑,仅供参考。)
编辑:李旭媛