MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率-通用服务器-中存储网

2024-03-19 22:10:09

来源
中存储

该解决方案利用 CXL 内存的智能分层，通过从 GPU HBM 卸载到 CXL 内存来提高大型语言模型（LLM）的性能。

作为 AI 优先大内存软件的领导者，MemVerge 与美光联手推出了一项突破性的解决方案，该解决方案利用 CXL 内存的智能分层，通过从 GPU HBM 卸载到 CXL 内存来提高大型语言模型（LLM）的性能。这项创新合作将在 GTC 的美光展位 #1030 展出，与会者可以亲眼目睹分层内存对 AI 工作负载的变革性影响。

MemVerge 首席执行官兼联合创始人 Charles Fan 强调了克服 HBM 产能瓶颈的至关重要性。“经济高效地扩展 LLM 性能意味着让 GPU 获得数据，”Fan 说。“我们在 GTC 上的演示表明，分层内存池不仅可以提高性能，还可以最大限度地利用宝贵的 GPU 资源。”

该演示由 MemVerge 和美光的工程师进行，采用了 FlexGen 高吞吐量生成引擎和 OPT-66B 大型语言模型，该模型在配备 AMD Genoa CPU、Nvidia A10 GPU、Micron DDR5-4800 DIMM、CZ120 CXL 内存模块和 MemVerge Memory Machine X 智能分层软件的 Supermicro 千万亿次级服务器上运行。

MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率

演示的结果令人印象深刻。与传统的 NVMe 存储方法相比，利用分层内存的 FlexGen 基准测试在不到一半的时间内完成任务。同时，GPU 利用率从 51.8% 飙升至 91.8%，这要归功于 MemVerge Memory Machine X 软件促进的跨 DIMM 和 CXL 模块的数据分层的透明管理。

MemVerge、美光和 Supermicro 之间的合作标志着在提升 AI 工作负载能力方面的一个重要里程碑，使组织能够实现前所未有的性能、效率和洞察时间水平。通过利用 CXL 内存和智能分层的强大功能，企业可以释放新的创新机会，并加速实现 AI 驱动的成功之旅。

通过与 MemVerge 的合作，美光能够展示 CXL 内存模块在提高 AI 应用的有效 GPU 吞吐量方面的巨大优势，从而更快地为客户提供见解。美光在内存产品组合中的创新为计算提供了必要的内存容量和带宽，以将 AI 用例从云扩展到边缘，“美光高级副总裁兼计算和网络业务部总经理 Raj Narasimhan 说。

关于MemVerge

MemVerge是大内存计算软件的先驱开发商。在云端或本地，数据密集型工作负载运行速度更快，成本更低，并且借助该公司屡获殊荣的 Memory Machine 产品自动恢复。Memory Machine X 有望彻底改变未来 CXL 内存的使用方式，而 Memory Machine Cloud 则凭借其不断调整云成本和性能的能力脱颖而出。

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率

AMD为中国定制的Instinct MI309 GPU未通过美国政府的出口许可证测试

NVIDIA 聚焦 EOS 超级计算机，配备超过 4,600 个 H100 GPU，用于下一代 AI 计算

新的替代 AI 模型：GPU 数量减少 10-100 倍，但结果相同

Meta AI 计划公布：600000 个 Nvidia GPU的算力水平

超微 Supermicro 新发布服务器，号称业界最紧凑的高性能 GPU 服务器

美国电信巨头AT&T数千万客户数据泄露

世界备份日｜即刻备份，畅享数据！

牢记10个安全技巧，加强个人信息安全保护

Veritas Backup Exec帮助中小企业增强抵御勒索软件的韧性

一文看懂备份和恢复解决方案的所有内容

以色列初创企业Datafy在种子轮融资600万美元

Cloudflare宣布R2的主要更新，包括事件通知和GCS支持

IDrive Backup新功能：云对云备份Google数据

亚太地区 93% 的公司将增加存储在公共云中的数据量

HYCU 拥抱 Gen AI ，构建通用 SaaS 保护解决方案

HPE起诉浪潮侵犯服务器和存储设备相关5项专利

OpenAI的全新GPT-4 Turbo模型已全面上线，并正式向付费ChatGPT用户开放

GPT-4转录一百万小时的YouTube视频内容，引发对版权法律法规适用性的深思

央企首个！中国移动九天自然语言交互大模型通过双备案

IBM在大学校园内首次启动IBM量子系统一号

金胜电子亮相 Embedded World大会，推出2.5英寸车载存储SSD

美光将DRAM和SSD价格提高25%

Teamgroup推出容量为2TB的 MicroSDXC存储卡

忆联带你读懂闪存原理与颗粒类型

开启AI存储时代慧荣企业级SM8366主控亮相CFMS2024

Quantum ActiveScale全闪存对象存储解决方案，可加速人工智能管道、为海量数据湖供电并构建存储云

IDC：中国银行业数据安全治理市场升级提速

不是独立式解决方案用不起，而是集成式解决方案更有性价比

面向企业的EDR解决方案真的很香

需要全面的网络保护解决方案？选它就对了！

科技要闻

前亚马逊工程师因黑客攻击交易所并盗窃1200多万美元获刑3年

漂亮手机来了，华为P系列改名Pura

聊聊网络安全的那些事

富捷电子：国内贴片电阻头部制造商

微星推出MPG EZ120 ARGB风扇：磁性连接设计最多可接18个

MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率

猜你喜欢

科技要闻