数据工坊 DWR-产品优势
产品优势
EMS内存存储具有以下优势:
- 半托管融合部署,降低成本
EMS数据面部署在AI服务器上,采用融合部署,统一纳管AI服务器上空闲的D RAM 内存资源,复用DRAM内存资源,提供推理加速服务,降低推理KVCache存储成本。
- 分级缓存,提升推理吞吐,优化推理时延
EMS通过构建“显存-内存-存储”三级缓存体系,实现历史KVCache动态分层存储,突破显存瓶颈,实现显存扩展;通过缓存推理历史KVCache,实现以存代算,提升LLM推理服务的吞吐性能,降低推理资源成本;同时缩短LLM推理首Token输出时延,改善用户对话体验。
- 分布式共享内存池,提升缓存命中率
EMS将AI服务器上空闲的DRAM内存构建成分布式内存池,突破单机内存瓶颈,提升缓存空间,同时使得节点间能够进行高效的数据共享,支持亲和调度,提升缓存命中率,满足大规模分布式推理需求。
- 兼容主流推理框架,满足多样化访问
EMS提供SDK,供各种推理框架集成,兼容vLLM等开源框架及其他企业自研的LLM框架,适配LLM推理环节中对内存Cache的多样化访问需求。