分享文章
新闻分类
华为正式开源UCM技术:最大提升22倍 AI推理性能跃升
近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。
UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。
UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。
它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。
目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。

UCM产品架构

[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 合力开创法治中国建设新局面 7904753
- 2 外交部:日方必须给中国人民一个交代 7808573
- 3 日本官员低头听中方讲话 7713880
- 4 全运赛场“00后”小将刮起青春风暴 7618981
- 5 连续8天!黄海南部进行实弹射击 7520168
- 6 高市早苗或于12月26日参拜靖国神社 7426523
- 7 日本官员匆匆离开北京机场 7329054
- 8 福建舰入列后首次海上实兵训练 7236287
- 9 中方当场驳回日方无理交涉并反交涉 7135695
- 10 联合国回应高市早苗涉台错误言论 7046319


![你暖哥呀:这种天气就应该在家里躲起来[吃瓜]](https://imgs.knowsafe.com:8087/img/aideep/2021/8/12/b656fcbcb9384ba99608b949e89c3111.jpg?w=204)




OFJE-559
