888腾博会

CN EN JP
企业邮箱入口
关注888腾博会智能把握最新行业动态与资讯
当前地位:首页 >  新闻中心 >  公司新闻

COMPUTEX 2026|888腾博会智能颁布 MEIGINE AI 推理引擎,五大突破沉新界说端侧大模型部署范式

颁布日期:2026-06-02 接见量:69 起源:888腾博会智能

6 月 2 日,COMPUTEX 2026 发展首日,888腾博会智能颁发正式颁布自研 MEIGINE AI 神经网络推理引擎(MEIG Intelligent Neural Engine)。该引擎专为端侧大模型部署而生,通过整体式兼容、异构推算调杜纂跨平台适配三大主题能力,让宽大客户无需期待漫长的平台适配,大幅降低资源和模型限度,为智能终端提供“全、通、快、稳、广”的推理加快履历,助力端侧AI从“能跑”迈向“快跑”。

最强生态:全面兼容 GGUF,无缝接入顶级生态

MEIGINE 最为显著的优势在于全面兼容 GGUF 模型体式,并接入顶级开源生态,模型开源后 MEIGINE 第一功夫即可在端侧不变运行。区别于单一的“体式兼容”,导入的模型会经过端侧专项调优,实现“拿来就用,用就快”的零门槛部署履历。目前, MEIGINE 已不变支持 Qwen、Llama 全系列模型,覆盖 0.6B 到 7B 参数规模,让开发者无需为端侧适配耗费额表精力。


1.jpg

一跑全通:一套模型文件,多平台通用

面对端侧芯片平台多元化的行业现实,MEIGINE 提出“一次部署,全平台通用”的解决规划。统一套 GGUF 模型文件,无需沉复适配即可在高通、紫光展锐等分歧芯片平台上不变运行,握别“一平台一模型”的碎片化困境。这一能力大幅降低了开发者的适配成本,让端侧 AI 利用真正实现跨平台急剧迁徙与规;丛。

高效部署:更快解码速杜纂更强内存优化

在模型解码速度方面,888腾博会智能基于 SNM970(Q-8550 平台)进行了 MEIGINE 规划与 QNN 规划的部署对比。以 Qwen3-0.6B 为例,MEIGINE 解码速度高达 50.6 token/s,超过 QNN 的 40.67 token/s,让幼模型在端侧实现无压力实时交互。在内存占用方面,以 Qwen2.5-7B 为例,MEIGINE 仅需 4.8GB 内存,较 QNN 的 6.4GB 节俭 25%,同样的硬件可部署更大参数模型,显著降低端侧AI落地门槛。

2.jpg

异构协同:CPU/GPU/NPU 智能调度,解放 CPU 算力瓶颈

针对端侧推理中 CPU 负载过高的行业痛点, MEIGINE 自研异构调度引擎,将推算负载智能分配至 CPU、GPU、NPU 协同处置,突破传统规划对 CPU 的过度依赖,通过精密化算力调杜纂底层优化,实现整机功耗的大幅降低。

同样基于 SNM970(Q-8550 平台),以 Qwen2.5-3B 模型为例,MEIGINE 的 CPU 占用为 9%,相较 QNN 的 38% 降幅高达 76%;在 Qwen2.5-7B 模型下,MEIGINE 的 CPU 占用仅为 8%,较 QNN 的 20% 降低 60%。更低的 CPU 占用意味着设备不烫不卡,整机流畅运行,为长功夫 AI 交互提供坚实的能效保险。

3.jpg

无限扩大:千兆级集群互联,算力叠加突破单设备天堑

面向更大参数模型与更复杂推理场景的将来需要,888腾博会智能已跑通验证通过千兆级网线设备构建推理集群的技术规划。该规划可实现规;懔Φ加,通过网线衔接设备即可突破单设备算力上限,为 7B 以上更大模型的端侧部署预留充足的扩大空间。

4.jpg

888腾博会智能钻研院院长李书杰暗示:

“MEIGINE 的颁布,是888腾博会智能从‘衔接’向‘算力+算法+衔接’全栈能力跃迁的沉要里程碑。端侧 AI 的下半场,不仅必要高算力硬件,更必要高效的推理引擎开释硬件潜能。”


将来,888腾博会智能将持续深耕端侧 AI 与 Agent 主题技术,以 MEIGINE 为基座,携手产业链合作同伴,推动大模型在具身机械人、智能座舱、低空经济等场景的规;涞,为万物智联时期注入强劲的智算动能。

返回列表
分享:

Copyright ? 2019 888腾博会.粤ICP备16017609号

2020041014435595

粤公网安备44030402003674号

交谊链接: 交谊链接 | 网站地图

智能客服 888腾博会-诚信为本,专业服务

888腾博会二维码

增长企业客服 增长企业客服
微博 888腾博会-诚信为本,专业服务
0755-83218588 888腾博会-诚信为本,专业服务
TOP

【网站地图】