google-ai-edge

google-ai-edge / LiteRT-LM

#5
3,011283+501 todayC++

💡 应用场景

最适合需要在资源受限的边缘设备(手机、IoT、浏览器)上高性能、低延迟部署AI模型且保护隐私的场景。

移动端离线AI助手

问题:开发者需要在Android/iOS应用中集成智能对话功能,但用户网络不稳定或需要保护隐私,无法依赖云端API。

方案:使用LiteRT-LM将Gemma或Llama等小型语言模型直接部署到手机端,通过硬件加速实现流畅的本地推理,无需网络连接。

示例:在旅行App中集成离线翻译和景点问答助手,用户在国外无网络时也能正常使用。

边缘设备实时交互

问题:智能家居或IoT设备需要低延迟的语音指令理解,但云端处理延迟高且成本昂贵。

方案:在树莓派等边缘设备上部署LiteRT-LM,利用其跨平台特性和硬件加速,实现毫秒级的本地语音指令识别与响应。

示例:智能音箱本地处理“打开客厅灯”等指令,即使断网也能快速响应,保护用户隐私。

浏览器内置AI功能

问题:Web应用希望提供AI增强功能(如智能摘要、代码补全),但JavaScript模型性能有限且依赖用户设备算力。

方案:基于LiteRT-LM在Chrome等浏览器中集成高性能本地模型(如项目已用于Chrome),通过WebAssembly和GPU加速提供接近原生的体验。

示例:在线文档编辑器集成本地AI写作助手,用户输入时实时提供语法修正和内容建议,无需上传数据到云端。

多模态边缘AI代理

问题:机器人或AR设备需要同时处理图像、音频和文本输入来做出决策,但现有框架在资源受限设备上性能不足。

方案:利用LiteRT-LM的多模态支持和工具调用(Function Calling)API,在设备端实现视觉问答、语音交互和任务执行的完整代理工作流。

示例:仓储机器人通过摄像头识别货箱,用本地模型分析库存状态,并调用移动函数自主导航到指定区域。

📊 项目信息

语言
C++
Stars
3,011
Forks
283
今日新增
+501
排名
#5
收录
总榜
趋势日期
2026年4月8日
最后推送
2026/4/9

🏷️ 标签

C++边缘计算模型部署高性能跨平台硬件加速移动开发者AI工程师

📸 截图

LiteRT-LM screenshot 1