google-ai-edge / LiteRT-LM

3,011283+501 todayC++

最适合需要在资源受限的边缘设备（手机、IoT、浏览器）上高性能、低延迟部署AI模型且保护隐私的场景。

问题：开发者需要在Android/iOS应用中集成智能对话功能，但用户网络不稳定或需要保护隐私，无法依赖云端API。

方案：使用LiteRT-LM将Gemma或Llama等小型语言模型直接部署到手机端，通过硬件加速实现流畅的本地推理，无需网络连接。

示例：在旅行App中集成离线翻译和景点问答助手，用户在国外无网络时也能正常使用。

问题：智能家居或IoT设备需要低延迟的语音指令理解，但云端处理延迟高且成本昂贵。

方案：在树莓派等边缘设备上部署LiteRT-LM，利用其跨平台特性和硬件加速，实现毫秒级的本地语音指令识别与响应。

示例：智能音箱本地处理“打开客厅灯”等指令，即使断网也能快速响应，保护用户隐私。

问题：Web应用希望提供AI增强功能（如智能摘要、代码补全），但JavaScript模型性能有限且依赖用户设备算力。

方案：基于LiteRT-LM在Chrome等浏览器中集成高性能本地模型（如项目已用于Chrome），通过WebAssembly和GPU加速提供接近原生的体验。

示例：在线文档编辑器集成本地AI写作助手，用户输入时实时提供语法修正和内容建议，无需上传数据到云端。

问题：机器人或AR设备需要同时处理图像、音频和文本输入来做出决策，但现有框架在资源受限设备上性能不足。

方案：利用LiteRT-LM的多模态支持和工具调用（Function Calling）API，在设备端实现视觉问答、语音交互和任务执行的完整代理工作流。

示例：仓储机器人通过摄像头识别货箱，用本地模型分析库存状态，并调用移动函数自主导航到指定区域。

C++边缘计算模型部署高性能跨平台硬件加速移动开发者AI工程师