patchy631 / ai-engineering-hub

25,2534,110+158 todayJupyter Notebook

关于大语言模型、检索增强生成及现实世界AI智能体应用的深度教程。

AI Engineering Hub是一个专注于人工智能工程实践的综合性资源库，旨在帮助开发者掌握大语言模型、检索增强生成和AI智能体等前沿技术的实际应用。该仓库提供了超过93个分难度级别的生产就绪项目，涵盖从入门到高级的全阶段学习路径。初学者可以从OCR识别、简易RAG系统等基础项目入手；进阶者能探索涉及智能体工作流的复杂场景；高级开发者则可深入研究模型微调与生产级系统部署。通过结合深度教程与真实案例，该项目为不同水平的开发者提供了可直接实施、适配并扩展的解决方案，是系统化学习AI工程化和构建实际应用的实用指南。

💡 应用场景

这个项目最适合需要快速上手并实践AI应用开发（特别是LLM、RAG、智能体）的开发者，提供从零到生产的完整案例参考。

快速搭建本地OCR应用

问题：开发者需要从图片中提取LaTeX公式或结构化文本，但不想依赖云API或付费服务。

方案：使用项目中的LaTeX OCR、Gemma-3 OCR等示例，基于Llama 3.2、Gemma-3等开源模型搭建100%本地的OCR应用。

示例：将论文中的数学公式图片转换为可编辑的LaTeX代码，或从扫描文档中提取表格数据。

构建私有文档问答系统

问题：开发者想基于内部文档（如技术手册、公司资料）搭建智能问答助手，但担心数据隐私和API成本。

方案：参考Simple RAG Workflow、Document Chat RAG等项目，使用LlamaIndex、Ollama等工具实现本地化检索增强生成系统。

示例：为团队创建一个能回答产品文档问题的聊天机器人，所有数据处理都在本地服务器完成。

开发带推理过程的AI助手

问题：开发者希望AI助手不仅能给出答案，还能展示思考过程，便于调试和教学。

方案：使用DeepSeek Thinking UI、Qwen3 Thinking UI等示例，构建可视化推理链的聊天界面。

示例：教育场景中，让学生看到AI解题的每一步逻辑；开发调试时，分析AI决策依据。

学习AI智能体开发实战

问题：开发者想学习如何构建能执行复杂工作流的AI智能体，但缺乏从入门到进阶的系统案例。

方案：按照项目难度分级，从Beginner的简单RAG开始，逐步学习Intermediate的智能体项目，最终掌握Advanced的生产级系统。

示例：从构建一个文档问答机器人开始，逐步升级为能自动分析GitHub仓库、生成报告的多步骤智能体。

📊 项目信息

语言: Jupyter Notebook
Stars: ⭐ 25,253
Forks: 4,110
今日新增: +158
排名: #8
收录: 总榜
趋势日期: 2026年1月7日

🏷️ 标签

Jupyter NotebookStreamlit机器学习教程AI应用开发项目驱动全面教程初学者友好AI工程师

📸 截图

5分钟快速开始AI Engineering Hub

AI Engineering Hub是一个包含93+生产就绪项目的AI工程资源库，帮助您快速上手大语言模型、RAG和智能体等应用。

🖥️ 操作系统

macOSWindowsLinux

⚙️ 运行环境

Python3.8+

🔧 工具

Git— 克隆仓库

📝 操作步骤

克隆仓库

使用Git克隆项目到本地，获取所有代码和资源。

克隆仓库到当前目录

$ git clone https://github.com/patchy631/ai-engineering-hub.git

✓预期输出：Cloning into 'ai-engineering-hub'... 完成后显示 'done' 或类似消息。

💡确保网络连接正常，如果速度慢可尝试使用镜像或代理。

安装依赖

进入项目目录并安装Python依赖包，以运行Jupyter Notebook项目。

进入项目目录

$ cd ai-engineering-hub

安装所有依赖包

$ pip install -r requirements.txt

✓预期输出：Successfully installed ... 显示安装成功的包列表，无错误信息。

💡建议使用虚拟环境（如venv）以避免包冲突。如果requirements.txt不存在，可先运行 'pip install jupyter notebook streamlit' 安装基础工具。

运行一个简单项目

启动一个入门级项目，例如OCR应用，快速体验效果。

进入OCR项目目录（假设路径，根据实际调整）

$ cd beginner_projects/ocr_vision

运行Streamlit OCR应用

$ streamlit run llama_ocr_app.py

✓预期输出：在浏览器中打开本地URL（如 http://localhost:8501），显示OCR应用界面，可上传图片并提取文本。

💡如果找不到具体文件，请查看README中的项目列表，选择任意一个beginner项目，按照其说明运行。

✅ 验证成功

成功运行一个项目并看到交互界面，表示环境配置正确。

✓浏览器打开应用界面
✓无错误日志输出
✓可正常上传文件或输入文本

⚡ 快速提示

学习路径从Beginner Projects开始，如OCR或简单RAG，避免直接尝试高级项目。

工具建议使用Ollama等工具本地运行模型，减少API依赖和成本。

文档参考查看项目内的README或注释，获取具体运行命令和参数。

🔍 常见问题排查

❓ pip安装失败或报错

→ 升级pip：'pip install --upgrade pip'，或使用Python虚拟环境隔离依赖。

❓ Streamlit应用无法启动或显示错误

→ 检查端口是否被占用，尝试 'streamlit run app.py --server.port 8502' 更换端口。

❓ 找不到项目文件或路径错误

→ 使用 'ls' 或 'dir' 查看目录结构，参考README中的项目列表定位文件。

🎯 下一步

探索更多项目

根据技能水平，尝试Intermediate或Advanced项目，如智能体工作流或模型微调。

订阅Newsletter

获取免费电子书和最新教程，持续学习AI工程实践。

贡献代码

Fork仓库并提交PR，添加新项目或改进现有内容。

难度

入门

预计时间

2-3天

目标人群

对AI应用开发感兴趣的零基础或初学者，具备基本Python知识但无AI项目经验者

🎯 学完你将掌握

能够搭建并运行一个简单的本地AI应用（如OCR识别或聊天界面），理解AI工程的基本工作流程

📋 前置知识

Python基础熟悉

项目基于Python和Jupyter Notebook，需要能理解基本语法、安装包、运行脚本

Git基础了解

需要克隆GitHub仓库，了解基本的版本控制操作

命令行/终端使用了解

需要在终端中运行命令来安装依赖、启动服务

AI/LLM基本概念了解(可选)

知道什么是大语言模型（LLM）、RAG（检索增强生成）等术语有助于理解项目目标

📚 学习资源

必看

Ollama 官方文档

学习如何在本地拉取和运行各种大语言模型，是运行本项目大多数示例的基础

🗺️ 学习阶段

环境准备与项目探索

⏱ 1-2小时

克隆项目并浏览结构

1. 在本地创建合适的工作目录 2. 使用 `git clone https://github.com/patchy631/ai-engineering-hub.git` 克隆仓库 3. 打开项目文件夹，查看README和目录结构，了解项目分类（Beginner/Intermediate/Advanced）

💡建议先通读README的'Getting Started'和'Projects by Difficulty'部分，对整体有个印象

准备Python环境

1. 确保已安装Python（建议3.9+版本） 2. 创建并激活一个虚拟环境（如使用venv或conda） 3. 安装Jupyter Notebook：`pip install notebook`

💡使用虚拟环境可以避免包冲突。如果遇到权限问题，尝试在命令前加 `sudo`（Mac/Linux）或以管理员身份运行（Windows）

第一个项目：本地OCR应用

⏱ 3-4小时

选择并进入入门项目

1. 在'Beginner Projects'的'OCR & Vision'分类下，选择'Llama OCR - 100% local OCR app with Llama 3.2 and Streamlit' 2. 导航到对应的项目文件夹（通常有明确的文件夹名或README指引）

💡'Llama OCR'是一个很好的起点，它集成了模型和Web界面，结果直观

安装项目特定依赖

1. 查看项目文件夹内的requirements.txt或README中的安装说明 2. 在终端中，进入该项目目录，运行 `pip install -r requirements.txt` 安装所有依赖

💡安装过程可能较慢，特别是下载模型时。确保网络稳定。如果某个包安装失败，可以尝试单独安装或搜索错误信息

下载并运行模型（Ollama）

1. 根据项目说明，安装并启动Ollama（一个本地运行模型的工具） 2. 在终端运行 `ollama pull llama3.2` 或项目指定的模型命令来下载模型

💡模型文件较大（几个GB），请预留足够磁盘空间和下载时间。Ollama官网有详细的安装指南

运行Streamlit应用

1. 在项目目录下，运行 `streamlit run app.py`（或项目指定的启动命令） 2. 浏览器会自动打开本地Web界面（通常是 http://localhost:8501） 3. 按照界面提示，上传一张包含文字的图片，测试OCR功能

💡首次运行Streamlit可能会在浏览器中询问邮箱，可以跳过。确保终端窗口保持打开，这是应用的后台

第二个项目：简易RAG系统

⏱ 3-5小时

选择RAG入门项目

完成OCR项目后，选择'Beginner Projects'下的'Simple RAG Workflow - Basic RAG with LlamaIndex and Ollama'项目

💡RAG是当前AI应用的核心模式之一，这个项目帮你理解文档加载、分割、检索和生成的基本流程

理解代码结构与流程

1. 打开项目的Jupyter Notebook文件（.ipynb） 2. 从头到尾阅读一遍代码单元格和注释，不要急于运行 3. 理解关键步骤：加载文档 -> 分割文本 -> 创建向量索引 -> 提问并检索相关上下文 -> 生成答案

💡使用Jupyter Notebook的优势是可以分步执行和查看中间结果。先通读，理清逻辑

分步运行Notebook

1. 在项目目录下启动Jupyter Notebook：`jupyter notebook` 2. 在打开的网页中点击对应的.ipynb文件 3. 按顺序逐个运行代码单元格（Shift+Enter），观察每一步的输出

💡如果某个单元格运行失败，仔细查看错误信息。常见问题是缺少包或模型未下载。可以回到上一步检查Ollama模型

修改与实验

1. 尝试更换不同的本地文档（如.txt, .pdf）进行测试 2. 修改提问的问题，观察检索到的上下文和最终答案的变化 3. 如果项目允许，尝试调整文本分割的长度等参数

💡学习的关键在于动手修改和观察变化。即使出错，解决错误的过程也是宝贵的学习经验

巩固与扩展

⏱ 2-3小时

探索其他入门级项目

在'Beginner Projects'中再选择1-2个感兴趣的项目尝试，例如： - 'Local ChatGPT with DeepSeek'（构建聊天界面） - 'Document Chat RAG'（与文档对话） - 'Image Generation with Janus-Pro'（图像生成）

💡选择不同类型的项目可以拓宽视野。注意每个项目可能需要不同的模型（通过Ollama pull下载）

总结学习笔记

记录下： 1. 成功运行了哪些项目 2. 遇到了哪些问题及如何解决 3. 对AI工程流程（数据准备、模型调用、应用集成）的新理解

💡好记性不如烂笔头。整理笔记有助于巩固知识，并为后续学习提供参考

⚠️ 常见错误

❌ 未使用虚拟环境，导致包版本冲突

✅ 始终为每个项目或在项目根目录创建独立的虚拟环境（python -m venv venv），并在其中安装依赖

❌ 未正确下载或启动Ollama模型

✅ 1. 确保Ollama服务在运行（终端输入ollama list检查）。2. 运行项目前，用`ollama pull <模型名>`提前下载好指定模型。3. 注意模型名称是否与代码中调用的一致

❌ 直接运行复杂项目，遇到大量错误感到挫败

✅ 严格遵守从Beginner项目开始的路径。不要跳过基础，先确保1-2个最简单的项目能跑通，建立信心

❌ 网络问题导致模型或包下载失败

✅ 1. 为pip和ollama配置国内镜像源。2. 对于大型模型，耐心等待或寻找离线资源。3. 检查防火墙或代理设置

❌ 在Jupyter Notebook中一次性运行所有单元格

✅ 务必按顺序逐个单元格运行，并观察每个单元格的输出。这样能快速定位错误发生的具体步骤

🚀 后续方向

完成5个以上Beginner项目并理解其原理后，可以： 1. 进入'Intermediate Projects'，尝试涉及多智能体（CrewAI）和复杂工作流的项目。 2. 学习将项目部署为可分享的Web应用（如使用Streamlit Cloud）。 3. 阅读项目源码，尝试修改功能或集成自己的数据源。 4. 按照仓库中的'AI Engineering Roadmap'系统化地补充机器学习、深度学习理论知识。