开源项目库

精选值得学习、拆解、复用的 GitHub 开源项目。

55/55 个项目
AI
LLM
Agent
RAG
Workflow

LangChain

作者: LangChain AI

用于构建 LLM 应用、工具调用、检索增强和 Agent 工作流的开源框架。

为什么值得看

适合用来理解真实 LLM 应用如何组织链路、Agent、工具调用和检索增强。

AI
LLM
RAG
Agent
Knowledge Base

LlamaIndex

作者: LlamaIndex

把私有数据、业务数据和知识库接入 LLM 应用的数据框架。

为什么值得看

适合学习检索、文档 Agent、索引和知识库应用的设计方式。

AI
Gemini
Processors
Multimodal
Streaming

GenAI Processors

作者: Google Gemini

Google 开源的轻量 Python 库,用 Processor 把生成式 AI 流程拆成模块化、异步、可组合的流水线。

为什么值得看

适合学习多模态和流式 AI 应用的工程化组织方式:统一内容模型、可复用 Processor、异步执行和并行内容处理。

开发工具
Knowledge Graph
Codebase Analysis
Search
Agent Skills

Understand-Anything

作者: Lum1104

一个把代码库和技术内容转换成交互式知识图谱的工具,可以探索、搜索并直接提问。

为什么值得看

适合处理大型代码库:先把结构变成可教学的知识图谱,再用图谱解释关系、搜索概念,并辅助 AI 编程 Agent 理解项目。

开发工具
Knowledge Graph
Codebase Analysis
Agent Context
Local Search

codegraph

作者: colbymchenry

一个本地预索引的代码知识图谱,为 Claude Code、Codex、Gemini、Cursor、OpenCode、AntiGravity、Kiro 和 Hermes Agent 提供项目上下文。

为什么值得看

适合解决编程 Agent 反复读文件、浪费上下文的问题:先本地索引仓库,再让 Agent 用更少 token 和更少工具调用查询结构与符号。

AI
AI Engineering
Agent Building
Evaluation
Multimodal AI

ai-engineering-from-scratch

作者: rohitg00

一个面向 AI 工程的实战学习项目:学习基础,构建真实 AI 系统,并把作品发布给别人使用。

为什么值得看

适合想从概念走到可发布 AI 项目的学习者:覆盖 LLM 应用、Agent、评测、多模态和产品化思维。

开发工具
Agent Skills
Agent Memory
Agent Security
Research Workflow

ECC

作者: affaan-m

一个面向编程 Agent 的工具链性能优化系统,为 Claude Code、Codex、OpenCode、Cursor 等补上技能、本能、记忆、安全和研究优先的开发能力。

为什么值得看

适合用来观察如何把编程 Agent 从一次性聊天,升级成更稳定的工程助手:可复用技能、记忆、安全约束和先研究再执行的流程。

AI
LLM
RAG
Knowledge Base
Multimodal

Open WebUI

作者: Open WebUI

一个可自部署的 AI 界面,用来运行和管理 LLM 使用体验。

为什么值得看

适合观察一个完整开源 AI 产品如何处理用户、模型、工具和知识库能力。

AI
Agent
Workflow
RAG
Low-code

Dify

作者: LangGenius

一个生产级开源 AI 应用平台,用来构建 Agent 工作流、RAG 应用、聊天机器人和 AI 应用后端。

为什么值得看

适合研究成熟 AI 平台如何把模型接入、提示词编排、工具、知识库、工作流节点、评测、可观测性和应用发布整合成一个产品。

AI
Agent
Workflow
Automation

Microsoft Agent Framework

作者: Microsoft

用于构建和编排生产级 AI Agent 的开放框架。

为什么值得看

值得跟踪它在多 Agent 编排、工作流、托管和生产化模式上的设计。

AI
Agent Evaluation
Benchmark
Legal AI
LLM

Harvey LAB

作者: Harvey AI

一个开源法律 Agent Benchmark,用真实法律任务评测 LLM Agent 的工作能力。

为什么值得看

适合研究严肃 Agent 产品如何评测:任务数据集、法律文档、评分标准、执行框架、模型裁判、评分报告和横向对比流程。

AI
Legal AI
Document Assistant
Document Review
Contract Drafting

Mike

作者: willchen96

一个开源法律 AI 平台,用于和文档对话、运行法律工作流,并用结构化表格审阅文档。

为什么值得看

适合研究法律 AI 产品工作流:项目级文档空间、带引用的文档问答、可复用审阅模板、表格化抽取、合同起草,以及模型和数据可自托管控制。

AI
Agent
Automation
Computer Control
Skill Tree

GenericAgent

作者: lsdefine

一个极简自进化 Agent 框架,可以控制本地电脑,并把任务路径沉淀成可复用技能。

为什么值得看

适合研究 Agent 如何用很少的基础工具控制浏览器、终端、文件系统、键鼠和屏幕视觉,并把反复执行的任务沉淀成技能树。

AI
Agent
Supervisor
Automation
Computer Control

Galley

作者: wangjc683

基于 GenericAgent 的本地 Agent 工作台,用来在自己的电脑上同时运行、切换、管理和续跑多个 AI Agent 会话。

为什么值得看

适合研究桌面 Agent 产品如何处理多会话编排、GUI/CLI 对等、人类审批、浏览器控制、历史持久化,以及 Supervisor Agent 接管。

AI
Agent
Assistant
Multi-channel
Voice

OpenClaw

作者: openclaw

一个本地优先的个人 AI 助手,可以跑在自己的设备上,并通过你常用的聊天渠道响应你。

为什么值得看

适合研究完整个人 AI 助手架构:Gateway、多渠道收件箱、隔离 Agent、语音唤醒、实时 Canvas、移动/桌面伴侣应用、工具、技能和沙箱。

开发工具
Coding Agent
Terminal
IDE
Multi-session

OpenCode

作者: anomalyco

面向终端、IDE 和桌面开发工作流的开源 AI 编程 Agent。

为什么值得看

适合研究 coding agent 产品设计:LSP 上下文、多会话并行、会话分享、多模型接入,以及让 AI 在真实项目里读代码、改代码、跑命令的工作流。

开发工具
Coding Agent
Terminal
OpenAI
CLI

Codex CLI

作者: OpenAI

OpenAI 开源的轻量级终端编程 Agent,用来在本地项目里协助读代码、改代码和跑命令。

为什么值得看

适合研究成熟 coding agent 的产品体验:理解仓库上下文、生成补丁、执行命令、沙箱与审批、改动复核,以及模型如何和真实代码库协作。

开发工具
Agent Docs
API Retrieval
Context Memory
Code Generation

Context Hub

作者: Andrew Ng

Andrew Ng 开源的 Agent 文档工具,把版本化 API 文档和反馈记录交给 AI 编程助手,减少过期文档导致的幻觉。

为什么值得看

适合研究如何让 AI 编程助手用最新上下文写代码:搜索文档、按需拉取 API 说明、记录会话批注、把反馈回流给维护者,并封装成可复用的 Agent 技能。

开发工具
Document Conversion
RAG
Data Preparation
Multimodal

MarkItDown

作者: Microsoft

微软开源的文档转换工具,把 PDF、Office 文件、网页、图片、音频、YouTube 链接等资料转成适合 LLM/RAG 使用的干净 Markdown。

为什么值得看

适合做 RAG 和知识库预处理:用命令行或 Python API 统一清洗不同格式资料,尽量保留标题、列表、表格、链接和代码块。

开发工具
Chinese Conversion
i18n
Text Processing
JavaScript

opencc-js

作者: nk2028

OpenCC 的 JavaScript 版本,用于简体、繁体和不同中文地区用字之间的转换。

为什么值得看

适合中文产品处理本地化、搜索归一化、内容迁移、字幕文本清洗,以及在浏览器和 Node.js 里做稳定的简繁转换。

开发工具
Text Measurement
Layout Stability
Rendering Performance

Pretext

作者: Cheng Lou

Cheng Lou 开源的文本测量与排版引擎,不依赖 DOM 回流就能计算文字高度、行数和换行位置。

为什么值得看

适合大量文本界面:聊天列表、编辑器、时间线、虚拟滚动列表,以及任何需要提前知道文字占位、减少闪动和跳动的 UI。

开发工具
Design System
UI Generation
Design Tokens
Coding Agent

Awesome DESIGN.md

作者: VoltAgent

一个 DESIGN.md 文件合集,把真实品牌设计系统整理成 AI Agent 可读取的纯文本设计规则。

为什么值得看

适合研究 AI 辅助 UI 生成:把视觉风格、设计 token、字体层级、组件规则、布局原则和提示词指南整理成 Agent 能直接复用的设计上下文。

AI
Speech Recognition
Transcription
Translation
Audio

Whisper

作者: OpenAI

通用语音识别模型,用于多语言语音转文字、语音翻译和语言识别。

为什么值得看

适合研究语音产品底座:音频转写、字幕生成、会议记录、播客处理、翻译流程、语言检测,以及在口音和背景噪声下更稳的语音识别。

自动化
Browser Agent
Co-browsing
MCP
Automation

Tandem Browser

作者: hydro13

一个本地优先的 AI-Human 共生浏览器,让人和 Agent 共用同一套标签页、Cookie、登录态和网页运行时。

为什么值得看

适合研究浏览器原生 Agent 自动化:真实登录态下的 SaaS 流程、可访问性树、DOM、实时网络日志、DevTools 上下文、页面 UI 改写、显式交接,以及 MCP/HTTP 接入。

AI
Image
Video
Workflow
Multimodal

ComfyUI

作者: Comfy Org

用于图像、视频和生成式 AI 创作的节点式可视化工作流系统。

为什么值得看

是研究可视化工作流设计和生成式 AI 创作生态的好样本。

AI
Video
Storyboard
Workflow
Consistency

Jellyfish

作者: Forget-C

从剧本到分镜、资产一致性、生成与导出的端到端 AI 短剧生产工作台。

为什么值得看

值得看,因为它不是单点视频生成器,而是把 AI 短剧拆成剧本、角色、分镜、资产和任务的完整生产流程。

AI
Animation
Video
Interpolation
Cartoon

ToonCrafter

作者: Doubiiu

把两张卡通画面插帧成连续动画片段的生成式动画工具。

为什么值得看

适合研究插画动效、二维短片、漫画风动画和儿童故事视频,也适合想摆脱平台套餐、自己搭动画流程的人看。

AI
LLM
Video
Automation
TTS

MoneyPrinterTurbo

作者: harry0703

把一个主题或关键词自动生成文案、素材、配音、字幕、BGM 和成片的一键短视频流水线。

为什么值得看

适合研究低成本短视频自动化、批量生成和 LLM 到媒体合成的流水线;也要注意它更偏素材库拼贴,不是风格完全可控的 AI 视频生成。

AI
LLM
Video
Commentary
Editing

NarratoAI

作者: linyqh

把原始视频自动拆解、写解说词、配音、生成字幕并剪成解说视频的一键影视解说工具。

为什么值得看

适合研究剧情理解、影视解说、转录字幕、语音克隆、剪映草稿导出和 AI 粗剪流程;但项目声明仅供学习研究,不得商用,使用前要看清授权。

AI
Video
Image Generation
ComfyUI
TTS

Pixelle-Video

作者: AIDC-AI

把一个主题自动生成文案、AI 配图/视频、语音解说、BGM 和成片的全自动短视频引擎。

为什么值得看

适合研究基于 ComfyUI 的短视频生产底座:AI 生图/生视频、模板、TTS、数字人口播、图生视频和动作迁移模块都能拆开看。

AI
Digital Human
Avatar
Video
Voice Cloning

Duix-Avatar

作者: Duix.com

用于离线生成数字人视频、克隆形象和声音的开源 AI Avatar 工具。

为什么值得看

适合研究数字人视频如何从高价定制服务变成本地可运行的生产流程;正经玩法是做自己的数字分身,或用授权素材做内容生产,不要做未授权冒充。

数据
Data Labeling
Annotation
Model Evaluation
Dataset

Label Studio

作者: HumanSignal

开源数据标注和评测平台,支持文本、图像、音频、视频、时间序列和聊天机器人评测。

为什么值得看

适合研究 AI 产品背后的数据闭环:采集标注、审阅模型输出、评测聊天机器人质量、准备训练数据,并导出标准化标注结果。

数据
Vector Database
Embeddings
RAG
Search

Chroma

作者: Chroma

面向 AI 的开源数据基础设施,核心是 embedding 存储、向量搜索、混合搜索和检索。

为什么值得看

适合研究 RAG 系统如何管理文档、metadata、embedding、collection 和 query,也适合理解向量数据库如何成为 AI 产品的检索层。

数据
MCP
LLM
Financial Data
SQL

Massive.com MCP Server

作者: Massive.com

让 LLM 通过搜索、API 调用和 SQL 查询访问 Massive.com 金融市场数据的 MCP Server。

为什么值得看

适合学习如何把数据 API 包装成适合 LLM 使用的工具,用于市场研究、数据分析和 Agent 工作流。

数据
Stock Market
Market Data
Alerts
Dashboard

OpenStock

作者: Open Dev Society

开源股票市场信息台,用来跟踪价格、设置提醒、管理自选列表并查看公司洞察。

为什么值得看

适合研究市场数据产品如何做搜索、自选、提醒、图表、登录、持久化、数据源接入和金融界面设计;把它当信息产品参考,不是投资建议。

数据
OSINT
Dashboard
Real-time Data
Map

Osiris

作者: simplifaisoul

开源实时 OSINT 信息看板,聚合航班追踪、CCTV、地震、冲突地图和新闻源。

为什么值得看

适合研究态势感知产品如何做公开数据接入、地理信息看板、实时渲染、提醒界面和多来源情报展示;只用于合法公开数据,并注意隐私边界。

数据
WiFi Sensing
Spatial Intelligence
Pose Estimation
Vital Signs

RuView

作者: ruvnet

把普通 WiFi/RF 信号转成实时空间感知、姿态估计、存在检测和生命体征监测的开源系统。

为什么值得看

适合研究无摄像头感知产品:CSI/RF 信号处理、WiFi DensePose、隐私友好的存在检测、健康监测、智能家居自动化、ESP32 固件和实时看板。把它当研究和原型材料,不要当医疗建议或监控工具。

机器人
Bipedal Robot
3D Printing
Sim2Real
MuJoCo

Open Duck Mini

作者: Antoine Pirrone

开源迷你双足机器人项目,参考 BDX Droid,包含 3D 打印件、BOM、装配资料和行走策略实验。

为什么值得看

适合研究开源硬件项目如何把机械结构、3D 打印、物料清单、装配文档、MuJoCo 强化学习和 sim2real 行走策略整理成一个可复现的机器人项目。

效率工具
macOS
Screenshot
Annotation
Productivity

capcap

作者: skyrin

轻量原生 macOS 截图工具,支持快速截图、标注、长截图、马赛克、剪贴板和分享流程。

为什么值得看

适合研究本地优先的效率工具如何做菜单栏应用、全局快捷键、截图选区、标注体验、图片合并、对象存储分享和克制的桌面工作流。

效率工具
AI Assistant
Launcher
Voice Input
Clipboard

SuperCmd

作者: SuperCmdLabs

一个开源 macOS 启动器,把应用/文件搜索、剪贴板、语音输入、朗读和 AI 助手放进同一个命令框。

为什么值得看

适合研究桌面效率工具如何把 Raycast 式启动器、AI Prompt、语音输入、记忆、浏览器扩展和日常快捷操作整合成一个入口。

效率工具
AI Agent
Presentation
PPTX
Document Generation

GordenPPTSkill

作者: GordenSun

一个面向 AI Agent 的 PPT 生成 Skill,内置 17 套中文 PPTX 模板和非破坏式文本编辑工具,可生成保留版式的真实可编辑 PPTX。

为什么值得看

适合研究 AI Agent 如何处理复杂版式文档:不是把幻灯片压成图片,而是通过模板、结构化 edits.json 和 python-pptx 生成可交付、可继续编辑的演示文稿。

自动化
ID Photo
Photo Processing
Background Replacement
Offline

LiYing

作者: aoguai

面向普通照相馆的证件照后期自动化工具,覆盖人像识别、换底色、裁剪、排版和压缩。

为什么值得看

适合研究垂直行业工具如何把重复后期流程封装成本地工作流:人脸/人体识别、角度校正、换底、标准证件照尺寸、批量输出、WebUI 和离线隐私。

AI
Claude
Knowledge Base
Second Brain
Workflow

Obsidian AI Second Brain

作者: Ian

用 Obsidian 和 Claude 搭建个人 AI 知识库的完整步骤指南。

为什么值得看

适合学习如何把笔记、链接和截图沉淀成 Claude 能读取、整理和更新的个人知识库。

开发工具
Claude Code
Skills
Agent
Workflow

Awesome Claude Code Skills

作者: Ian

按使用场景整理的 Claude Code Skills、Agents 和 Plugins 精选合集。

为什么值得看

适合快速发现可用的 Agent 技能,也适合观察 Claude Code Skill 生态如何按场景组织。

开发工具
Claude Skills
Documentation
Web Scraping
MCP

Skill Seekers

作者: yusufkaraaslan

把文档网站、GitHub 仓库和 PDF 自动转换成 Claude 可用 Skill 技能包的工具。

为什么值得看

适合研究如何把文档变成 Agent 可直接使用的知识包:爬取、OCR、代码提取、AI 整理、冲突检测、结构化打包,以及 MCP 自动化。

开发工具
Claude Skills
Science
Agent Skills
MCP

Scientific Agent Skills

作者: K-Dense-AI

一套面向科研场景的 Agent Skills 技能库,让 AI Agent 能调用科学工具和数据库完成研究分析。

为什么值得看

适合研究垂直科研能力如何被封装成可复用技能:科学数据库、标准化 Skill 接口、MCP 兼容流程、数据分析、可视化和报告生成。

开发工具
Chat SDK
TypeScript
Slack
Discord

Vercel Chat SDK

作者: Vercel

Vercel 开源的统一 TypeScript SDK,用一套代码构建可同时运行在 Slack、Microsoft Teams、Google Chat、Discord 等平台的聊天机器人。

为什么值得看

适合学习跨平台聊天机器人架构:适配器层、平台事件、认证、消息格式,以及一套核心逻辑如何复用到多个即时通信平台。

开发工具
Coding Agent
Agent Skills
Engineering Workflow
Review

Agent Skills

作者: Addy Osmani

Addy Osmani 开源的工程技能包,把 Google 工程实践整理成 19 个结构化技能,让 AI 编程 Agent 按更完整的研发流程写代码。

为什么值得看

适合给 Claude Code、Cursor、Windsurf、GitHub Copilot 等编程 Agent 加上需求澄清、实现、测试、安全审查和上线检查,减少只写代码不做验证的问题。

开发工具
Architecture
System Design
AI Agents
Templates

Awesome Architecture

作者: study8677

一个中英双语架构知识库,整理 21 套可复用系统架构图,覆盖 AI 网关、RAG、Agent、推理服务、向量数据库等场景。

为什么值得看

适合训练“先想架构再写代码”的能力:先看真实系统模板,理解数据流和边界,再用 architecture-copilot skill 在 AI 编程工具里辅助设计方案。

开发工具
Image Generation
Presentation
Content
Skill

Ian Handdrawn PPT

作者: Ian

把文章、提纲或课程笔记生成中文手绘技术解释图的 Codex Skill。

为什么值得看

适合学习 AI 内容工具如何先整理叙事结构,再生成可用于课程和文章的统一风格页面图。

开发工具
Image Generation
Illustration
Content
Skill

Ian Xiaohei Illustrations

作者: Ian

把中文文章里的判断、流程和隐喻生成白底手绘正文配图的 Codex Skill。

为什么值得看

适合学习如何让 AI Agent 从文章里提炼一个关键认知动作,并转成有记忆点的正文配图。

开发工具
Video Editing
Skills
Workflow
Subtitles

Speclip Skills

作者: linyqh

一套面向真实视频生产的开源 AI 视频工作流 Skills,覆盖短剧解说、口播精剪、字幕布局和视频处理。

为什么值得看

适合学习如何把剪辑经验、字幕布局和视频处理方法沉淀成可复用的 Agent 工作流;它开源的是方法层和 Skills,完整 Speclip 运行环境是另一层。

自动化
Web Agent
Research
Content Extraction
Automation

socai

作者: Tony Chong

专为小红书调研、内容抽取和自定义 Agent 任务优化的 Web Use Agent。

为什么值得看

适合学习 Agent 如何像人一样操作真实网页、复用已登录浏览器会话,并把网页调研沉淀成结构化结果。

Web3
Solidity
Security
DeFi
DAO

OpenZeppelin Contracts

作者: OpenZeppelin

被 Ethereum 和 EVM 项目广泛使用的安全智能合约库。

为什么值得看

适合学习可复用智能合约模式、安全边界和经过广泛验证的 Web3 基础组件。

Web3
Bluetooth Mesh
Nostr
P2P
Privacy

Bitchat

作者: Permissionless Tech

去中心化点对点聊天 App,离线用蓝牙 Mesh 通信,联网时可通过 Nostr relay 扩展消息范围。

为什么值得看

适合研究隐私优先通信产品:无账号启动、蓝牙 Mesh 发现、传输 fallback、端到端加密、IRC 风格命令、紧急擦除和去中心化 relay 设计。