2026-06-06 周六

当天 GitHub 热榜 Top 10

1
NousResearch/hermes-agent +1845 ★ 今日
The agent that grows with you
是什么一个自我改进的 AI 代理工具,基于 Nous Research 的研究成果,支持多种模型和平台的对话应用。
能干嘛支持多种模型和平台的对话应用;Telegram、Discord、Slack、WhatsApp、Signal 和 CLI 的全平台对话连续性;具有终端界面和多行编辑功能的 TUI。
看点本工具支持 200+ 个模型,包括 Nous Portal、OpenRouter、NovitaAI、NVIDIA NIM、Xiaomi MiMo、z.ai/GLM、Kimi/Moonshot、MiniMax 和 Hugging Face 等。它还支持 OpenAI 和自定义模型。
Python ★ 183.1k ⑂ 31.4k
2
chopratejas/headroom +2473 ★ 今日
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
是什么一个用于压缩 AI 代理读取的上下文压缩层的库、代理和 MCP 服务器
能干嘛压缩工具输出、日志、文件和 RAG 块,60-95% 减少令牌,相同答案。代理包装 - `headroom wrap claude|codex|cursor|aider|copilot` 在一个命令中。MCP 服务器 - `headroom_compress`、`headroom_retrieve` 和 `headroom_stats` 为任何 MCP 客户端。
看点支持 6 个算法,实现本地优先和可逆性。与同类工具相比,其核心区别在于压缩 AI 代理读取的上下文,减少令牌数,同时保持相同的答案。
Python ★ 14.5k ⑂ 920
3
CopilotKit/CopilotKit +366 ★ 今日
The Frontend Stack for Agents & Generative UI. React + Angular. Makers of the AG-UI Protocol
是什么前端栈,用于代理和生成UI的工具集,支持React和Angular等框架
能干嘛支持多框架开发,包括React、Angular、Vue和React Native;提供高级UI生成和共享状态功能;支持人机交互工作流
看点支持多框架开发,包括React、Angular、Vue和React Native;提供高级UI生成和共享状态功能;支持人机交互工作流,目前已被Google、LangChain、AWS、Microsoft、Mastra、PydanticAI等采用;
TypeScript ★ 32.7k ⑂ 4.2k
4
lfnovo/open-notebook +1152 ★ 今日
An Open Source implementation of Notebook LM with more flexibility and features
是什么一个开源的笔记本型AI模型的实现,具有更大的灵活性和功能性
能干嘛支持18+个AI模型提供商,包括OpenAI、Anthropic、Ollama、LM Studio等;多模式内容组织,支持PDF、视频、音频、网页等;专业播客生成,支持多人播客生成
看点支持18+个AI模型提供商,使用Open Notebook可以选择不同AI模型提供商,包括OpenAI、Anthropic、Ollama、LM Studio等。支持18+个AI模型提供商,使用Open Notebook可以选择不同AI模型提供商,包括OpenAI、Anthropic、Ollama、LM Studio等。
TypeScript ★ 26.0k ⑂ 3.0k
5
affaan-m/ECC +1361 ★ 今日
The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond.
是什么一个用于优化性能的代理工具/框架/库,用于Claude Code、Codex、Opencode、Cursor等的开发。
能干嘛支持多语言,包括简体中文、繁體中文、葡萄牙语、日语、韩语、土耳其语、俄语、越南语、泰语、德语等。
看点支持12+语言生态系统,拥有170+个贡献者,28K+个分支,182K+个星标,用于生产环境下的代理、技能、钩子、规则、MCP配置和遗留命令 shim的演进,适用于Codex、Claude Code、Cursor、OpenCode、Gemini、Zed、GitHub Copilot等AI代理的开发。
JavaScript ★ 208.3k ⑂ 32.0k
6
Panniantong/Agent-Reach +148 ★ 今日
Give your AI agent eyes to see the entire internet. Read & search Twitter, Reddit, YouTube, GitHub, Bilibili, XiaoHongShu — one CLI, zero API fees.
是什么一个用于为 AI 代理提供互联网能力的 CLI 工具
能干嘛快速安装、更新、诊断、搜索 Twitter、Reddit、YouTube、GitHub 等平台
看点完全免费、开源、兼容所有 Agent、自带诊断、持续更新
Python ★ 21.5k ⑂ 1.9k
7
NVIDIA/cosmos +479 ★ 今日
NVIDIA Cosmos is an open platform of world models, datasets, and tools that enables developers to build Physical AI for robots, autonomous vehicles, smart infrastructure, and more.
是什么NVIDIA Cosmos 是一个开源的世界模型、数据集和工具平台,用于开发物理 AI 的开发者
能干嘛支持生成设置、输入和输出、用例(生成器和推理器)
看点支持多种语言,包括 Jupyter Notebook,性能提升百分比未知,支持多种用例,包括自主车辆和智能基础设施
Jupyter Notebook ★ 9.4k ⑂ 601
8
666ghj/MiroFish +320 ★ 今日
A Simple and Universal Swarm Intelligence Engine, Predicting Anything. 简洁通用的群体智能引擎,预测万物
是什么简洁通用的群体智能引擎,预测万物
能干嘛上传种子材料(数据分析报告或有趣的新故事)和自然语言描述预测需求,MiroFish会返回详细的预测报告和高保真数字世界;该引擎通过多智能体技术,构建高保真平行数字世界,智能代理自由交互,模拟未来的各种可能情况;MiroFish允许用户动态注入变量,精确推断未来轨迹
看点MiroFish支持多种语言,包括Python,64689个star,能够模拟各种复杂系统,实现高保真预测,能够在多个层面上模拟未来的各种可能情况,支持数据分析和自然语言描述,能够在零风险下测试政策和公共关系,允许用户动态注入变量,精确推断未来轨迹
Python ★ 64.7k ⑂ 10.1k
9
mvanhorn/last30days-skill +731 ★ 今日
AI agent skill that researches any topic across Reddit, X, YouTube, HN, Polymarket, and the web - then synthesizes a grounded summary
是什么一个 AI 代理技能,能够在 Reddit、X、YouTube、HN、Polymarket 和网络上搜索任何话题,然后合成一个基于事实的总结
能干嘛支持 50+ 种 Agent Skills 主机,使用 npx skills add 安装;支持 Reddit、HN、Polymarket 和 GitHub 的零配置安装;支持 X、YouTube、TikTok 等其他平台的快速设置
看点/last30days 搜索的结果是基于 Reddit 的 upvotes、X 的 likes、YouTube 的 transcripts 和 Polymarket 的 odds 等来评分的,能够提供ินท现实中人们实际参与的搜索结果。与 Google 类似,但 Google 是通过编辑来聚合搜索结果,而 /last30days 则是通过 AI 代理来聚合搜索结果。
Python ★ 28.2k ⑂ 2.4k
10
PaddlePaddle/PaddleOCR +747 ★ 今日
Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
是什么PaddlePaddle/PaddleOCR 是一个强大的、轻量级的 OCR 工具包,用于将图像或 PDF 文档转换为结构化数据,支持 100+ 种语言。
能干嘛SOTA 文档 VLM、结构感知转换、生产就绪效率
看点PaddlePaddle/PaddleOCR 支持 100+ 种语言,SOTA 文档 VLM PaddleOCR-VL-1.6 (0.9B) 在 OmniDocBench v1.6 上实现 96.3% 的准确率,领先于文本、公式和表格识别,具有显著增强的能力在古代文档、罕见字符、印章和图表的识别,输出结构化数据在 Markdown 和 JSON 格式。
Python ★ 80.5k ⑂ 10.6k