2026-06-03 周三

当天 GitHub 热榜 Top 10

1
chopratejas/headroom +1265 ★ 今日
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
是什么一个用于压缩 AI 代理读取的上下文压缩层
能干嘛60–95% 减少令牌数、库、代理、MCP 服务、6 个算法、首先本地化、可逆
看点通过压缩 AI 代理读取的上下文,令牌数减少 60–95%,但答案保持不变。使用它可以通过 6 个算法实现更高效的上下文压缩,包括可逆的压缩和首先本地化的存储。
Python ★ 6.3k ⑂ 445
2
microsoft/markitdown +3618 ★ 今日
Python tool for converting files and office documents to Markdown.
是什么Markdown 文档转换工具
能干嘛支持 PDF、Word、Excel 文件转换、图片和音频元数据提取、HTML 和文本格式转换、ZIP 文件迭代和 YouTube URL 转换、EPub 支持等
看点支持 10 多种文件格式的转换,包括 PDF、Word、Excel、图片和音频元数据提取、HTML 和文本格式转换、ZIP 文件迭代和 YouTube URL 转换、EPub 支持等。与同类工具相比,MarkItDown 更注重保留文档结构和内容,输出 Markdown 格式,适合与 LLMs 和相关文本分析管道使用。
Python ★ 141.1k ⑂ 9.6k
3
affaan-m/ECC +1533 ★ 今日
The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond.
是什么一个用于性能优化的代理工具/框架/库
能干嘛支持多种语言,包括JavaScript、Português (Brasil)、简体中文、繁體中文、日本語、韩国语、Türkçe、Русский、Tiếng Việt、ไทย、Deutsch等。
看点支持12+语言生态系统,拥有182K+星、28K+分支、170+贡献者,适用于Codex、Claude Code、Cursor、OpenCode、Gemini、Zed、GitHub Copilot等AI代理工具,性能优化系统,实时学习,安全扫描,研究开发等功能,10+月的日常使用经验,生产就绪的代理,技能,钩子,规则,MCP配置,遗留命令 shim等
JavaScript ★ 203.9k ⑂ 31.3k
4
D4Vinci/Scrapling +1182 ★ 今日
🕷️ An adaptive Web Scraping framework that handles everything from a single request to a full-scale crawl!
是什么适应性网络爬虫框架,处理从单个请求到大规模爬取的所有内容
能干嘛选择方法·抓取器·蜘蛛·代理轮换·CLI·MCP
看点Scrapling 支持多语言,包括简体中文、日语、俄语和韩语等。它的 parser 可以学习网站变化并自动重新定位元素,当页面更新时。它的 fetchers 可以绕过像 Cloudflare Turnstile 这样的反爬系统。它的蜘蛛框架允许您以并发、多会话的方式爬取,并且支持暂停/恢复和自动代理轮换。
Python ★ 59.1k ⑂ 5.7k
5
nesquena/hermes-webui +1722 ★ 今日
Hermes WebUI: The best way to use Hermes Agent from the web or from your phone!
是什么Hermes WebUI是一个轻量级的Web应用界面,用于在浏览器中访问Hermes Agent。它提供了与终端相同的体验,包括会话管理、聊天、文件浏览等功能。
能干嘛会话管理、聊天、文件浏览等功能,左侧栏为会话和导航,中间为聊天,右侧为文件浏览,底部有composer footer和Hermes Control Center。
看点Hermes WebUI完全实现了Hermes CLI的功能,提供了1:1的体验。它支持SSH隧道,允许用户安全地通过浏览器访问Hermes Agent。
Python ★ 12.5k ⑂ 1.5k
6
reconurge/flowsint +124 ★ 今日
A modern platform for visual, flexible, and extensible graph-based investigations. For cybersecurity analysts and investigators.
是什么图形化的开源OSINT图谱探索工具
能干嘛·支持域名 enrichers,包括反向DNS解析、DNS解析和子域名枚举。·支持IP enrichers,包括IP地址解析和地理位置信息。·支持社交媒体 enrichers,包括Twitter账户信息和社交媒体链接。
看点Flowsint支持多种语言,包括英语、西班牙语和法语。它还提供了一个可视化的图谱界面,用户可以通过此界面探索关系和自动化 enrichers。Flowsint的性能提升了50%相对于同类工具,能够处理更大的数据集。
TypeScript ★ 4.5k ⑂ 580
7
OpenBMB/VoxCPM +783 ★ 今日
VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning
是什么VoxCPM2 是一个 Tokenizer-Free 的文本到语音系统,直接生成连续语音表示,通过端到端的扩散自回归架构,绕过离散 token 化,实现自然和表达性的合成。
能干嘛30-Language Multilingual — 输入任何 30 支持语言的文本并直接合成,无需语言标签,Voice Design — 根据自然语言描述创建一个全新的声音(性别、年龄、语调、情绪、语速…),无需参考音频,Controllable Cloning — 从短参考片段克隆任何声音,选项式样式指导以控制情绪、语速和表达,同时保留原始调子,
看点VoxCPM2 支持 30 种语言,训练于超过 2 亿小时的多语言语音数据,输出 48kHz 的录音室质量音频。
Python ★ 25.1k ⑂ 2.9k
8
stefan-jansen/machine-learning-for-trading +574 ★ 今日
Code for Machine Learning for Algorithmic Trading, 2nd edition.
是什么机器学习算法交易工具包
能干嘛该工具包包含超过150个Jupyter Notebook,涵盖机器学习在算法交易中的应用,包括数据采集、特征工程、长短策略设计、金融文本数据提取等。
看点该工具包涵盖了从线性回归到深度强化学习的广泛机器学习技术,覆盖了超过800页的内容,包括数据采集、金融特征工程、长短策略设计、金融文本数据提取等关键方面。
Jupyter Notebook ★ 18.4k ⑂ 5.2k
9
jamwithai/production-agentic-rag-course +30 ★ 今日
暂无描述
是什么这是一门基于Python的AI研发课程,重点是RAG系统的构建和实践
能干嘛自动化数据管道;生产BM25关键词搜索;构建完整的研究助手系统
看点本课程以生产级RAG系统的构建为主,采用行业最佳实践。与跳过向量搜索的教程不同,本课程先学关键词搜索基础,然后增强为混合检索。
Python ★ 6.4k ⑂ 1.5k
10
supermemoryai/supermemory +680 ★ 今日
Memory engine and app that is extremely fast, scalable. The Memory API for the AI era.
是什么高性能的 AI 内存引擎和应用程序,提供极快的、可扩展的内存 API
能干嘛自动从对话中提取事实、处理时间变化、矛盾和自动遗忘、维护用户上下文、提供合适的上下文、支持 RAG、连接器、文件处理等功能
看点在 LongMemEval、LoCoMo 和 ConvoMem 等主要 AI 内存基准测试中排名第一,支持多种语言,提供全面的上下文堆栈,包括内存、用户-profiles、混合搜索、连接器、多模式提取器等功能,内存提取事实的速度约为 50ms
TypeScript ★ 24.6k ⑂ 2.2k