2026-06-01 当天热榜 | YaraAI GitHub 热榜

1

harry0703/MoneyPrinterTurbo +1937 ★ 今日

利用AI大模型，一键生成高清短视频 Generate short videos with one click using AI LLM.

是什么一款基于AI大模型的生成短视频工具，支持一键生成高清短视频，提供Web界面和API界面，支持多种高清视频尺寸、批量视频生成、视频片段时长设置等功能。

能干嘛支持视频文案AI自动生成、自定义文案、多种高清视频尺寸、批量视频生成、视频片段时长设置、中文和英文视频文案、多种语音合成、字幕生成、背景音乐、高清视频素材来源、多种模型接入、OpenAI、Moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama、DeepSeek、MiniMax、文心一言、Pollinations、ModelScope等。

看点支持多种模型接入，包括OpenAI、Moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama、DeepSeek、MiniMax、文心一言、Pollinations、ModelScope等，中国用户建议使用DeepSeek或Moonshot作为大模型提供商。支持批量视频生成，推荐配置为8核CPU、16GB内存、8GB显存及以上。

Python ★ 74.1k ⑂ 10.6k

2

microsoft/markitdown +2798 ★ 今日

Python tool for converting files and office documents to Markdown.

是什么Markdown 文档转换工具库

能干嘛支持 PDF、Word、Excel、图片、音频和 HTML 的转换，支持多种输入.mo

看点支持超过 10 种文件格式的转换，包括 PDF、Word、Excel、图片、音频和 HTML，性能提升百分比和具体数字未知，跟同类工具 textract 的不同之处在于，MarkItDown 保留了重要的文档结构和内容，包括标题、列表、表格、链接等

Python ★ 134.9k ⑂ 9.2k

3

D4Vinci/Scrapling +606 ★ 今日

🕷️ An adaptive Web Scraping framework that handles everything from a single request to a full-scale crawl!

是什么适应性网页抓取框架

能干嘛选择方法、抓取器、蜘蛛、代理轮换、命令行界面、多进程爬虫

看点支持多语言，包括简体中文，支持多种抓取器，包括 StealthyFetcher，可以在几行 Python 代码中实现高并发、多会话爬取，支持自动代理轮换，支持实时统计和流式输出，框架由网页抓取专家设计，适合所有用户

Python ★ 56.6k ⑂ 5.5k

4

nesquena/hermes-webui +357 ★ 今日

Hermes WebUI: The best way to use Hermes Agent from the web or from your phone!

是什么Hermes WebUI是一款轻量级的网页应用接口，用于在浏览器中访问Hermes Agent。

能干嘛在Hermes WebUI中，用户可以通过左侧的侧栏进行会话和导航，中心区域用于聊天，右侧区域用于工作区文件浏览。 composer底部的footer区域包含模型、配置文件和工作区控制。用户还可以通过Hermes Control Center（位于侧栏底部）访问所有设置和会话工具。

看点Hermes WebUI的亮点在于其与Hermes CLI的1:1对应性，用户可以通过单个命令启动Web UI，并通过SSH隧道安全地访问它。

Python ★ 9.9k ⑂ 1.4k

5

EveryInc/compound-engineering-plugin +251 ★ 今日

Official Compound Engineering plugin for Claude Code, Codex, Cursor, and more

是什么一款基于 Claude、Codex、Cursor 等 AI 技术的工程设计插件

能干嘛/ce-brainstorm 用于在编写代码前进行充分的计划和 brainstorm;/ce-plan 用于在编写代码前进行详细的计划;/ce-code-review 和 /ce-doc-review 用于在编写代码后进行代码和文档的review;/ce-compound 用于将知识编码化以便重用

看点该插件支持多种 AI 技术，包括 Claude、Codex、Cursor 等，通过 80% 的计划和Review，20% 的执行来实现工程设计的效率提升。使用该插件可以提高工程设计的质量和效率，减少技术债务和复杂性。

TypeScript ★ 18.7k ⑂ 1.4k

6

github/docs +27 ★ 今日

The open-source repo for docs.github.com

是什么GitHub 文档开源仓库，允许任何人贡献文档内容

能干嘛贡献指南可在 contributting guide 找到，通过 docs.github.com/en/contributing。

看点GitHub 文档有两个仓库，公开仓库 github/docs 接受外部贡献，私有仓库 github/docs-internal 仅限 GitHub 员工贡献，两者频繁同步。

TypeScript ★ 19.7k ⑂ 67.3k

7

OpenBMB/VoxCPM +635 ★ 今日

VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning

是什么VoxCPM2 是一个 Tokenizer-Free 的文本到语音系统，直接生成连续语音表示，通过端到端的扩散自回归架构，避免了离散 token 化，从而实现自然和表达性的合成。

能干嘛30-Language Multilingual — 无需语言标签即可输入任何支持的 30 种语言的文本并直接合成，Voice Design — 可以从自然语言描述中创建一个全新的声线（性别、年龄、语调、情绪、语速…），无需参考音频，Controllable Cloning — 可以从短的参考片段中克隆任何声线，选项性地向导情绪、语速和表达式的偏移，同时保留原始的音质，Ultimate Cloning — reproduce 每个音调细微处：提供参考音频和其转录，模型继续从参考音频中无缝衔接。

看点VoxCPM2 支持 30 种语言，训练数据超过 2 亿小时，输出udio 质量为 48kHz。相比同类工具，VoxCPM2 的核心区别在于其 Tokenizer-Free 的架构，直接生成连续语音表示，避免了离散 token 化，实现自然和表达性的合成。

Python ★ 23.5k ⑂ 2.7k

8

revfactory/harness +323 ★ 今日

A meta-skill that designs domain-specific agent teams, defines specialized agents, and generates the skills they use.

是什么一个用于设计域特定代理团队、定义专门的代理和生成他们使用的技能的元技能工具。

能干嘛Harness可以自动生成代理定义（.claude/agents/）和技能（.claude/skills/）；它利用Claude Code的代理团队系统来分解复杂任务；它支持六种预定义的团队架构模式。

看点Harness在Claude Code生态系统的L3元工厂层工作，生成其他哈纳斯而不是成为一个。它可以处理六种预定义的团队架构模式，生成域特定代理团队和技能。

HTML ★ 4.6k ⑂ 647

9

FareedKhan-dev/train-llm-from-scratch +626 ★ 今日

A straightforward method for training your LLM, from downloading data to generating text.

是什么一款用于从零开始训练大型语言模型的工具集，基于PyTorch实现的Transformer模型，支持训练超亿参数的LLM。

能干嘛支持自定义数据集、单GPU训练、13亿参数的LLM示例、Transformer模型架构详解、多头注意力机制。

看点本工具集支持训练超亿参数的LLM，性能提升百分比未给出。支持的语言数量未给出。根据README的示例输出，训练的13亿参数LLM的生成文本具有较高的随机性和混乱性。

Jupyter Notebook ★ 2.9k ⑂ 440

10

supermemoryai/supermemory +264 ★ 今日

Memory engine and app that is extremely fast, scalable. The Memory API for the AI era.

是什么超级记忆是一个高性能、可扩展的内存引擎和应用，适用于人工智能领域的记忆和上下文引擎。

能干嘛自动学习从对话中提取事实、建立用户档案、处理知识更新和矛盾、忘记过期信息、提供正确的上下文。它支持全面的RAG、连接器、文件处理等上下文堆栈，所有的上下文堆栈都在一个系统中。

看点在LongMemEval、LoCoMo和ConvoMem上超级记忆是排名第一的，三大AI记忆评估标准。它可以自动学习从对话中提取事实、建立用户档案、处理知识更新和矛盾、忘记过期信息、提供正确的上下文。

TypeScript ★ 23.3k ⑂ 2.1k