2026-06-01 周一

当天 GitHub 热榜 Top 10

1
harry0703/MoneyPrinterTurbo +1937 ★ 今日
利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.
是什么一款基于AI大模型的生成短视频工具,支持一键生成高清短视频,提供Web界面和API界面,支持多种高清视频尺寸、批量视频生成、视频片段时长设置等功能。
能干嘛支持视频文案AI自动生成、自定义文案、多种高清视频尺寸、批量视频生成、视频片段时长设置、中文和英文视频文案、多种语音合成、字幕生成、背景音乐、高清视频素材来源、多种模型接入、OpenAI、Moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama、DeepSeek、MiniMax、文心一言、Pollinations、ModelScope等。
看点支持多种模型接入,包括OpenAI、Moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama、DeepSeek、MiniMax、文心一言、Pollinations、ModelScope等,中国用户建议使用DeepSeek或Moonshot作为大模型提供商。支持批量视频生成,推荐配置为8核CPU、16GB内存、8GB显存及以上。
Python ★ 74.1k ⑂ 10.6k
2
microsoft/markitdown +2798 ★ 今日
Python tool for converting files and office documents to Markdown.
是什么Markdown 文档转换工具库
能干嘛支持 PDF、Word、Excel、图片、音频和 HTML 的转换,支持多种输入.mo
看点支持超过 10 种文件格式的转换,包括 PDF、Word、Excel、图片、音频和 HTML,性能提升百分比和具体数字未知,跟同类工具 textract 的不同之处在于,MarkItDown 保留了重要的文档结构和内容,包括标题、列表、表格、链接等
Python ★ 134.9k ⑂ 9.2k
3
D4Vinci/Scrapling +606 ★ 今日
🕷️ An adaptive Web Scraping framework that handles everything from a single request to a full-scale crawl!
是什么适应性网页抓取框架
能干嘛选择方法、抓取器、蜘蛛、代理轮换、命令行界面、多进程爬虫
看点支持多语言,包括简体中文,支持多种抓取器,包括 StealthyFetcher,可以在几行 Python 代码中实现高并发、多会话爬取,支持自动代理轮换,支持实时统计和流式输出,框架由网页抓取专家设计,适合所有用户
Python ★ 56.6k ⑂ 5.5k
4
nesquena/hermes-webui +357 ★ 今日
Hermes WebUI: The best way to use Hermes Agent from the web or from your phone!
是什么Hermes WebUI是一款轻量级的网页应用接口,用于在浏览器中访问Hermes Agent。
能干嘛在Hermes WebUI中,用户可以通过左侧的侧栏进行会话和导航,中心区域用于聊天,右侧区域用于工作区文件浏览。 composer底部的footer区域包含模型、配置文件和工作区控制。用户还可以通过Hermes Control Center(位于侧栏底部)访问所有设置和会话工具。
看点Hermes WebUI的亮点在于其与Hermes CLI的1:1对应性,用户可以通过单个命令启动Web UI,并通过SSH隧道安全地访问它。
Python ★ 9.9k ⑂ 1.4k
5
EveryInc/compound-engineering-plugin +251 ★ 今日
Official Compound Engineering plugin for Claude Code, Codex, Cursor, and more
是什么一款基于 Claude、Codex、Cursor 等 AI 技术的工程设计插件
能干嘛/ce-brainstorm 用于在编写代码前进行充分的计划和 brainstorm;/ce-plan 用于在编写代码前进行详细的计划;/ce-code-review 和 /ce-doc-review 用于在编写代码后进行代码和文档的review;/ce-compound 用于将知识编码化以便重用
看点该插件支持多种 AI 技术,包括 Claude、Codex、Cursor 等,通过 80% 的计划和Review,20% 的执行来实现工程设计的效率提升。使用该插件可以提高工程设计的质量和效率,减少技术债务和复杂性。
TypeScript ★ 18.7k ⑂ 1.4k
6
github/docs +27 ★ 今日
The open-source repo for docs.github.com
是什么GitHub 文档开源仓库,允许任何人贡献文档内容
能干嘛贡献指南可在 contributting guide 找到,通过 docs.github.com/en/contributing。
看点GitHub 文档有两个仓库,公开仓库 github/docs 接受外部贡献,私有仓库 github/docs-internal 仅限 GitHub 员工贡献,两者频繁同步。
TypeScript ★ 19.7k ⑂ 67.3k
7
OpenBMB/VoxCPM +635 ★ 今日
VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning
是什么VoxCPM2 是一个 Tokenizer-Free 的文本到语音系统,直接生成连续语音表示,通过端到端的扩散自回归架构,避免了离散 token 化,从而实现自然和表达性的合成。
能干嘛30-Language Multilingual — 无需语言标签即可输入任何支持的 30 种语言的文本并直接合成,Voice Design — 可以从自然语言描述中创建一个全新的声线(性别、年龄、语调、情绪、语速…),无需参考音频,Controllable Cloning — 可以从短的参考片段中克隆任何声线,选项性地向导情绪、语速和表达式的偏移,同时保留原始的音质,Ultimate Cloning — reproduce 每个音调细微处:提供参考音频和其转录,模型继续从参考音频中无缝衔接。
看点VoxCPM2 支持 30 种语言,训练数据超过 2 亿小时,输出udio 质量为 48kHz。相比同类工具,VoxCPM2 的核心区别在于其 Tokenizer-Free 的架构,直接生成连续语音表示,避免了离散 token 化,实现自然和表达性的合成。
Python ★ 23.5k ⑂ 2.7k
8
revfactory/harness +323 ★ 今日
A meta-skill that designs domain-specific agent teams, defines specialized agents, and generates the skills they use.
是什么一个用于设计域特定代理团队、定义专门的代理和生成他们使用的技能的元技能工具。
能干嘛Harness可以自动生成代理定义(.claude/agents/)和技能(.claude/skills/);它利用Claude Code的代理团队系统来分解复杂任务;它支持六种预定义的团队架构模式。
看点Harness在Claude Code生态系统的L3元工厂层工作,生成其他哈纳斯而不是成为一个。它可以处理六种预定义的团队架构模式,生成域特定代理团队和技能。
HTML ★ 4.6k ⑂ 647
9
FareedKhan-dev/train-llm-from-scratch +626 ★ 今日
A straightforward method for training your LLM, from downloading data to generating text.
是什么一款用于从零开始训练大型语言模型的工具集,基于PyTorch实现的Transformer模型,支持训练超亿参数的LLM。
能干嘛支持自定义数据集、单GPU训练、13亿参数的LLM示例、Transformer模型架构详解、多头注意力机制。
看点本工具集支持训练超亿参数的LLM,性能提升百分比未给出。支持的语言数量未给出。根据README的示例输出,训练的13亿参数LLM的生成文本具有较高的随机性和混乱性。
Jupyter Notebook ★ 2.9k ⑂ 440
10
supermemoryai/supermemory +264 ★ 今日
Memory engine and app that is extremely fast, scalable. The Memory API for the AI era.
是什么超级记忆是一个高性能、可扩展的内存引擎和应用,适用于人工智能领域的记忆和上下文引擎。
能干嘛自动学习从对话中提取事实、建立用户档案、处理知识更新和矛盾、忘记过期信息、提供正确的上下文。它支持全面的RAG、连接器、文件处理等上下文堆栈,所有的上下文堆栈都在一个系统中。
看点在LongMemEval、LoCoMo和ConvoMem上超级记忆是排名第一的,三大AI记忆评估标准。它可以自动学习从对话中提取事实、建立用户档案、处理知识更新和矛盾、忘记过期信息、提供正确的上下文。
TypeScript ★ 23.3k ⑂ 2.1k