主要导航
首页
科技方案
AI智能工具
我的
登录
注册
开源
开源指开放源代码,允许用户自由使用、修改和分发软件代码,促进协作创新与透明化开发,常见于软件项目,如Linux、Apache等,依托社区共同维护与发展。
GPT-SoVITS
强大的少样本语音转换与语音合成Web用户界面。 功能: 零样本文本到语音(TTS):...
OpenVoice
OpenVoice 是 myshell ai 开源的一款基于人工智能技术的语音克隆工具。 其核心...
IOPaint
IOPaint 是一款免费、开源且完全可自行托管的修复/修复工具,由最先进的 AI 模型...
CapsWriter-Offline 语音输入 字幕转录工具
这是 CapsWriter-Offline ,一个 PC 端的语音输入、字幕转录工具。 两...
MaterialSearch AI本地文搜图、图搜图
MaterialSearch是一个支持中文的本地素材搜索工具,可以扫描本地图片和视频,并支持...
Buzz:离线开源免费语音转文字(字幕)
基于Whisper的GUI软件:Buzz:离线语音转文字(字幕) Whisper 是什么? Whisp...
WhisperDesktop 本地音频转文字软件
可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux (目...
FunClip自动化视频剪辑工具
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室...
ModelScope-Agent
Modelscope-Agent 是一个可自定义且可扩展的代理框架。单个代理具有角色扮演、LLM...
MiniCPM3-4B
IT之家 9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源...
EchoMimicV2
EchoMimicV2利用参考图像、音频剪辑和一系列手势来生成高质量的动画视频,确保音频...
Janus Pro 统一多模态理解与生成模型
Janus-Pro是什么 Janus 是由 DeepSeek 团队开发的一系列统一多模态理解与生成模型...
Gemini-cli
Gemini CLI是什么 Gemini CLI是一款命令行AI工作流工具。它连接到用户的工具...
混元图像3.0 多模态图像生成模型
混元图像3.0(HunyuanImage-3.0 )是一个突破性的原生多模态模型,它在自回归框架内...
Nano Banana图片生成提示词库
这是一个精选的有趣且富有创意的示例合集,使用 Nano Banana🍌 和基于 Gemini-2.5...
JoyAgent
JoyAgent是什么JoyAgent是京东云推出的一款开源的企业级AI智能体平台,定位为“...
雾象
雾象是什么雾象(Fogsight)是由WaytoAGI团队推出的一款AI动画生成引擎,能够根...
Jaaz
Jaaz是什么Jaaz是一款开源的AI设计智能体工具,可以为用户提供强大的创意设计能力...
MCP官网
MCP是什么MCP 全称 Model Context Protocol(模型上下文协议),MCP 是由...
Phidata
Phidata是什么Phidata是一个功能全面的开源框架,可以帮助开发者构建具有记忆、知识...
首页
上一页
下一页
尾页
10/11
首页
分类
工具
文章
我的