Minimax Audio是什么

Minimax Audio是一个AI音频生成与处理工具,它能将输入的文字转换成自然、富有情感的语音,也能根据文本创作音乐。它为需要进行新闻播报、说书、影视配音等音频内容创作的用户提供服务,同时配备了自定义音色设计和人声提取等AI工具。

MiniMax 语音

Minimax Audio的主要功能

语音合成

将文字转换为语音,支持中文在内的40种语言,在长文模式下可生成高达20万字符的音频内容。

  • 多模型选择
    • speech-2.6-hd: 文本理解能力更强,表现更自然。
    • speech-2.6-turbo: 超低延时,更高自然度。
    • speech-2.5-hd: 超高相似度,超高音质。
    • speech-2.5-turbo: 极致性价比,支持40个语种。
    • Speech-02系列模型: 语调自然有表现力,适合对声音要求较高的场景,比如录制播客、有声书等内容。
  • 丰富的音色库
    • 公共音色: 官方提供的系统音色,可通过筛选语言、口音、性别、年龄等来选择。
    • 个人音色: 用户通过音色设计功能生成的音色。
    • 收藏音色: 在试听过程中收藏的音色。
  • 精细化调节
    • 效果调节: 提供多维度音色参数,可对语速、声调、音量进行调整。
    • 文本控制: 支持在文本中插入#<X#>来控制句子间的停顿(单位是秒),并支持自定义语义重读,让模型根据文本内容自动代入合适的感情。

音乐创作

根据文本提示词生成一段人声音乐。

  • 模型: Music-2.0,增强了音乐性与乐器丰富度,支持生成最长5分钟的作品。
  • 创作模式:
    • 简单模式: 根据提示词生成不同风格多样的音乐,具有一定随机性,适合基础创作场景。
    • 高级模式: 支持自定义歌曲名称与歌词结构,满足深度创作需求。

音色设计

使用文字描述来设计和生成全新的自定义音色。

  • 生成方式: 通过“职业+人物特征+声音特征+语速”等提示词组合,结合试听文本,生成可供使用的音色卡槽。
  • 应用: 生成的音色可用于语音合成功能中。

人声提取

上传音频文件,自动去除背景噪音,提取清晰、纯净的人声。

  • 文件限制: 文件大小不超过500MB,时长不超过300秒。
  • 功能说明: 该功能仅用于音频降噪处理,不支持将提取的人声保存为可用音色。

Minimax Audio的应用场景

  • 新闻播报
  • 说书
  • 影视配音
  • 录制播客与有声书

会员订阅方案

Minimax Audio采用“声贝”作为消耗积分。

  • 免费
    • 首次登录赠送10,000声贝,之后每30天自动发放10,000声贝。
    • 未用完的声贝不可累计至下个月。
    • 可体验音色效果调节与情绪调节功能,但有使用次数限制。
  • 会员订阅(基础/进阶/高级/专业)
    • 每月按订阅等级发放对应数量的声贝,未用完的声贝不可累计至下个月。
    • 会员有效期内,不限次数体验音色效果调节与情绪调节功能。
    • 享受更多的专属音色卡槽,存储更多设计音色。
  • 声贝充值
    • 单独购买的声贝有效期为2年。
    • 其余权益与免费版一致。

网址:https://www.minimaxi.com/

 

MiniMax 语音

评一下

已发表评论
登录后可发布评论哦~

    暂无数据