Описание
Приложение Asset теперь доступно в автономном режиме! Наслаждайтесь неограниченными возможностями создания голоса из текста на вашем локальном оборудовании.
В онлайн-режиме - без регистрации, без API-ключей, без периодических платежей, без абонентской платы, без дополнительных затрат, просто одним щелчком мыши легко использовать нашу голосовую модель.
Также может быть использован для увеличения количества символов в Voice GOT + Deep Voice до 560 000 символов в месяц
особенности
✅ Сверхбыстрое клонирование голоса: Клонируйте любой голос, используя всего 3-6 секунд голосового клипа. Поддерживается как в локальных, так и в серверных моделях.
✅ Конвертер текста в голос: просто введите текст, который нужно озвучить, и нажмите "сгенерировать". Получите готовые к игре голоса с любым голосом по вашему выбору плюс еще 60 опций.
? Поддержка языка и акцента: Модель VoiceGPT_X поддерживает различные языки, такие как английский, китайский, немецкий, хинди, французский, корейский, португальский, Итальянский, Испанский, Голландский, венгерский, турецкий, польский, арабский, чешский и русский. В настоящее время автономная версия поддерживает только английский.
? Управление модуляцией голоса: Автономная версия может управлять эмоциональными значениями, параметрами распространения и близостью к данному голосу. Манипулируя этими параметрами, пользователи могут настраивать сгенерированную речь в соответствии со своими потребностями и предпочтениями.
〰preview Предварительный просмотр формы сигнала: воспроизведение звуковых клипов прямо в редакторе, не переходя в режим воспроизведения. Прокрутите головку воспроизведения, чтобы воспроизвести любую часть клипа. Для большей наглядности в редакторе отображаются временные метки и простая графика формы сигнала.
✂️ Обрезка аудио: удобный графический интерфейс редактора для обрезки концов аудиоклипа, если часть клипа не требуется или является пустой.
➕ Объединение клипов: Несколько аудиоклипов можно объединить в один с помощью интуитивно понятной функции редактора. Просто выберите клипы, легко измените их порядок и объедините в один.
⚙️ Выравнивание дорожек: Мастеринг аудиоклипов включает в себя выравнивание клипов, которое можно легко выполнить в самом редакторе. Просто выберите клип, отрегулируйте ползунки усиления, высоты тона и частотного диапазона. В редакторе предлагается 6-полосное выравнивание.
? Скрипт редактора: Скрипт редактора отображает все параметры на одной панели. В редакторе есть встроенный аудиоплеер для предварительного просмотра. Простой дизайн для обрезки, объединения, выравнивания или мастеринга звуковых дорожек.
редактор
Хранение всего этого в редакторе: Хранение всех ресурсов в одном рабочем пространстве внутри редактора и необходимость переключения на меньшее количество служб могут иметь ряд преимуществ, таких как:
- Повышение эффективности: когда все ресурсы расположены в одном рабочем пространстве, доступ к ним и управление ими становятся проще. Пользователям не нужно тратить время на переключение между различными службами или приложениями, что может занять много времени и привести к снижению производительности.
- Упрощенный рабочий процесс: Наличие всех ресурсов в одном рабочем пространстве может помочь создать более упорядоченный рабочий процесс. Это связано с тем, что пользователи могут легко переключаться между различными ресурсами, такими как файлы кода, изображения и документы, без необходимости перехода между различными службами. Это может помочь ускорить процесс разработки и сделать его более эффективным.
- Снижение сложности: использование меньшего количества сервисов может помочь снизить сложность процесса разработки.
В комплекте вы найдете демонстрационную сцену и окно редактора, которые помогут вам получить доступ к моделям TTS. Есть и другие полезные настройки звука, такие как обрезка, объединение и мастеринг звуковой дорожки, к которым можно получить доступ через окно редактора VoiceGPT.
зависимости
Для этого инструмента требуется редактор сопрограмм и сценариев Python версии 7.0.1+ из менеджера пакетов и активное подключение к Интернету.
ограничения
Поскольку этот инструмент все еще находится в стадии разработки, есть несколько ограничений:
- Обрабатывать до 500 символов за один раз. Этот лимит будет увеличиваться по мере нашего расширения.
- На выбор доступно более 60 голосов. С помощью функции клонирования голоса вы можете добавлять любое количество голосов, какое захотите.
- Время генерации звука составляет ~ 5 секунд для каждого клипа. Это время может увеличиться с увеличением количества токенов и базы пользователей.
Автономная версия:
- Генерация занимает ~10-20 секунд в зависимости от продолжительности аудиоклипа и предоставленных параметров.
- Автономная версия доступна только для английского языка.
- За один раз можно обработать до 750 символов.
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.