Как встроить русский chatgpt в алису. работает на айфоне, в яндекс.станции и даже на телевизоре

Уведомления и предупреждения

Уведомления это альтернативный способ вызвать TTS. Уведомления настраиваются в . Минимально, вы должны указать имя нового уведомления и перечень колонок, где оно должно звучать. Для каждого уведомления будет создан отдельный сервис. Далее необходимо вызывать этот сервис с параметром .

Опционально уведомления поддерживают параметр . Для его поддержки вы можете использовать шаблон из примера ниже.

При настройке уведомлений параметры и необязательные.

Уведомления можно использовать в предупреждениях. Например, если вы забыли закрыть выходную дверь — предупреждение будет отправлять вам уведомление с заданным интервалом, до тех пор, пока проблема не будет решена.

notify:
  - name: alice_alert  # любое название
    platform: yandex_station
    data:
      entity_id: media_player.yandex_station_mini  # замените на вашу колонку
      media_content_id: >-
        {% if title is defined %}<speaker effect="megaphone">` title `<speaker effect="-"> sil <>{% endif %}` message `
      media_content_type: dialog

input_boolean: # просто для примера
  garage_door:
    name: Дверь гаража

alert:
  garage_door:
    name: Гараж открыт
    done_message: Гараж закрыт
    entity_id: input_boolean.garage_door
    state: "on"  # опционально, потому что "on" это значение по умолчанию
    repeat: 5  # как часто повторять, в минутах
    can_acknowledge: true  # разрешить выключить уведомления вручную
    skip_first: true  # пропустить первое (мгновенное) уведомление
    notifiers:
      - alice_alert  # название, которые указали выше

«Алиса читает текст» — опция и ее особенности

В Интернете существует множество так называемых «говорилок» – программ или сервисов за прочтения вслух печатного текста синтезированным голосом. Особенной популярностью пользуется функция, встроенная в Google Переводчик. Но у нее слишком механический голос, практически без интонаций. А значит, ни о каком выразительном чтении речи быть не может. А вот разработчики из компании Yandex сделали особый акцент на озвучке текста в голосовом ассистенте Алиса. Для ее используется специальная технология синтеза речи.

Разумеется, синтетическая речь будет не похожа на привычную людям, но никакого дискомфорта при прослушивании возникать не должно.

В каких сценариях данная функция окажется полезной? На самом деле все достаточно просто. Долгое нахождение перед экраном компьютера, ноутбука или мобильного устройства нагружает глаза. Некоторым людям просто некомфортно читать большие объемы текста в таком формате, ведь печатный текст куда проще воспринимать. Но ведь можно его озвучить с помощью Алисы. Данная возможность уже предусмотрена в Яндекс.Браузере. Разберемся с ее использованием на ПК и мобильных девайсах.

Как включить Алису для чтения в ЯБ на ПК

Когда вы откроете интернет-страницу с большим объемом связного текста, браузер сам предложит его озвучить. Внутри адресной строки появится кнопка для запуска. Затем она будет заменена на иконку в виде наушников.

Также вы можете запустить функцию голосовой командой: «Алиса, прочитай эту статью». Сам голосовой помощник должен откликнуться на фразу «Алиса». Еще его можно вызвать из бокового меню, которое появится при наведении курсора мыши на левый край окна.

Ту же самую команду можно не произносить голосом, а напечатать и отправить сообщение «Прочитай эту статью». Для остановки достаточно нажать на иконку в виде наушников или вновь позвать Алису.

Также можно озвучить только определенный фрагмент текста. Для этого выделите его и произнесите фразу «Алиса, прочитай». Альтернативный вариант – кликнуть правой клавишей мыши по выделенному фрагменту и в контекстном меню выбрать опцию «Озвучить».

По заверения разработчиков, ведется постоянная работа над этой функцией. А значит, с течением времени качество озвучивания текста будет только расти.

Может быть такое, что у вас не работает голосовой вызов Алисы. В таком случае проверьте активность данной функции:

Вызовите главное меню и перейдите на страницу настроек.
Кликните по надписи «Инструменты» в левом списке.
Доберитесь до пункта «Голосовой помощник Алиса».
Удостоверьтесь, что он включен, а в качестве фразы выбрана «Алиса».

Заодно проверьте, что выбран правильный микрофон:

Перейдите к разделу «Сайты» в левом списке.
Кликните по пункту «Расширенные настройки сайтов».
Пролистайте список вниз, пока не обнаружите раздел «Доступ к микрофону».
Проверьте, что выбрано правильное устройство.
Переключите режим на «Запрашивать разрешение», если выбрано «Запрещен».

Теперь закройте настройки и четко произнесите в микрофон фразу «Алиса». Голосовой помощник должен активироваться.

Как включить воспроизведение текста вслух на смартфоне и планшете

Теперь перейдем к использованию функции озвучивания текста в Яндекс.Браузере для мобильных устройств. Она тоже выполняется через Алису. На самой странице произнесите фразу: «Алиса, прочитай эту статью». Или тапните по отмеченной иконке и скажите или напечатайте текстом «Прочитай эту статью».

А вот в главном меню приложения соответствующей кнопки, к сожалению, нет.

Прочитать вслух можно определенный фрагмент текста. Для этого выделите его привычным образом и в контекстном меню выберите «Алиса, прочитай».Или произнесите эту фразу вслух, чтобы ее подхватил голосовой ассистент.

Projects that are alternatives of or similar to Yandexstation

Vacuum CardVacuum cleaner card for Home Assistant Lovelace UI
Stars: ✭ 295 (-32.8%)

Mutual labels: home-assistant

Bruh3 Home Assistant Configuration(OBSOLETE) BRUH3 Home Assistant Configuration
Stars: ✭ 347 (-20.96%)

Mutual labels: home-assistant

Homeassistant Home Assistant Configuration Files and Documentation
Stars: ✭ 395 (-10.02%)

Mutual labels: home-assistant

EsphomeESPHome is a system to control your ESP8266/ESP32 by simple yet powerful configuration files and control them remotely through Home Automation systems.
Stars: ✭ 4,324 (+884.97%)

Mutual labels: home-assistant

Home Assistantconfig Home Assistant configuration & Documentation for my Smart House. Write-ups, videos, part lists, and links throughout. Be sure to it. Updated FREQUENTLY!
Stars: ✭ 3,687 (+739.86%)

Mutual labels: home-assistant

Simple ThermostatA different take on the thermostat card for Home Assistant ️
Stars: ✭ 357 (-18.68%)

Mutual labels: home-assistant

UnifiprotectControl and monitor your Unifi Protect Cameras from Home Assistant
Stars: ✭ 279 (-36.45%)

Mutual labels: home-assistant

Lovelace Xiaomi Vacuum Map CardThis card enables you to specify a target or start a zoned cleanup using live or static map, just like in Xiaomi Home app. Additionally you can define a list of zones and choose the ones to be cleaned.
Stars: ✭ 433 (-1.37%)

Mutual labels: home-assistant

Harmony Api A simple server allowing you to query/control multiple local Harmony Home Hubs over HTTP or MQTT
Stars: ✭ 345 (-21.41%)

Mutual labels: home-assistant

Magic Cards Queue music, play movies, or trigger events with RFID cards.
Stars: ✭ 372 (-15.26%)

Mutual labels: home-assistant

Home Assistant Custom Components Xiaomi Cloud Map ExtractorThis custom integration provides a way to present a live view of a map for a Xiaomi (and Roborock) vacuums.
Stars: ✭ 318 (-27.56%)

Mutual labels: home-assistant

HeatpumpArduino library to control Mitsubishi Heat Pumps via connector cn105
Stars: ✭ 327 (-25.51%)

Mutual labels: home-assistant

HaaskaHome Assistant Alexa Skill Adapter that supports v3 of the Alexa Smart Home Skill API
Stars: ✭ 369 (-15.95%)

Mutual labels: home-assistant

Xiaomi airconditioningcompanionXiaomi Mi and Aqara Air Conditioning Companion integration for Home Assistant
Stars: ✭ 304 (-30.75%)

Mutual labels: home-assistant

Miflora Mqtt DaemonLinux service to collect and transfer Xiaomi Mi Flora plant sensor data via MQTT to your smart home system, with cluster support
Stars: ✭ 409 (-6.83%)

Mutual labels: home-assistant

Lovelace Ios Dark Mode Theme Theme by @basnijholt based on iOS Dark Mode for Lovelace Home Assistant
Stars: ✭ 291 (-33.71%)

Mutual labels: home-assistant

Hue Sensors HassSupport for Hue motion sensors and device tracker
Stars: ✭ 353 (-19.59%)

Mutual labels: home-assistant

Smarthome@skalavala Nothing But Smarthome Stuff! — By Mahasri Kalavala
Stars: ✭ 437 (-0.46%)

Mutual labels: home-assistant

Dwains Lovelace DashboardAn auto generating Home Assistant Lovelace UI dashboard for desktop, tablet and mobile by Dwains for desktop, tablet, mobile
Stars: ✭ 432 (-1.59%)

Mutual labels: home-assistant

Zigbee2mqttassistantGUI for Zigbee2Mqtt running in docker and HASS.IO
Stars: ✭ 371 (-15.49%)

Mutual labels: home-assistant

Troubleshooting

Поиск и устранение проблем

Посмотрите лог Home Assistant на наличие ошибок интеграции Yandex.Station.
Если в логе есть ошибка, постарайтесь прочитать её. Среди непонятных букв может быть прямой ответ на проблему на русском или английском языке.
Поищите похожую ошибку на GitHub проекта (включая закрые issue) или в чатах Telegram: , , .
Если ошибки нет, можно включить отладочные логи интеграции и посмотреть, что проиходит там.
Если самостоятельно не справились — переходите по ссылкам в пункте 3 и подробно опишите проблему. Обязательно приложите ошибку из лога, если она есть. При наличии чего-то полезного в пункте 4, приложите и этот лог.

Описание и возможности

Yandex TTS (Text-to-Speech) – это текст в речь, сервис от компании Yandex, который позволяет преобразовывать письменный текст на различных языках в звучащую речь. Он использует синтез голоса для создания реалистичных и натуральных звуковых файлов, которые могут быть проиграны на устройствах или интегрированы в приложения.

Yandex TTS engine предоставляет разработчикам API, которое позволяет добавлять голосовое сопровождение в свои проекты или приложения. Благодаря использованию искусственного интеллекта и обработке естественного языка, голосовые файлы, созданные с помощью Yandex TTS, звучат естественно и понятно.

Возможности Yandex TTS engine:

Многоязычность: сервис поддерживает работу с текстом на различных языках, включая русский, английский, французский, немецкий и другие.
Выбор голоса: разработчики могут выбрать из разных голосовых моделей, предоставляемых Yandex TTS. Каждая модель имеет свои особенности и была разработана с учетом определенных языковых особенностей.
Гибкость настройки: API позволяет настраивать параметры голоса, такие как скорость речи, высота тона, интонация и паузы между предложениями. Это позволяет добиться желаемого звучания и эмоциональности голосового сообщения.
Высокая скорость обработки: TTS engine быстро преобразовывает текст в речь, что позволяет использовать его в реальном времени и обрабатывать большие объемы текста.
Минимальные требования к интеграции: сервис имеет простой и понятный API, который может быть легко интегрирован в различные проекты и приложения. Разработчики могут также использовать готовые библиотеки и инструменты для работы с Yandex TTS engine.

Сервис Yandex TTS engine открывает широкие возможности для создания голосового контента, достижения эффекта голосового пользователя или просто добавления дополнительной функциональности к различным проектам и приложениям.

Яндекс Алиса в Lovelace

Только для локального режима!

Работает аналогично добавлению Алисы в Телеграм. Вы фактически общаетесь в текстовом режиме с одной из ваших колонок. Отправка ссылок на медиа тоже работает!

conversation:
  intents:
    # менять нужно entity_id до двоеточия, после двоеточия ничего менять не надо!
    media_player.yandex_station_mini:   # замените на вашу станцию

Компонент поддерживает не только текстовый, но и голосовой ввод при следующих условиях:

Home Assistant открыт в браузере Google Chrome на Windows, macOS, Linux, Android или в мобильном приложении Android — потому что для распознования голоса используются API Google
Home Assistant открыт по HTTPS-ссылке или localhost-ссылке — потому что микрофон в браузере Google Chrome доступен только в этом случае

По умолчанию в Home Assistant включен голосовой ввод только на английском языке. Чтоб это исправить — добавьте в конфиг такую настройку. Если у вас голосовой ввод не работает или он вам не нужен — настройку добавлять не надо! Общаться текстом с Алисой вы можете и без неё. После изменения вероятно потребуется сбросить кэш браузера (включая cookies and other site data).

yandex_station:
  recognition_lang: ru-RU

Текстовый ввод работает в любом браузере на любой платформе, включая мобильные приложения.

Samsung text-to-speech engine

Samsung TTS, также известное как Samsung Text-to-Speech – системное приложение от популярного корейского брэнда. С помощью этого инструмента у вас появляется возможность использовать в любом из смартфонов Samsung систему преобразования текста в голос.

С первого взгляда, кажется, что это приложение не выполняет каких-либо особых функций, так как обычно оно находится в фоновом режиме. Тем не менее, если вы его установили, перед вами открывается возможность преобразовывать любой желаемый текст в голос, что невероятно удобно как для упрощения работы с устройством, так и как лёгкий способ озвучить любой текст разными голосами.

Самое лучшее в этом приложении, что вы можете выбирать из разных голосов. Также, на выбор доступна масса языков, так как акцент голоса изменяется в зависимости от того, на каком языке говорят. Вы даже можете выбрать, кому должен принадлежать голос, мужчине или женщине, при условии, что эта возможность доступна для указанного вами языка.

Это системное приложение для смартфонов Samsung – отличный способ для озвучивания текстов. Многочисленные параметры настройки делают это приложение незаменимым, когда нужно прослушать текст, находящийся на экране вашего смартфона.

Проверено Merche Contreras Переведено Uptodown Localization Team

Управление умным домом Яндекса

На данный момент поддерживаются:

Кондиционеры — добавленные как через ИК-пульт, так и напрямую (например LG с Wi-Fi)
Телевизоры — добавленные как через ИК-пульт, так и напрямую
Обученные вручную ИК-команды — обученные вручную команды ИК-пульта (Пульт => Добавить устройство => Настроить вручную)
Розетки — включая энергопотребление
Лампочки — включая настройку яркости и цвета
Обогреватели

В конфиге нужно перечислить имена ваших устройств:

yandex_station:
  username: myuser
  password: mypass
  include:
  - Кондиционер  # имя вашего кондиционера
  - Приставка  # имя не ИК-пульта, а устройства, настроенного вручную

Кондиционер будет добавлен как термостат:

script:
  volume_up:
    alias: Сделай громче
    sequence:
    - service: remote.send_command
      entity_id: remote.yandex_station_remote  # поменяйте на ваше устройство
      data:
        command: Сделай громче  # имя кнопки в интерфейсе
        num_repeats: 5  # (опционально) количество повторов
        delay_secs: 0.4  # (опционально) пауза между повторами в секундах
  turn_on:
    alias: Включи телевизор
    sequence:
    - service: remote.send_command
      entity_id: remote.yandex_station_remote  # поменяйте на ваше устройство
      data:
        command:   # можно несколько кнопок
        delay_secs: 0.4  # (опционально) пауза между повторами в секундах

Стриминг музыки

Только для локального режима!

Поддерживается стриминг (трансляция) музыки с колонки Яндекса на умные колонки других производителей. Условия такие:

Нужна Яндекс колонка с поддержкой локального управления. Яндекс Модули функцию НЕ поддерживают.
Нужна подписка Яндекса на музыку.
Сторонняя колонка должна иметь интеграцию в Home Assistant с поддержкой потокового воспроизведения музыки. Если она умеет функцию «воспроизвести текст» из окна медиа-плеера, то поддержка скорее всего есть.
Синхронизовать колонки разных производителей в идеальный мультирум нереально, поэтому звук на колонке Яндекса во время трансляции приглушается. Но при общении с Алисой звук временно возвращается.
Громкость колонки Яндекса также синхронизируется с внешней акустикой.

Протестирована поддержка интеграций:

Chromecast:
колонки с Google Assistant
медиаплееры/телевизоры/проекторы на Android TV

DLNA:
саундбар Samsung HW-MS6500
саундбар Yamaha YAS-306
телевизор Philips 2011 года
телевизоры Samsung Tizen 2016+ год

Kodi

MPD

MPD for Windows

Xiaomi Gateway EU

SamsungTV
телевизоры Samsung Tizen 2016+ год
важно указать в конфиге

Sonos

Yamaha MusicCast

Внимание. Для корректной работы некоторых интеграций, ваш сервер ХА должен быть доступен в локальной сети по протоколу HTTP и IP-адресу:. Стоит понимать, что при правильной настройке внешнего доступа через различные аддоны, вы можете пользоваться ХА по адресу вида

И при правильной настройке такая ссылка будет работать как во внешней, так и в локальной сети. А ссылка вида HTTP/IP будет использоваться только локальными медиа-плеерами

Стоит понимать, что при правильной настройке внешнего доступа через различные аддоны, вы можете пользоваться ХА по адресу вида . И при правильной настройке такая ссылка будет работать как во внешней, так и в локальной сети. А ссылка вида HTTP/IP будет использоваться только локальными медиа-плеерами.

Компонент автоматически найдёт все теоретически подходящие и добавит их в список у колонки. При желании вы можете вручную указать список колонок в :

Вы можете переключать трансляцию через:

Переключатель в карточке
Переключатель в стандартном окне медиа-плеера колонки
Сервис
, например на фразу «Алиса, включи трансляцию на Ямаху»
Интеграцию колонок в умный дом Яндекса, единственное ограничение — вместо нормальных названий источников там будет «один», «два», «три»…
Интеграцию колонок в HomeKit

Использование компонента

Начиная с версии Oktell 2.12, в служебных и IVR сценариях появился компонент «Синтез речи». Компонент озвучивает заданную фразу (синтезирует речь) с помощью сервиса Yandex SpeechKit. Позволяет сразу воспроизвести файл в линию, либо сгенерировать файл для последующего использования. В компоненте можно включить кэш, тем самым сохраняя все сгенерированные файлы в папку \Oktell\Server\LocalStorage\SynthesisCache. Так как каждый запрос к сервису Яндекс платный, то включенный кэш позволяет сэкономить ваши средства.

Техническая документация по компоненту:

Для использования системы синтеза речи Yandex SpeechKit выполните следующие действия:

Шаг 1. Получить авторизационные данные на использование сервиса Yandex SpeechKit.

Шаг 2. Перейдите в Администрирование / Общие настройки / Распознавание речи Yandex SpeechKit Cloud. Введите полученные значения OAuth-токен и Идентификатор каталога в соответствующие поля

Нажмите «Сохранить«. Теперь вы можете использовать синтез речи в сценариях.

Шаг 3. Рассмотрим пример использования синтеза речи в IVR сценарии.

Компонент «Синтез речи«. Озвучивает приветствие абоненту и сохраняет выбор абонента в переменную.

Режим — Воспроизвести. В этом режиме компонент сразу воспроизводит сгенерированный файл в текущую линию.
Текст — строка «Здравствуйте! Вас приветствует компания Телефонные Системы! Для соединения с менеджерами нажмите 1. Для соединения с сотрудниками технической поддержки нажмите 2.«. Введенный текст будет передан на сервера Yandex для озвучивания.
Голос — Zahar. Настройка отвечает за синтезируемый голос: Zahar — мужской голос, Jane -женский. Возможно указание другого значения, если оно поддерживается сервисом Yandex SpeechKit.
Эмоция — По умолчанию. Настройка отвечает за используемую окраску голоса. Возможные варианты: good, neutral, evil, mixed.
Кэш — Использовать. Если использовать кэш, то система попытается найти файл с озвученным текстом среди сгенерированных ранее (находятся в папке \Oktell\Server\LocalStorage\SynthesisCache). Рекомендуется всегда включать в целях экономии средств.
Таймаут ожидания ответа, с — 5. Максимальное время ожидания ответа от серверов Яндекс.
Символы прерывания — строка «1, 2«. Если абонент нажмет на указанные символы прерывания, компонент сохранит их в буфер и перейдет к следующему блоку.
Буфер для DTMF — переменная ввод (строковая). Переменная, в которую сохранится введенный символ прерывания.
Очистить буфер — Да. Указывает на то, что буфер предварительно будет очищен.

Компонент «Меню«. Маршрутизирует абонента на выбранную группу операторов.

Аргумент — переменная Ввод
Значения —

1 — на компонент «Переключение 1»

2, прочее — на компонент «Переключение 2»

Настройка дальнейшей маршрутизации не рассматривается.

Text 2 Speech. Появилась потребность использовать какой-нибудь синтезатор на русском. Есть варианты?

Появилась потребность использовать какой-нибудь синтезатор. Что-то наподобие yandex speechkit только бесплатный и для коммерческих целей. Есть идеи? Должно быть на русском. Может быть можем тренить модельку сами. Желательно питон

python
python-3.x
искусственный-интеллект
text-to-speech

Отслеживать
задан 26 мая 2023 в 21:50
Daniel Azamat Daniel Azamat
Есть rtx 3090 + 32 gb ram + 500 gb ssd m2
26 мая 2023 в 22:12

2 ответа 2

Сортировка: Сброс на вариант по умолчанию

Можно и самому модель сделать, но готовые варианты всегда быстрее и проще использовать: https://pythonprogramminglanguage.com/text-to-speech/ В этой статье можете найти основную полезную инфу по библиотеке Pyttsx, она должна подойти для описанных вами задач

PS.Tacotron 2 ,Mozilla TTS, ESPnet, DeepSpeech, WaveNet тоже должны подойти

Отслеживать
ответ дан 26 мая 2023 в 21:57
1,279 1 1 золотой знак 2 2 серебряных знака 17 17 бронзовых знаков
ModuleNotFoundError: No module named ‘engine’
26 мая 2023 в 22:07
Очень плохо распознает даже слово привет((
26 мая 2023 в 22:11

@DanielAzamat есть еще: Tacotron 2 ,Mozilla TTS, ESPnet, DeepSpeech, WaveNet Они все имеют свои особенности, так что вам надо будет выбрать наиболее подходящую

Список покупок

Только для локального режима!

Предварительно необходимо добавить стандартный компонент, через GUI или YAML.

Для синхронизации списков необходимо вызвать следующий сервис. При желании, вызов этого сервиса можно выполнять голосом с колонки, через .

script:
  update_shopping_list:
    alias: Обновить список покупок
    sequence:
      - service: media_player.play_media
        entity_id: media_player.yandex_station_mini  # замените на вашу колонку
        data:
          media_content_id: update
          media_content_type: shopping_list

После синхронизации вы можете удалять элементы голосом на колонке. Такие элементы будут удалены из ХА при следующей синхронизации, даже если на них не стоит галка.

Или вы можете отмечать элементы как завершенные в интерфейсе ХА. Такие элементы будут удалены из Яндекса при следующей синхронизации. Только не очищайте вручную список завершенных элементов в ХА до синхронизации! Иначе синхронизация нарушится.

Синхронизация происходит по следующим правилам:

Завершенные (отмеченные) элементы списка ХА — удаляются из Яндекса (если они там были)
Новые элементы, созданные именно из ХА — добавляются в Яндекс (если их там не было)
Список ХА полностью заменяется тем, что получилось в Яндексе после 1 и 2
Список завершенных элементов ХА очищается

Нужно учитывать, что некоторые названия Яндекс не может добавить в свой список. Поэтому они могут бесследно пропасть.

Java

Есть стандарт Java Speech API (JSAPI) и JSR 113: JavaTM Speech API 2.0 но с его реализацией похоже туго.
No reference implementation exists for JSAPI. Вот мне всегда было непонятно зачем тогда создавать стандарт.
Насколько я понял, синтезатор голоса был изначально во первой версии Java от Sun, но потом его вырезали в FreeTTS, и у IBM тоже была какая-то своя приблуда для этого IBM Speech.
Вот их FAQ можно найти ответы на другие вопросы и посмотреть древний список реализаций этого апи.

jsapi.sourceforge.net

Java Speech API
Wrapper for vendors to simplify usage of the Java Speech API (JSR 113). Note that the spec is an untested early access and that there may be changes in the API. Demo implementations support FreeTTS, Sphinx 4, Microsoft Speech API 5.4 and the Mac OSX speech synthesizer.
Т.е. это просто биндинг к другим сервисам.

FreeTTS

FreeTTS выглядит заброшенным но вполне рабочий. Я его уже использовал для озвучивания логов как Log4J Appender где он справлялся хорошо.
Изначально разрабатывался в лаборатории компании Sun. Поддерживает JSAPI 1.0 (а уже есть 2.0) но только по синтезу (), не по распознаванию.
Поддерживает три голоса английского, но вроде как можно импортировать MBROLA голоса но русского и украинского там нет.
Вообщем рекомендую для базового синтеза простых текстов.

FreeTTS is a speech synthesis system written entirely in the JavaTM programming language. It is based upon Flite: a small run-time speech synthesis engine developed at Carnegie Mellon University. Flite is derived from the Festival Speech Synthesis System from the University of Edinburgh and the FestVox project from Carnegie Mellon University.
Т.е. корнями FreeTTS уходит в плюсовые программы описанные тут ниже.

Как я уже говорил, проект заброшенный, но есть форк на Гитхабе который делается одним пацаном для софта для больных Афазией.

Вот пример кода с использованием: FreeTTS Hello World Java Maven.

MARY Text-to-Speech System (MaryTTS)

Более серьёзный синтезатор разработанный в немецком университете и имеющий коммерческое применение. Разработка поддерживается, последний комит был пять дней назад.
Поддерживаются американский и британский английский, мужской русский, немецкий, итальянский, шведский, турецкий, французский, телугу (язык юго-восточноо штата в Индии) и была попытка сделать тибетский и арабский (статья). Украинского нету.Список языков и голосов и если что можно сделать самому поддержку языка.

MARY is an open-source, multilingual Text-to-Speech Synthesis platform written in Java. It was originally developed as a collaborative project of DFKI’s Language Technology lab and the Institute of Phonetics at Saarland University and is now being maintained by DFKI. As of version 4.3, MARY TTS supports German, British and American English, Telugu, Turkish, and Russian; more languages are in preparation. MARY TTS comes with toolkits for quickly adding support for new languages and for building unit selection and HMM-based synthesis voices.

Я не пробовал в работе, но мне кажется что его вполне можно использовать в продакшене.

Облачные сервисы —

Послыешь запрос, получаешь

Yandex.SpeechKit

«распознавание и синтез речи, голосовую активацию и выделение смысловых объектов в произносимом тексте.»
Есть в виде облачного сервиса и HTTP API к нему и в виде Mobile SDK для iOS, Android и WindowsPhone которые шлют поток с микрофона на сервер для распознавания.
Платный для коммерческого использования, до 10000 запросов бесплатен, но нужно запросить API ключ и я его уже четвёртый день жду.
Можно попробовать установив приложение Яндекс.Диктовка и оно распознаёт практически идеально.

Работает на своём движке. Вот тут Яндекс рассказали как Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit
Поддерживает распознавание и синтез русского языка и только распознавание турецкого, разрабатывается поддержка английского, но есть возможность говорить с разными эмоциями (добрый, злой, нейтральный) что довольно прикольно как по мне. Ещё интересно что может учитывать гео координаты для более точного распознавания названий улиц.

Железки начали понимать. А мы их всё равно считаем глупымиПочему роботы разговаривают с нами только в кино

Очень интересная фишка: Выделение смысловых объектов из текста с помощью которого можно распознавать например даты (что самое интересное поддерживается украинский язык), имена и адреса, что очень полезно для голосового управления.

Центр речевых технологий

«Центр речевых технологий» российская компания делающая синтезаторы текста и другой софт например для голосовой аутентификации и распознавалки для спецслужб.
Семь голосов, один женский голос на казахском языке. Украинского нету.
Дают облачный API для синтеза VoiceFabric, вроде не дорого.

Ребята очень крутые и даже умудрились сгенерировать голос умершего человека:

Google Speech API

Голос неприятный и ограничение на длину текста примерно в сто букв, но зато есть все языки которые поддерживаются гугловым онлайн переводчиком, включая украинский, белорусский и казахский.
Говорят что внутри переводчик использует движок eSpeak о котором ниже.

J.A.R.V.I.S. — Java биндинг (врапер) к Google Speech API

Microsoft Bing translator (Microsoft Translator API)

Доступен всем через Azure и до двух миллионов символов в месяц бесплатен, если выше смотрите цены.
Русский и Украинский есть, всего 45 языков.
Выглядит солидно, но не пробовал в деле. Поскольку это Майкрософт то где-то подвох будет точно.

SpokenText

SpokenText lets you easily convert text in to speech. Record (English, French, Spanish or German) PDF, Word, plain text, PowerPoint files, and web pages, and convert them to speech automatically. Create .mp3 or .m4b (Audio Book) recordings (in English, French, Spanish and German) of any text content on your computer or mobile phone.

Медиа браузер

Фразы на колоки с Алисой можно отправлять, как из автоматизации, так и из интерфеса Home Assistant. Начиная с версии v2022.3 меню TTS перенесено в раздел Медиа, до этого оно находилось в окне Медиа плеера.

При желании вы можете настроить этот раздел через YAML:

произносить фразы в разных режимах
использовать спецэффекты и шаблоны
отправлять команды на колоку
задать перечень «быстрых команд»

Если в команде присутствует или в нет слова — окно ввода сообщения будет пропущено.

Вот несколько примеров:

yandex_station:
  media_source:
    - title: Произнеси текст  # обязательное поле
      media_content_type: text  # обязательное поле
      thumbnail: https://brands.home-assistant.io/_/tts/icon.png
    - title: Выполни команду
      media_content_type: command
      thumbnail: https://brands.home-assistant.io/_/automation/icon.png
    - title: Включи любимое
      media_content_id: Включи моё любимое вперемешку
      media_content_type: command
    - title: Произнеси шепотом 
      template: '<speaker is_whisper="true">` message `'
      media_content_type: dialog
      extra:
        volume_level: 0.2
    - title: Статус эквалайзера
      template: 'Эквалайзер установлен на {{ states("select.yandex_station_equalizer") }}'
      media_content_type: text

Яндекс Алиса в Telegram

Только для локального режима!

Вы можете общаться со своей Алисой через Telegram. И она вам будет отвечать в Telegram! Можете спросить погоду, вызвать такси, включить песню, поиграть в города или управлять вашим умным домом (если настроили интеграцию с умным домом Яндекса). Никаких слеш-команд Telegram, общайтесь с Алисой обычным текстом.

При этом Home Assistant не обязательно «прокидывать» в Интернет. Telegram в режиме может работать без внешнего доступа.

При этом тоже будет работать. Просто поделитесь со своим Telegram ботом ссылкой на фильм Кинопоиска, ролик YouTube или песню/альбом/плейлист на Яндекс Музыке — и они запустятся на вашей колонке!

telegram_bot:
- platform: polling
  api_key: TELEGRAM_BOT_API_KEY  # создайте своего Телеграм бота
  allowed_chat_ids:
  - TELEGRAM_USER1_ID  # укажите ID своего аккаунта
  - TELEGRAM_USER2_ID  # при желании, поддерживается несколько аккаунтов

automation:
- trigger:
    platform: event
    event_type: telegram_text
  action:
    service: media_player.play_media
    entity_id: media_player.yandex_station_mini  # замените на вашу станцию
    data:
      media_content_id: "` trigger`.`event`.`data`.`text `"
      media_content_type: "question:` trigger`.`event`.`data`.`chat_id `"
- trigger:
    platform: event
    event_type: yandex_station_response
  action:
    service: telegram_bot.send_message
    data:
      target: "` trigger`.`event`.`data`.`request_id `"
      message: "` trigger`.`event`.`data`.`text `"

Настройка

Через GUI (рекомендуется)

Настройки > Интеграции > Плюс > Yandex.Station.

Для авторизации используйте ваши Логин и пароль Яндекса или одноразовый пароль из приложения Яндекс.Ключ, при включенной двухфакторной авторизации.

В итоге компонент получит токен Яндекса и сохранит именно его, ваш пароль нигде не сохраняется.

Если Яндекс посчитает авторизацию подозрительной — он может потребовать ввести капчу или подтвердить ваш аккаунт в серсисе Яндекс Паспорт. Подтверждать аккаунт необходимо используя тот же Интернет/VPN, что и сервер Home Assistant.

В случае проблем с авторизацией по паролю, можно зайти в Яндекс в обычном браузере и скопировать оттуда Cookies. Компонент подскажет что нужно сделать на этапе настройки.

Так же можно перенести токен Яндекса с другого сервера Home Assistant, где уже была пройдена авторизация. Компонент подскажет что нужно сделать на этапе настройки.

Через YAML (устаревший способ)

yandex_station
  username myuser
  password mypass

Что такое YandexGPT

YandexGPT – большая языковая модель, которую Яндекс запустил в мае 2023 года. А в сентябре 2023 года представил новую версию собственной языковой модели – YandexGPT 2. Она является развитием предыдущей версии модели и обладает большей точностью, разнообразием и качеством генерируемых текстов.

Обновленная модель YandexGPT 2 основана на архитектуре Transformer, которая широко применяется в современных моделях генерации текста. Она обучена на огромном объеме разнообразных текстовых данных, что позволяет ей генерировать качественные и информативные тексты.

YandexGPT 2 обладает способностью понимать контекст и генерировать тексты, основываясь на входных данных. Она может отвечать на вопросы, предсказывать продолжение текста, создавать описания и многое другое. Модель может использоваться в различных сферах, таких как автоматическое создание новостей, помощь писателям, генерация контента для сайтов и других задач, где требуется генерация текста.

YandexGPT 2 умеет адаптировать ответ под разные аудитории и переписывать его в других стилях и жанрах. Например, нейросеть может объяснить ребёнку сложный термин простыми словами или пересказать указ директора в виде понятного письма для внутренней рассылки сотрудникам. YandexGPT 2 способна анализировать любые тексты длиной до тысячи символов, которые пользователь добавит в запрос, отвечать на вопросы к ним и структурировать информацию.

Как указано на официальном сайте:

Важно отметить, что модель YandexGPT 2, как и другие модели генерации текста, не является идеальной и может иногда генерировать некорректные или неподходящие тексты. Это связано с тем, что модель может научиться повторять стереотипы или генерировать тексты, которые могут считаться неправдоподобными или неэтичными

Команда Яндекс продолжает работать над улучшением модели YandexGPT 2, чтобы сделать ее еще более точной и полезной для пользователей.

Уведомления и предупреждения

«Алиса читает текст» — опция и ее особенности

Как включить Алису для чтения в ЯБ на ПК

Как включить воспроизведение текста вслух на смартфоне и планшете

Projects that are alternatives of or similar to Yandexstation

Troubleshooting

Описание и возможности

Яндекс Алиса в Lovelace

Samsung text-to-speech engine

Управление умным домом Яндекса

Стриминг музыки

Использование компонента

Text 2 Speech. Появилась потребность использовать какой-нибудь синтезатор на русском. Есть варианты?

2 ответа 2

Список покупок

Java

jsapi.sourceforge.net

FreeTTS

MARY Text-to-Speech System (MaryTTS)

Облачные сервисы —

Yandex.SpeechKit

Центр речевых технологий

Google Speech API

Microsoft Bing translator (Microsoft Translator API)

SpokenText

Медиа браузер

Яндекс Алиса в Telegram

Настройка

Что такое YandexGPT

Похожие записи:

Похожие записи: