Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Киноклуб "Феникс" > Переводим сами > Говорящие субтитры


Автор: serjant52 16.12.2007 - 20:05
Говорящие субтитры

Фильмы с субтитрами у многих вызывает раздражение - ну уж, по крайней мере, удовольствия не прибавляют - надо всё время отвлекаться чтобы их прочитать. К тому же субтитры занимают часть кадра и портят общее впечатление от картины. Пытаясь избавить зрителя от подобных неудобств,http://www.vector-ski.ru/vecs/govorilka/subtitlesreader.htm была сделана программа ABM Subtitles Reader для чтения субтитров голосом, синхронно с фильмами различных форматов (*.avi, DVD, VCD).

(IMAGE: http://i027.radikal.ru/0712/a5/d3bc9d1ee84d.jpg)

Несмотря на ряд серьезных недоработок ABM Subtitles Reader, безусловно, заслуживает внимания, т.к. способна:
• читать субтитры с произвольного места и делать паузу в любой момент.
• "Понимать" субтитры форматов *.txt и *.srt.
• создавать звуковую дорожку (WAV-файл) для всего фильма.
• подключать произвольный набор словарей от "Говорилки", AudioBookMaker`а, Digalo и некоторых других
• осуществлять синхронное управление видеоплеером LightAlloy

Что же нужно сделать, чтобы субтитры «заговорили»?
Сначала необходимо установить программные интерфейсы для синтеза и распознавания речи Microsoft Speech API v.4.0, что позволит любой прикладной программе "общаться" с самыми разными голосовыми движками единым стандартным способом. Вместе с установленными драйверами интерфейса распознавания и синтеза речи, мы одновременно получим три демонстрационных англо-говорящих «голоса» (непотребного качества) – MS Sam; MS Mike и MS Mary – о которых можно сразу забыть.
МS SAPI v.4.0 входит в поставку операционной системы Windows (2000, XP), но может по различным причинам не быть инициированным. Чтобы убедиться, что SAPI установлен, нужно пройти Пуск -> Панель управления -> Речь -> Прочее

http://radikal.ru/F/i028.radikal.ru/0712/14/111f66368031.gif.html

В настоящее время используется уже новая версия программного интерфейса МS SAPI v.5.1, и большинство ведущих фирм синтезации звука создают голосовые движки с поддержкой либо новой версии, либо обеих версий стандартного интерфейса. Если же речевой движок не поддерживает стандартный интерфейс, то это сильно ограничивает его применение, а значит, и коммерческий успех. Для мелких компаний, поддержка SAPI просто необходима. Поскольку никто не будет покупать речевые движки и писать специальные программы для портирования в свои продукты. Однако крупные преуспевающие компании (AT&T, Nuance, ScanSoft), стараются выдвинуть свои стандарты и не поддерживать SAPI.
На компьютер можно одновременно установить как Speech API 5.1, так и Speech API 4.0. Они оба будут работать, не мешая друг другу, каждый со своими голосовыми движками.

Следующий шаг – установка голосовых движков, называемых Text-To-Speech или TTSEngines, непосредственно осуществляющих синтез речи для определенного языка и голоса.
Существуют как бесплатные (и соответственно непотребные) голосовые движки (например, от Microsoft или от, ныне обанкротившейся, Lernout&Hauspie), так и более качественные – платные (например от Digalo, Acapela-Elan, Loquendo, AT&T, Nuance/ScanSoft т.п.)

К большому сожалению, ABM Subtitles Reader последний раз обновлялась 2 года назад, а по сему, не поддерживает новые голосовые движки, основанные на Speech API 5.1, качество которых значительно возросло. Поэтому, арсенал озвучивания субтитров пока ограничивается лишь узким кругом голосов, поддерживающим Speech API 4.0, из которых наиболее приемлемыми являются движки французской фирмы http://www.digalo.com, с основными европейскими языками.
Обычно при упоминании голосовых движков от Digalo, подразумевается Digalo 2000. Именно эта версия, как правило, используется для синтеза речи (для русской, к сожалению, используется только мужской – Nicolai). Более свежие версии движка рассматривать не имеет смысла, поскольку управляются они только родной оболочкой, совершенно "не видятся" программами-говорилками, а по качеству синтеза ничуть не лучше Digalo 2000. Внятность речи - главное достоинство «старого» Nicolai, из-за которого многие терпят его недостатки. Хотя движок и работает под управлением Speech API 4.0, но с минимальной поддержкой, из-за чего, на фоне других приличных движков, для нашего Nicolai практически отсутствуют какие-либо регулировки.
Недавно появился «новый» Nicolai, от http://www.elantts.com, который теперь называется - Acapela-Elan Speech Cube Rus (Nicolai). Этот движок работает и под SAPI 4, и под SAPI 5, но обладает тем же голосом, что и старый. Однако «новый» Nicolai подлечил некоторые старые болезни – не сбоит на глючных словах и длинных паузах, позволяет записывать речь с ускорением, немного расширился диапазон настраиваемых параметров речи. Расширился и диапазон скорости чтения с 70 - 190 условных слов/мин., до 17 - 850 слов/мин., что на деле абсолютно бесполезно, поскольку - при значении выше 250 слов/мин. уже ничего не воспринимается, а при скорости ниже 50 слов/мин. синтезатор бормочет заплетающимся языком алкоголика. Значительно расширен и частотный диапазон «нового» Nicolai: от голоса человека, перенесшего трахеотомию, до старичка-кастрата.

После инсталляции и регистрации движков чудотворными таблетками, можно на них теперь и посмотреть. Запустим панель управления SAPI 4:

http://radikal.ru/F/i012.radikal.ru/0712/d9/aa520ab03cbb.gif.html

Теперь запускаем ABM Subtitles Reader . Смотрим, что же из установленного поддерживает программа и выбираем нужный голос. Подгружаем словари произношений из имеющегося комплекта, загружаем субтитры нужного фильма и можно начинать пробовать :).
Хочу сразу предупредить, что, кроме всего прочего, программа, к сожалению
• Не осуществляет синхронизацию с наиболее популярными плеерами, типа Zoom Player, BS Player, Crystal Player, VLC-media player… (т.е. надо создавать специальные *.bat-файлы)
• Не осуществляет регулировку громкости с некоторыми звуковыми движками
• Для приемлемого восприятия на слух, субтитры должны быть сравнительно короткими, 1-2 сек. паузами между ними – иначе возникает просто мешанина слов. Это особенно заметно для русского языка, скорость речи которого существенно ниже романских и германских языков.
Однако, несмотря на все имеющиеся недостатки, советую всё-таки попробовать эту программку, а заодно и вообще посмотреть подобные звуковые движки.

Дабы желающие не мучались в поисках всего этого добра, некоторые материалы я выложил для скачивания:
Speech API 4.0 http://rapidshare.com/files/76966515/MSAPI4.rar
Speech API 5.1 http://rapidshare.com/files/76966789/MSAPI5.rar
Комплект Digalo2000 (8 голосовых движков лекарство; словари для DigaloRus DigaloEditor для их редакции; Программа DigaloDigIt, позволяющая проговаривать текст в любых приложениях) http://rapidshare.com/files/76986670/Dig.rar
ABM Subtitles Reader Словари http://rapidshare.com/files/76989591/ABMSR.rar
Голосовой движок Acapela-ELAN -TTS-SpeechCube-5.1-RUS-Nicolai Фирменый словарь для ELAN-Nicolai (уже готовый к употреблению «новый» Nicolai) http://rapidshare.com/files/77001220/Nicolai.rar

В качестве бонуса:
Программа для чтения и записи аудио-книг Mp3Book2005-340-full http://rapidshare.com/files/76969276/Mp3B5.rar
Голосовые движки от фирмы Loquendo (Eng&Ger) под SAPI v5 Таблетка и Мануал http://rapidshare.com/files/77011928/Lqdo.part1.rar и http://rapidshare.com/files/77008064/Lqdo.part2.rar
Голосовые движки от фирмы ScanSoft-Katerina (Rus)ver.1 и ver.2 Steffi (Ger) под SAPIv5 Программа для чтения NextUp Talker – (всё готовое к употреблению) http://rapidshare.com/files/77017232/ScSft.part1.rar и http://rapidshare.com/files/77013768/ScSft.part2.rar

Пароль ко всем архивам: Speech

Автор: Polinka 16.12.2007 - 20:13
Интересно.

А как создаются специальные *.bat-файлы. :shy0:

Автор: serjant52 16.12.2007 - 20:33
Вообще-то пишутся в текстовом редакторе :D

Автор: Marina 16.12.2007 - 21:25
Страшное дело. Такое впечатление, шо читает старик с акцентом. Ужасть.

Автор: serjant52 16.12.2007 - 22:24
А Вы думали, что услышите голос Олега Табакова?

Автор: Marina 17.12.2007 - 02:14
------------ CODE SAMPLE ---------- А Вы думали, что услышите голос Олега Табакова? -----------------------------------
Нет, я когда-то игралась с этой прогой и еще с несколькими. Все ерунда. Лучше субтитры читать.

Автор: serjant52 17.12.2007 - 08:21
Лучше субтитры самаму озвучивать :) А если серьёзно, то Вы уже несколько отстали. Звуковые синтезаторы ведущих производителей (особенно для английского языка) очень серьёзно продвинулись, да и нашу Катерину уже можно слушать, но некоторые слова, естественно, необходимо самому править в словаре. Программа весьма привлекательная. Если бы ее модернизировать (всё-таки 2 года не обновлялась, а автор, к сожалению, на мои письма не отвечает) то её можно было бы широко использовать, по крайней мере, для коротких фрагментов.

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)