Определение фонетического состава сегментов исследуемого слова
Определить фонетический состав сегментов исследуемого слова с помощью программы «Sound».
Анализ структуры ОТ-кластеров В-сегментов разных звуков
Проанализировать структуру ОТ-кластеров В-сегментов разных звуков с помощью программы «Sound».
а) Определить количество ОТ-кластеров, содержащихся в В-сегментах, входящих в анализируемое слово.
б) Проанализировать внутреннюю структуру ОТ-кластеров:
наличие или отсутствие формантной или шумовой компоненты,
переходный или стационарный участок фонограммы.
Измерение длительности временных сегментов разных типов (В-сегментов, Ш-сегментов, Вз-сегментов).
Измерения произвести в следующих единицах:
а) числом отсчетов при временной дискретизации,
б) в единицах времени (миллисекунды).
Рис.2.1. Временная разметка слова «Восемь» на кластеры, часть 1-я
Рис.2.2. Временная разметка слова «Восемь» на кластеры, часть 2-я
Программа анализа фонограмм «Sound»
Назначение программы
Основные возможности программы «Sound»:
а) запись фонограмм с микрофона,
б) визуализация записанной с микрофона фонограммы,
в) визуализация файла произвольной (внешней) фонограммы,
г) визуализация фонограмм в режиме «увеличения»,
д) сегментирование фонограмм – интерактивное выделение временных сегментов фонограммы,
е) прослушивание фонограммы или выделенного сегмента фонограммы,
ж) запись выделенного сегмента фонограммы в файл.
Функциональные возможности программы
На рис.2.3 приведены обозначения (и нумерация) кнопок управления программой.
Рис.2.3. Перечень кнопок управления программой
Функциональные возможности программы реализуются через опциональные кнопки управления программой.
Дадим перечень кнопок управления:
(1) – Кнопка (закладка) «Файл».
Опции закладки «Файл» приведены на рис.2.4.
Рис.2.4. Опции закладки «Файл»
Закладка «Файл»содержит следующие опции:
«Открыть» (номер (1) на рис.2.3),
«Сохранить исходную фонограмму» (номер (2) на рис.2.3),
«Сохранить результирующую фонограмму» (номер (3) на рис.2.3),
«Выход» (номер (15) на рис.2.3).
Пример выбора открываемого файла при использовании опции «Открыть» представлен на рис.2.5.
На рис.2.2 на графике реализации фонограммы по оси абсцисс отложены номера отсчетов (номера временных выборок), а по оси ординат – значения кодов временных отсчетов. Разрядность записей – 16 разрядов, частота временной дискретизации – 22050 Гц.
Рис.2.5. Выбор открываемого файла. Открываемый файл «Аккомодация».
(2) – Кнопка (закладка) «Фонограмма».
Опции закладки «Фонограмма»приведены на рис.2.6.
Закладка «Фонограмма»содержит следующие опции:
«Сформировать фонограмму» (номер (4) на рис.2.3),
«Завершить формирование фонограммы» (номер (5) на рис.2.3),
«Прослушать исходную фонограмму» (номер (6) на рис.2.3),
«Прослушать отредактированную фонограмму» (номер (7) на рис.2.3).
Пример отображения загруженной фонограммы (открытого файла) при использовании опции «Открыть» представлен на рис.2.6.
Рис.2.6. Опции закладки «Фонограмма»
(3) – Кнопка (закладка) «Визуализация».
Опции закладки «Визуализация»приведены на рис.2.7.
Закладка «Визуализация»содержит следующие опции:
«И – исходная фонограмма» (номер (11) на рис.2.3.),
«Ф – фрагмент фонограммы» (номер (12) на рис.2.3.),
Пример отображения опций закладки «Визуализация»приведен на рис.2.7.
Рис.2.7. Пример отображения опций закладки «Визуализация»
(4) – Кнопка (закладка) «Редактирование».
Опции закладки «Редактирование»приведены на рис.2.8.
Закладка «Редактирование»содержит следующие опции:
« задание левой границы (фрагмента)» (номер (8) на рис. 2.3.),
« задание правой границы (фрагмента)» (номер (9) на рис. 2.3.),
« создание редактируемой фонограммы» (номер (10) на рис. 2.3.),
Пример отображения опций закладки «Редактирование»приведен на рис.2.8.
Рис.2.8. Пример отображения опций закладки «Редактирование»
(5) – Кнопка (закладка) «Настройки».
Опции закладки «Настройки»приведены на рис.2.9.
Закладка «Настройки»содержит характеристики (параметры) обрабатываемых звуковых файлов:
« частота дискретизации (8000, 11025, 22050, 44100 Гц)»,
« число бит на отсчет при АЦ-преобразовании»,
« число каналов (моно/стерео)»,
Пример отображения опций закладки «Настройки»приведен на рис.2.9.
Рис.2.9. Пример отображения опций закладки «Настройки»
На рис.2.10 приведена фонограмма слова «Аккомодация».
На рис.2.11 приведен увеличенный фрагмент звука «А1» слова «Аккомодация».
На рис.2.12 приведен увеличенный фрагмент звуков «ЦИЯ» слова «Аккомодация».
На рис.2.13 приведен увеличенный фрагмент звука «Ц» слова «Аккомодация».
На рис.2.14 приведены границы при выделении фрагмента фонограммы.
На рис.2.15 приведен пример увеличения на все окно отображения выделенного фрагмента фонограммы.
На рис.2.16, 2.17 приведены примеры выделения фрагментов для их аудиовоспроизведения с помощью кнопки (7) рис.2.3.
Рис.2.10. Фонограмма слова «Аккомодация»
Рис.2.11. Увеличенный фрагмент звука «А1» слова «Аккомодация»
Рис.2.12. Увеличенный фрагмент звуков «ЦИЯ» слова «Аккомодация»
Рис. 2.13. Увеличенный фрагмент звука «Ц» слова «Аккомодация»
Рис.2.14. Установка границ при выделении фрагмента звука «Ц»
Рис.2.15. Увеличенный на все окно фрагмент звука «Ц»
Рис.2.16. 1-ый пример выделения фрагмента на исходной фонограмме
Рис.2.17. 2-ой пример выделения фрагмента на исходной фонограмме
- Министерство образования и науки российской федерации
- Оглавление
- Список рисунков
- Введение
- Основы работы со средой математического моделирования МаtLab
- История создания и развития системы MatLab
- Интерфейс пользователя
- Типы данных в системе MatLab
- Переменные в системе MatLab
- Арифметические и логические операции в системе MatLab
- Массивы и матрицы в системе MatLab
- Использование знака «:» и множественной индексации в системе MatLab
- Операции над матрицами в системе MatLab
- Встроенные функции в системе MatLab
- Графические возможности системы MatLab
- Изменение свойств линий и оформление графиков
- Графики функций двух переменных
- Вывод нескольких графиков на одни оси
- Вывод нескольких графиков в одном графическом окне
- Работа со звуковыми файлами в системе MatLab
- Считывание данных из wav-файлов
- Запись данных в wav-файл
- Воспроизведение звуковых сигналов
- Запись звуковых сигналов
- Лабораторная работа №1. Исследование внутренней структуры речевого сигнала
- Методические указания к лабораторной работе
- Исследование структуры и временных характеристик речевых сигналов
- Ручная сегментация исследуемой фонограммы
- Определение фонетического состава сегментов исследуемого слова
- Лабораторная работа №2. Исследование спектральных свойств речевого сигнала
- Методические указания к лабораторной работе
- Комментарии по оформлению отчета к лабораторной работе
- Программа анализа спектров фонограмм «Спектр» (версия 4)
- Назначение программы
- Функциональные возможности программы
- Лабораторная работа №3. Исследование корреляционных свойств речевого сигнала
- Методические указания к лабораторной работе
- Комментарии к оформлению отчета по лабораторной работе
- Программа анализа корреляционных функций «Коррелограмма»
- Назначение программы
- Предварительный этап работы с фонограммой
- Порядок работы в программе «Коррелограмма»
- Дополнительные возможности по работе с программой
- Лабораторная работа №4. Исследование vad-алгоритма
- Методические указания к лабораторной работе
- Комментарии по оформлению отчета к лабораторной работе
- Исследование алгоритма vad в программе «Коррелограмма»
- Лабораторная работа №5. Исследование методов оценки основного тона речи
- Методические указания к лабораторной работе
- Лабораторная работа №6. Моделирование алгоритмов обработки речи
- Методические указания к лабораторной работе
- Список индивидуальных заданий
- Вопросы для самоподготовки
- Лабораторная работа №1
- Лабораторная работа №2
- Лабораторная работа №3
- Лабораторная работа №4
- Лабораторная работа №5
- Лабораторная работа №6 (Индивидуальные задания)
- Список литературы
- Приложение аСписок литературы и web-ресурсы по «Речевым технологиям» и среде математического моделирования «MatLab»
- Список литературы по «Речевым технологиям»
- Отечественная литература
- Общетеоретические вопросы
- Прикладная фонетика
- Синтез речи
- Психоакустика и физиология речи
- Цифровая связь (телефония)
- Зарубежная литература
- Web – ресурсы
- Список литературы по среде математического моделирования «MatLab»
- Приложение б Современные направления научно-исследовательских работ кафедры «Бортовых радиоэлектронных систем в области разработки систем обработки речи
- Основные области применения разрабатываемых алгоритмов
- Многоуровневая временная сегментация речевых сигналов
- Модификация фонограмм