Список индивидуальных заданий
Определение энергетического спектра речи (тестовой фонограммы) студента.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме энергетического спектра речи,
б) провести оценку спектра речи по тестовым фонограммам.
Сложность - 1
Определение амплитудного спектра типичных сегментов тестовой фонограммы.
Использовать сегменты, соответствующие звукам – шумовым, взрывным, вокализованным.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме амплитудного спектра речи,
б) провести оценку спектра речи по тестовым фонограммам.
Сложность - 1
Определение амплитудно-фазового (комплексного) спектра речи (тестовой фонограммы) студента.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме амплитудно-фазового спектра речи для разных временных интервалов,
б) провести оценку спектра речи по тестовым фонограммам:
для отдельных слов,
для отдельных фраз,
для коротких временных сегментов, соответствующих характерным звукам.
Сложность - 1
Имитация алгоритма VAD
Разработать:
а) методику, алгоритм и программу определения временных границ для одной тестовой фонограммы (слова «Заказ»), базовое пороговое значение определяется оператором ЭВМ.
при наличии фонового шума (например, вентилятор ЭВМ),
при отсутствии фонового шума.
Сложность - 1
Разработать алгоритм и программу, реализующую блоковое спектральное оценивание тестовой фонограммы на интервале «квазистационарности» ~20мс.
Результат представляется в виде спектрограммы (сонограммы).
Сложность - 2
Корреляционная обработка речевого сигнала (тестовой фонограммы) студента.
Разработать: методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:
Tк.об. << Tот ,
Tк.об. ≈Tот ,
Tк.об. ≈ 2-4 Tот.
Сложность - 3
«Разностная» обработка речевого сигнала (тестовой фонограммы) студента.
Разработать:
а) Нормированный модуль разности:
Fразн=sum(abs(v1-v2))/a, где v1-эталонный вектор, v2- текущий вектор
б) методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:
Tр.об. << Tот ,
Tр.об. ≈Tот ,
Tр.об. ≈ 2-4 Tот.
Сложность – 3
Разработать алгоритм и программу А-компандирования и экспандирования.
а) разработать методику оценки ошибок А-компандирования,
б) провести оценку ошибок А-компандирования (объективную и субъективную).
Сложность – 3
Разработать алгоритм и программу Мю-компандирования и экспандирования.
а) разработать методику оценки ошибок Мю-компандирования,
б) провести оценку ошибок Мю-компандирования (объективную и субъективную).
Сложность – 3
Разработать алгоритм очистки (фильтрации) фонограммы от НЧ-наводки (частота сетевой наводки ~ 50Гц).
Разработать методику, алгоритм и программу предварительной очистки фонограммы от НЧ-наводки.
Сложность – 3
Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (первого порядка).
а) разработать методику оценки степени сжатия,
б) провести оценку степени сжатия для ДИКМ первого порядка.
Сложность – 3
Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (второго порядка).
а) разработать методику оценки степени сжатия,
б) провести оценку степени сжатия для ДИКМ второго порядка.
Сложность – 3
Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (третьего порядка).
а) разработать методику оценки степени сжатия,
б) провести оценку степени сжатия для ДИКМ третьего порядка.
Сложность – 3
Разработать алгоритм и программу, реализующую оценку распределения модуля мгновенных значений фонограммы.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме распределения модуля мгновенных значений фонограммы,
б) алгоритм определения моды распределения.
Сложность – 3
Разработать алгоритм и программу, реализующую спектральное разделение тестовой фонограммы на две области НЧ (Fоти гармоникиFот) и ВЧ (формантную).
Сложность – 3
Разработать алгоритм и программу, реализующую временное прореживание тестовой фонограммы при Fд = 44100Гц.
Коэффициенты прореживания – Kof_pr = 2, 4, 5,
Разработать вариант алгоритма при Kof_pr =1.5.
Сложность – 3
Исследовать влияние жесткого и мягкого ограничения на разборчивость речи.
а) разработать несколько удобных зависимостей с «мягким» ограничением и «клиппирующих» зависимостей,
б) разработать программу по обработке фонограммы,
в) проанализировать разборчивость речи для разных вариантов нелинейного преобразования.
Сложность – 3
Оценка влияния частоты временной дискретизации на качество фонограммы. Исследуется ошибка записи фонограммы для различных частот дискретизации
Разработать:
а) методику, алгоритм и программу по формированию из исходной фонограммы с заданной частотой дискретизации,
б) разработать методику оценки ошибок А/Ц-преобразования как функцию частоты дискретизации,
в) провести оценку ошибок записи фонограммы (объективную и субъективную).
Сложность – 3
Оценка влияния разрядности амплитудного квантования на качество фонограммы. Исследуется ошибка записи фонограммы для разных вариантов разрядность квантования.
Разработать:
а) методику, алгоритм и программу по формированию из исходной фонограммы фонограмму с заданной разрядностью квантования,
б) разработать методику оценки ошибок А/Ц-преобразования как функцию разрядности квантования,
в) провести оценку ошибок записи фонограммы (объективную и субъективную).
Сложность – 3
Разработать алгоритм и программу, реализующую оценку распределения «огибающей» отсчетов фонограммы.
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм). Оценить зависимость выборочных распределений от интервала анализа.
Сложность – 4
Разработать алгоритм и программу, реализующую обнаружение речевой активности /алгоритм VAD/.
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).
Сложность – 5
Разработать алгоритм и программу, реализующую разделение сегментов фонограммы на «вокализованные-невокализованные».
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).
Сложность – 5
Разработать алгоритм и программу, реализующую оценивание периода основного тона.
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).
Сложность – 5
Экспериментальное определение частоты ОТ (основного тона). Исследовать распределение частоты ОТ для мужчин и для женщин; однополая выборка должна составлять не менее 5 человек, построить экспериментальную зависимость; сравнить с теоретическими данными (см. Список литературы).
Сложность – 3
Определение частоты ОТ (основного тона) методом HPS(HarmonicProductSpectrum).
Сложность – 4
- Министерство образования и науки российской федерации
- Оглавление
- Список рисунков
- Введение
- Основы работы со средой математического моделирования МаtLab
- История создания и развития системы MatLab
- Интерфейс пользователя
- Типы данных в системе MatLab
- Переменные в системе MatLab
- Арифметические и логические операции в системе MatLab
- Массивы и матрицы в системе MatLab
- Использование знака «:» и множественной индексации в системе MatLab
- Операции над матрицами в системе MatLab
- Встроенные функции в системе MatLab
- Графические возможности системы MatLab
- Изменение свойств линий и оформление графиков
- Графики функций двух переменных
- Вывод нескольких графиков на одни оси
- Вывод нескольких графиков в одном графическом окне
- Работа со звуковыми файлами в системе MatLab
- Считывание данных из wav-файлов
- Запись данных в wav-файл
- Воспроизведение звуковых сигналов
- Запись звуковых сигналов
- Лабораторная работа №1. Исследование внутренней структуры речевого сигнала
- Методические указания к лабораторной работе
- Исследование структуры и временных характеристик речевых сигналов
- Ручная сегментация исследуемой фонограммы
- Определение фонетического состава сегментов исследуемого слова
- Лабораторная работа №2. Исследование спектральных свойств речевого сигнала
- Методические указания к лабораторной работе
- Комментарии по оформлению отчета к лабораторной работе
- Программа анализа спектров фонограмм «Спектр» (версия 4)
- Назначение программы
- Функциональные возможности программы
- Лабораторная работа №3. Исследование корреляционных свойств речевого сигнала
- Методические указания к лабораторной работе
- Комментарии к оформлению отчета по лабораторной работе
- Программа анализа корреляционных функций «Коррелограмма»
- Назначение программы
- Предварительный этап работы с фонограммой
- Порядок работы в программе «Коррелограмма»
- Дополнительные возможности по работе с программой
- Лабораторная работа №4. Исследование vad-алгоритма
- Методические указания к лабораторной работе
- Комментарии по оформлению отчета к лабораторной работе
- Исследование алгоритма vad в программе «Коррелограмма»
- Лабораторная работа №5. Исследование методов оценки основного тона речи
- Методические указания к лабораторной работе
- Лабораторная работа №6. Моделирование алгоритмов обработки речи
- Методические указания к лабораторной работе
- Список индивидуальных заданий
- Вопросы для самоподготовки
- Лабораторная работа №1
- Лабораторная работа №2
- Лабораторная работа №3
- Лабораторная работа №4
- Лабораторная работа №5
- Лабораторная работа №6 (Индивидуальные задания)
- Список литературы
- Приложение аСписок литературы и web-ресурсы по «Речевым технологиям» и среде математического моделирования «MatLab»
- Список литературы по «Речевым технологиям»
- Отечественная литература
- Общетеоретические вопросы
- Прикладная фонетика
- Синтез речи
- Психоакустика и физиология речи
- Цифровая связь (телефония)
- Зарубежная литература
- Web – ресурсы
- Список литературы по среде математического моделирования «MatLab»
- Приложение б Современные направления научно-исследовательских работ кафедры «Бортовых радиоэлектронных систем в области разработки систем обработки речи
- Основные области применения разрабатываемых алгоритмов
- Многоуровневая временная сегментация речевых сигналов
- Модификация фонограмм