logo search
акуст 2 ч ч

9.2. Оценка качества звучания речи

В соответствии с Рекомендацией Р.48 МККТТ эффективная полоса пропускания звукового тракта речевого (тонального) сигнала лежит в области 300...3400 Гц. Основным критерием, определяющим качество речевого сигнала, является разборчивость, т.е. смысловая понятность переданной информации слушателю. Для проведения испытаний по оценке разборчивости используются тональный и артикуляционные методы, в которых экспертные оценки выносятся подготовленными слушателями - экспертами. Основополагающим в этом случае является статистическая достоверность их результатов, т.е. число участвующих в испытаниях экспертов и количество прослушиваний должны быть достаточными.

Тональный метод основан на способности человеческого уха достаточно точно улавливать минимальный порог уровня громкости.

Речевой сигнал воспроизводится в виде отдельных тональных полосок. При прослушивании их уровень уменьшается до минимально воспринимаемой громкости. Полученные значения затухания с помощью справочных таблиц, используемых при расчётах разборчивости речи, пересчитываются и дают численное значение этого параметра.

Для воспроизведения тональных полосок используется тональный генератор и специальный акустический измерительный инструмент - искусственный рот (рис. 9.1.).

Конструктивно это небольшой громкоговоритель в комбинированном боксе с объёмом, примерно равном объёму

человеческого рта. Противоположная от громкоговорителя стенка бокса имеет отверстие, примерно равное по площади рту говорящего человека. Поскольку АЧХ и импульсные характеристики громкоговорителя имеют свои особенности, результаты оценки разборчивости тональным методом, даже при большом количестве прослушиваний, не обладают высокой достоверностью.

Рис. 9.1. Разрез искусственного рта

Артикуляционный метод предусматривает воспроизведение слогов, слов или фраз и восприятие их на слух экспертами. Чаще всего используются слоги и несуществующие слова (например, "шуц", "ыть", "вусь", "янь" и пр.), чтобы слушатели не домысливали услышанное.

В полном виде таблицы приведены в ГОСТ Р 50840-95. Для проведения испытаний, заранее составленные в таблицы слоги или слова (обычно по 50 единиц), записанные профессиональными дикторами, воспроизводятся через звуковой тракт. Эксперты заносят услышанное в свои протоколы. Сопоставляя услышанное с исходным материалом, можно сделать вывод о качестве разборчивости.

Оценочные характеристики для слоговых артикуляционных испытаний приведены в табл.9.1.

Артикуляционный метод первоначально разрабатывался для оценки качества разборчивости речи в радиопередающих трактах АМ и МВ ЧМ. Звучания тестов артикуляционных таблиц после прохождения в радиотракте прослушиваются экспертами, находящимися в удалении (например, в разных городах). Результаты экспертных протоколов статистически обрабатываются. Достоверность таких субъективных испытаний, как правило, достаточно высока. Кроме того, артикуляционный метод очень удобен для периодического технологического контроля качества передачи. Изменение разборчивости речи и качества звучания из-за неполадок в радиопередающей аппаратуре, при введении в испытываемый тракт дополнительного устройства или замена одного из компонентов тракта выявляется весьма достоверно.

Но столь же успешным стало применение артикуляционного метода при оценке разборчивости речи в зрительных залах. Один из конкретных примеров - проведённые в 1999-2000 г.г. работы по изучению технического состояния и настройке существующей системы звукоусиления зрительного зала Государственного академического большого театра России

Акустические испытания производились в трех точках в партере; в двух точках в бенуаре; и в одной точке в амфитеатре. Рабочие настроечные измерения проводились при максимально допустимом уровне громкости в пустом зале (с запасом 3 дБ до уровня самовозбуждения системы). Для измерений использовались артикуляционные слоговые таблицы. В каждой точке производилось 6 независимых измерений с участием 6 экспертов. Количество слогов в каждом измерении составило 100.

Таблица 9.1. Оценочные характеристики для слоговых артикуляционных испытаний

Оценка разборчивости (класс качества)

Характеристика класса качества

% совпадений с табличным материалом

Отличная (Высший)

Понимание передаваемой речи без малейшего напряжения внимания

>80

Хорошая (Первый)

Понимание передаваемой речи без затруднений

56-80

Удовлетворительная (Второй)

Понимание передаваемой речи с некоторым напряжением внимания, без переспросов и повторений

41 -55

Предельно

допустимая

(Третий)

Понимание передаваемой речи с некоторым напряжением внимания, редкими переспросами и повторениями

25-40

Неудовлетворитель-ная (Четвёртый)

Понимание передаваемой речи с большим напряжением внимания, частыми переспросами и повторениями

<25

. После доводки системы звукоусиления были получены следующие результаты (табл. 9.2):

Таблица 9.2. Результаты измерений.

Номер точки

% совпадений

Оценка разборчивости

1 (партер)

80

отличная

2 (партер)

84

отличная

3 (амфитеатр)

80

отличная

4 (бенуар)

73

хорошая

5(бенуар)

71

хорошая

6 (партер)

69

хорошая

Столь же удобно артикуляционным методом проводить оценку разборчивости речи в небольших залах без звукоусиления. Здесь используется "живой" дикторский голос. Для чтения артикуляционных таблиц приглашаются не менее трёх разных профессиональных дикторов, чтобы специфическая окраска их голосов не повлияла на результаты измерений.

С появлением цифровых систем записи и сжатия речи, были выявлены специфические шумы и искажения, ухудшающие качество речи. Для их оценки введены разновидности артикуляционных испытаний. Для оценки заметности искажений, вносимых кодеком, наиболее точными являются парные сравнения испытательных фраз. Качество речи испытуемого тракта оценивают путем сравнения с эталонным трактом, в качестве которого используют стандартный телефонный тракт (по Рекомендации Р.48 МККТТ). Качество речи оценивают по контрольным фразам, приведенным в ГОСТ Р 50840-95. Каждую контрольную фразу передают два раза:

Таблица 9.3. Соответствие между качеством речи речевого тракта и оценкой в баллах для метода парных сравнений

Характеристика качества речи

Баллы

Естественность звучания речи. Высокая узнаваемость. Полное отсутствие помех и искажений.

4,6-5,0

Естественность звучания речи. Высокая узнаваемость. Отдельные малозаметные искажения или помехи.

4,0-4,5

Естественность звучания речи. Высокая узнаваемость. Слабое постоянное присутствие отдельных видов искажений или помех.

3,5-3,9

Незначительное нарушение естественности и узнаваемости. Заметное присутствие отдельных искажений или помех.

3,0-3,4

Заметное нарушение естественности и ухудшение узнаваемости, присутствие нескольких видов искажений (картавость, гнусавость и др.) или помех.

2,5-2,9

Существенное искажение естественности и ухудшение узнаваемости. Постоянное присутствие искажений типа картавость, гнусавость и др. или помех .

1,7-2,4

Сильные искажения типа картавость, гнусавость и др. Механический голос. Наблюдается потеря естественности и узнаваемости.

<1,7

Порядок чередования трактов - случайный. Контрольные фразы, произносимые диктором, могут быть записаны на магнитную ленту, а затем прослушаны экспертами в записи. Принятые паузы между фразами 2...3 с, между парами фраз 4...5 с. Однако, специфика цифрового кодирования такова, что иногда создаются заметные искажения. Они, хотя и не мешают ее восприятию, но легко различимы сравнительно с обычным телефонным трактом. Поэтому они обеспечивают телефонному тракту 100 % предпочтение. Здесь оценка экспертом "лучше" или "хуже" некорректна. Поэтому качество речи по методу парных сравнений оценивается по 5-балльной системе с оценочным шагом в 0,1 балла. В качестве репера для сравнения принимается качество стандартного аналогового звукового тракта при работе от телефонного аппарата с динамическим микрофоном и при номинальном уровне. Его качество оценивается в 4 балла. Соответствие между качеством речи речевого тракта и оценкой в баллах для метода парных сравнений приведено в табл. 9.3.

Заметность искажений, вносимых кодеком, оценивается также измерениями фразовой разборчивости при ускоренном темпе произнесения. Таблицы с соответствующими короткими фразами (три-четыре слова) приведены в ГОСТ Р 50840-95.) состоят из коротких фраз в три-четыре слова. Диктор читает одну таблицу фраз в нормальном темпе произнесения (одна фраза за 2,4 с) и вторую таблицу в ускоренном темпе (одна фраза за 1,5 ...1,6 с). Пауза между фразами не менее 5...6 с. Эксперт прослушивает сначала таблицу, прочитанную диктором в нормальном темпе, затем таблицу, прочитанную тем же диктором. Фразу считают неправильно принятой, если хотя бы одно слово экспертом воспринято неправильно, пропущено или добавлено. Фразовую разборчивость определяют путем вычисления процента правильно принятых фраз для нормального и ускоренного темпов произнесения.

Вполне очевидно, что требования к высокой статистической достоверности делают артикуляционный метод достаточно трудоёмким. Высокие требования предъявляются также к квалификации экспертов. Однако всё это окупается высокой достоверностью получаемых результатов.