Что такое голос кратко

Обновлено: 06.07.2024

1. Звуки, возникающие вследствие колебания голосовых связок при разговоре, крике, пении и отличающиеся высотой, характером звучания и т. п. Высокий голос. Низкий голос. Детские голоса. Голос соловья. Повысить голос. Узнать по голосу. □ Слышу ли голос твой Звонкий и ласковый, Как птичка в клетке Сердце запрыгает. Лермонтов, Слышу ли голос твой. В голосе старика уже дрожали слезы. Гл. Успенский, Очерки переходного времени. — Вы уже уходите? — взволнованным голосом спросил он. Гаршин, Происшествие.

2. Звучание голосовых связок при пении, качество звучания; способность петь. Иметь голос. Романс для женского голоса. □ Маша имела прекрасный голос и большие музыкальные способности. Пушкин, Дубровский. [Коцюбенко] сел на бревно и, как полагается, минуту или две пробовал голос, тянул ноты, мурлыкал что-то про себя. Фурманов, Красный десант.

3. Одна из нескольких мелодий в музыкальном произведении, партия в вокальном ансамбле. Фуга на четыре голоса. Романс для двух голосов. || Устар. Мотив, мелодия (песни). Голос песен грузинских приятен. Мне перевели одну из них слово в слово. Пушкин, Путешествие в Арзрум.

4. чего. Звуки, сопровождающие какое-л. явление, а также сопровождающие действие, работу каких-л. устройств, предметов. Голос ветра.□ Удалившись несколько от города, юноша остановился, долго слушал исчезающий, раздробленный голос города и величественный единый голос моря. Герцен, Легенда. Могучие голоса десятков моторов слились в общий гром, сотрясавший землю и воздух. Ардаматский, Они живут на земле.

5. перен.; чего или какой. Веление, зов какого-л. внутреннего чувства, инстинкта, убеждения. Голос рассудка. Голос крови. Голос совести. Внутренний голос. □ Но сегодня впервые в жизни тайный голос подсказывал Быкову: лететь не следует. Саянов, Небо и земля.

6. Мнение, суждение, высказывание. [Миша:] Позвольте мне хотя здесь [в выборе невесты] иметь свой голос, хотя в деле, от которого зависит счастие моей будущей жизни. Гоголь, Отрывок. — [Доктор] советует ехать на воды за границу. Что ты скажешь? — Что же мне сказать? Тут, я думаю, голос доктора важнее моего. И. Гончаров, Обыкновенная история.

7. Право заявлять свое мнение при решении вопросов в государственных и общественных учреждениях. Решающий голос. Делегат 328 с совещательным голосом. □ Выборы депутатов являются равными: каждый избиратель имеет один голос; все избиратели участвуют в выборах на равных основаниях. Конституция СССР. || Само это мнение в его внешнем выражении. Подсчет голосов. Избрать большинством голосов.

Этим постом мы хотели бы начать цикл статей, посвященных задаче изменения голоса. В зарубежной литературе данную задачу часто именуют термином voice morphing, в отечественной литературе данная задача ещё не получила достаточного освещения как в научных, так и в инженерных кругах. Тема является достаточно обширной и во многом творческой. В результате работы в данном направлении у нас накопился определенный опыт, который мы планируем систематизировать и изложить, а также передать основную суть некоторых алгоритмов.

Введение

Речевой тракт человека является едва ли не наиболее совершенным и гибким в сравнении со всеми известными животными и по разнообразию производимых звуков оставляет позади большинство музыкальных инструментов. Основная сложность в анализе и изменении голосового сигнала кроется именно в данном разнообразии и вытекающей большой неопределенности, связанной с вычленением и обработкой элементарных звуковых единиц. Не существует алгоритмов, хорошо подходящих для обработки всех звуков речи. К тому же, один и тот же элементарный звук человек может произносить по-разному в зависимости от своего эмоционального, физического состояния, от места звука в слове, etc. Индивидуальные особенности произношения, культурный и языковой фактор, медицинские патологии — все это также оказывает влияние на произносимый звук.

Звукообразование, общие сведения

Для понимания специфики обработки голосового сигнала, рассмотрим более подробно вопрос звукового состава речи и каким образом данные звуки образуются. Процесс звукообразования принято описывать с помощью двух основных понятий: фонация и артикуляция, опишем их по порядку.

Верхний график отражает значение U(t) во времени на выходе голосовой щели. Нижний график показывает первую производную U(t) по времени — суть изменение давления на выходе голосовой щели. Это периодическое изменение давления уже является звуком само по-себе. Данный звук состоит из шумовой и гармонической составляющих. Шумовая составляющая образуется турбулентностью из-за резкого увеличения U(t) и неполного смыкания голосовой щели (модель на картинке выше не учитывает шумовую составляющую). Гармоническая составляющая может быть представлена гармоническим рядом, где частоты всех вторичных гармоник (которые ещё называют обертонами) кратны частоте первой самой низкой гармоники, называемой частотой основного тона. (см. рисунок ниже).

Физику образования данных гармоник в двух словах объяснить не получится, для этого лучше написать отдельную статью. Главное пока запомнить, что из гортани при работе связок уже может выходить вполне гармонический звук. Численное значение частоты основного тона равно частоте сокращения голосовых связок и является функцией от их длины, плотности и натяжения.

Артикуляция заключает в себе процесс изменения состояния всех элементов речевого тракта при звукопроизнесении. Фонация является частью артикуляции. Речевой тракт можно упрощенно представить совокупностью камер и трубок (см. рисунок справа), через которые проходит сигнал возбуждения. Сужения и расширение смычек голосового тракта, лежащих выше гортани, дополнительно влияют на скорость прохождения воздушного потока, формируют дополнительные (помимо голосовой щели) зоны турбулентности. Вместе с тем полости речевого тракта аналогичны акустическим резонаторам при прохождении через которые усиливаются одни и ослабляются другие частоты звука. Мышцы речевого тракта позволяют человеку контролировать геометрию камер речевого тракта, создавать препятствия на пути воздушного потока (язык, зубы, губы).

В грубом приближении можно резюмировать вышесказанное, как:
артикуляция = фонация + работа мышц речевого тракта,
где фонация может быть вокализованной или не вокализованной, а сокращение каждой отдельной мышцы — некоторая функция от времени.

В процессе обучения разговорной речи человек учится координировать работу органов артикуляции для получения определенных звуков. Из-за индивидуальных анатомических особенностей один и тот же звук у всех людей звучит немного по-разному, и это один из важных факторов, по которым мы отличаем голоса людей. При согласованной работе голосовых связок и остальных мышц речевого тракта, возможно образование гласных, согласных, смешанных и переходных звуков. Далее предлагается кратко рассмотреть эти группы, в общих чертах описать их артикуляцию и основные признаки.

Простейшая классификация звуков речи

Теперь перейдем к согласным звукам. Их количество значительно превышает количество гласных звуков и по своему звучанию они могут быть разбиты на подклассы. Как это часто бывает в реальной жизни, многие феномены имеют признаки многих классов и однозначная классификация весьма затруднительна. Согласные звуки в данном случае не являются исключением. Их разбиение на классы зависит от рассматриваемого языка и применяемой фонетической теории. Мы рассмотрим наиболее общую классификацию, состояюшую из трех основных групп:
— фрикативные согласные
— смычные согласные
— сонорные согласные

Генерируемый шумовой сигнал, как и в случае с гласными звуками, проходит через некоторое количество акустических фильтров (камеры речевого тракта), которые придают этому шуму некоторую характерную спектральную форму и звучание.

Следует обратить внимание, что все три попытки произношения звука значительно отличаются друг от друга во временной области. При этом на слух их отличить весьма тяжело.
Пример спектрограммы слова с несколькими смычными звуками изображен ниже.

2. Гласные звуки несут в себе большее количество энергии, нежели согласные, основная её часть (1-я и 2-я форманты) лежат в диапазоне от 400 до 3000 Гц. Согласные звуки имеют значительно меньшую энергию. У большой части согласных звуков значительная часть этой энергии сосредоточена в области 2-10 КГц. Один из примеров показан ниже:

3. Гласные звуки имеют в среднем большую продолжительность, нежели согласные (100-300 мсек против 30-100 мсек, хотя конкретные точные цифры сильно зависят от языка и человека)

Речевой сигнал при слитной речи может условно считаться стационарным на отрезках от 5 до 100 миллисекунд в зависимости от особенностей диктора и произносимого звука. На более длительных интервалах анализа возрастает вероятность существенного изменения свойств сигнала, что может привести к несостоятельности оценок его усредненных параметров. Как и в любой другой области обработки сигналов, большие проблемы могут создать шумовые помехи, особенно те из них, которые имеют гармоническую природу и/или некоторые подобия формант — частотные области со сравнительно большой энергией.

Читайте также: