:: Читать - Оглавление - Книга "Журнал "Компьютерра" N736" - Журнал Компьютерра - Страница 39 - ЛитЛайф - книги читать онлайн

Изменить стиль страницы

Теперь произнесите "У" и сразу "А". В первом случае рот почти полностью закрыт (поэтому звук "У" назы вается закрытым), а во втором — открыт. В среднем положении мы произносим звук "О".

Таким образом, легкие дают нам воздух, голосовые связки формируют из него некую несущую частоту, называемую частотой основного тона, а язык и губы формируют конечные звуки. В процессе участвуют даже верхние и нижние зубы. Поэтому произнесение звонких согласных детям и старикам дается труднее, чем глухих.

Поскольку получаемый таким образом звук — это волна, которая накладывается на другую волну — тот самый основной тон, формируемый легкими и голосовыми связками, то наступают моменты, когда эти волны входят в резонанс.

В это мгновение индивидуальные особенности человеческого организма выражены наиболее ярко. Звуковая частота, на которой происходит совпадение, называется формантой. Качественная звукозаписывающая аппаратура позволяет зафиксировать при произнесении, например, звука "И" до пяти формант. При этом у среднего мужчины первая форманта будет располагаться в районе 240 плюсминус 100 герц, вторая в районе 2250-2500 герц, третья в районе 3200, а четвертая около 3600. Пятая форманта будет ясно и четко зафиксирована уже не у каждого мужчины, если он, конечно, не Сергей Пенкин. При этом на одном и том же звуке "И" мы получим разные частотные значения в зависимости от того, ударным или безударным в слове он является, и даже в зависимости от того, какая, например, согласная перед, а какая после звука "И" в слове.

Сочетание "согласная-гласная-согласная" называется триадой, именно такие сочетания и подвергаются анализу. Точно вымеренная совокупность частот у одинаковых триад будет для каждого человека индивидуальной.

Другими важными индивидуальными характеристиками являются длительность каждого звука, измеряемая в миллисекундах, и амплитуда звуковых колебаний или попросту сила звука, которая выражается в децибелах. Естественно, что, имея в распоряжении достаточно длинную запись и перемерив все эти индивидуальные характеристики для каждого из звуков, мы получим огромное количество цифр, которые и будут характеризовать акустические особенности речи конкретного индивидуума. И если сравнить их с точно такими же, вычисленными для фонограммы, на которой записана речь неизвестного, то мы легко отличим, когда говорит пародист Максим Галкин, а когда актриса, телеведущая и просто манерная женщина Рената Литвинова.

Но на этом наше разбирательство с особенностями звуковой волны не закончено. Пока мы анализировали только звуки, а теперь попробуем прикинуть, что может дать нам звуковая волна в целом. Вопервых, если мы имеем две абсолютно одинаковые фразы, одна из которых сказана неизвестным, а другая подозреваемым, то их, представленных в графическом виде (например, в виде осциллограммы), можно банально наложить друг на друга в любом графическом редакторе. И сравнить. Недостаток этого метода в том, что нужно искать именно одинаковые фразы, причем достаточно длинные, для наглядности. Во-вторых, метод можно усовершенствовать. Мы ведь помним про частоту основного тона, которая формируется легкими и голосовыми связками и которая тоже индивидуальна для каждого человека. Теперь представим звуковую волну в виде кривой на графике, где по оси Х откладывается время, а по оси У — амплитуда колебаний. Продолжая вспоминать школу, прикинем, что для определения площади под этой кривой нужно вычислить интег рал.

При этом большую часть времени звуковая волна, естественно, зависит именно от частоты основного тона, а не от пиковых значений, выдаваемых организмом на ударных гласных. И если добавить к значению интеграла еще и различные параметры, вроде среднего значения компонент амплитудночастотного спектра речи, вариации по времени огибающих спектра речи и коэффициентов кросскорреляции, то результаты подобного интегрального анализа тоже будут строго индивидуальны для каждого человека. И проводить подобный анализ можно на любом по длительности и произвольном по содержанию фрагменте речи.

До сих пор мы говорили только об акустической составляющей звука. А теперь давайте прислушаемся к тому, что, собственно, говорит человек. И здесь мы видим следующие признаки речевого потока в целом:высота голоса, тембр, артикуляция, темп речи, длительность и заполненность пауз, интонация. Можно также рассматривать, имеются ли запинки, общую сложность и грамотность речи. Ясно, что речь академика при таком подходе будет сильно отличаться от речи биндюжника.

Если опуститься на уровень ниже, то можно выделить для анализа признаки фраз и слов. Среди них наиболее показательны особенности синтаксических конструкций (простые или сложные, с повторами или без), употребление пояснений/уточнений, завершенность фраз, употребление нецензурных и вводных слов, просторечная лексика, слова-паразиты, расстановка ударений.

Опускаясь еще ниже, к звукам, можно выделить такие особенности, как качественное произнесение гласных и согласных, которые бывают передне- и заднеязычными, губными и ртовыми. И по каждой гласной и согласной могут проявиться какие-то присущие только конкретному человеку особенности.

Резюмируя все вышесказанное, мы придем к выводу, что если вы будете говорить через платок на телефонной трубке, имитировать кавказский акцент, выбьете себе пару зубов, прикусите язык и заболеете туберкулезом, то и тогда оставшихся индивидуальных признаков вполне хватит для вашей полной и безоговорочной идентификации.

Однако у таких сильных индивидуальных особенностей в речепроизношении, называемых по-научному естественной вариативностью речи, есть и положительные моменты. Читатели "КТ" наверняка слышали о системах голосового управления компьютером, типа отечественной "Горыныч". Они заставляли сначала произнести в мик рофон нужные команды, а затем, услышав эти команды от вас, должны были их выполнять. Но не работали. И постепенно, совершенствуясь, вымерли.

Как и штатовская система Echelon, на которую потратили многие миллиарды долларов. Она должна была вести постоянный мониторинг телефонных и радиопереговоров, а услышав некие ключевые слова, включать системы записи и вычислять пространственные координаты говорящего. Отечественные системы, к счастью для налогоплательщиков, обошлись не так дорого, но продемонстрировали точно такое же отсутствие результатов.

Предыдущая страница

Следующая страница

ЛитЛайф

Жанры

Авторы

Книги

Серии

Форум