Машины, которые говорят и слушают
Рефераты >> Кибернетика >> Машины, которые говорят и слушают

При объединении фраз, име'"'аих нарастающую каденцию, частота 7» яосле возрастания на конце первой фразы начинает оинусоидадь-"0 уменьшаться на границах между фразами. Сяад частоты начина-

1)Ййу«Моп80 мс ifiP начала второй фразы и имеет общую длительность, «-""ую 190 мс. Далее f продолжает уменьшаться ооТторосгыо пол-

'°на в I с. ^

В конечных фразах синтезируемого высказывания, где сущест­вует каденция типа FC, в начале фраз fg соответствует частоте основного тона, которая определяется предшествующей • нарастающей каденцией. Однако за 80 мс до начала гласного ^.определяющего главное ритмическое ударение, /д начинает синусоидально умень­шаться в течение 190 мс до величины, равной двум полутонам по отношению к основному тону в начале предложения. Далее f про­должает уменьшаться со скоростью полтона в I с, пока не закон­чится предложение.

Изменение основного тона на ударных слогах зависит от то­го, какой гласный содержит ударный слог: короткий или длинный. В обоих случаях 5-тип основного тона состоит из нарастающего и падающего участков. Это нарастание начинается за 80 мс до на­чала гласного и продолжается для коротких слогов 160 мс,для длин­ных - 240 мс. Такое же время продолжается и синусоидальный спад для слогов первого и второго типа. В зависимости от силы ударе­ния подъем частоты основного тона лежит в пределах от двух до пя­ти полутонов, а спад - от полутона до двух полутонов.

Исследования по управлению просодическими параметрами опи­саны в [122] . В [2, 103, 104, 163] приводятся исследования различных синтаксических структур и их влияние на микро- и мак­ровариации частоты основного тона в английской речи.Результатом исследований был алгоритм, определяющий динамику основного тона синтезированной английской речи. Алгоритм рассматривается как пос­ледовательность двух уровней единой системы, формирующей контур основного тона. На первом (высшем) уровне учитывается влияние синтаксической и семантической информации, на втором (низшем) -информации о фонемной цепочке и лексическом ударении (рис.1.3).

оинтаксическая

Система верхнего уровня

Просодические

Система нижнего уровня

УР в-

информация Семантическая

индикаторы

информация

 

Фонетическая

J •

• \ Конт

осно ного

информация Информация

Рис. 1.3. Структура алгоритма, определяющего динамику основного тона синтезированной речи

62

рассмотрим далее алгоритм, реализующий формирование контура основного тона для высказывания, в общем случав содержащего нес­колько предложений, каждое из которых разбивается на фразы, со­стоящие из нескольких слов. Для формирования контура основ­ного тона на вход системы высшего уровня поступает информация о типе высказывания, границах и типах предложений, границах и типах фраз, а также о том, какой частью речи является каждое сдово. Слова упорядочены по степени важности, причем к словам, не входящим в список важных, относятся артикли, союзы, отно­сительные местоимения, предлоги, вспомогательные глаголы и личные 1|еетоимения. Для каждого высказывания формализована его синтак­сическая структура, т.е. для ввода производится идентификация синтаксических единиц: выделяются независимые или зависимые пред-яожения, внутри которых локализуются и маркируются фразы сущест­вительного, фразы глагола, предложные фразы, фразы, связанные с прияагательным или употребляющиеся в качестве прилагательных, фразы, соответствующие наречиям. В системы вводится также ин­формация о специальных фразах и пунктуации, определяющая тип мамровариаций основного тона:

а) обычные вопросительные и звательные фразы, характеризую­щиеся повышением частоты основного тона;

б) знаки цитирования и восклицания, усиливающие изменения частоты основного тона внутри своих областей;

в) "ответвления" фраз (куски высказываний со скобками или тире), уменьшающие динамику основного тона;

г) знак вопроса в конце предложения, дающий тон типа В для каждого независимого предложения, не содержащего вопроситель­ного слова; остальные предложения, дающие тон типа А.

Влияние семантики на контур основного тона учитывается ак-центацией слов, их ранжированием по степени важности, а также временной близостью одинаковых слов. Каждое существительное, гла­гол или прилагательное высказывания запоминаются в буферной ма­газинной памяти, способной хранить до 50 слов. Новые слова срав­ниваются с содержимым буфера. Для каждого сравнения характер изменения коррелируется с тем, на каком месте буфера на­ходится слово, с который сравнивается вновь поступившее. Чем ближе находится слово, аналогичное входному, тем более высокая степень редукции /д .

Типы тона А и В характеризуются следующим: тон типа А вы­зывает снижение /д на всем предложении, а также резкое паде­ние его на последнем важном (значащем) слове и после этого.

63

Тип В означает относитеяьно пологую /д с резким подъемом в конце предложения. Эти типы тонов характеризуют глобальный уро­вень иерархии в рассматриваемой системе.

Предложения, не являющиеся конечными (т.е. уже не связан­ные с типом тона), характеризуются подъемом fy на первом зна­чащем слове и его падением на последнем значащем слове (падении меньшем, чем при тоне типа А), после чего начинается новый пос­ледовательный подъем. Размах "понижение - нарастание" частоты ос­новного тона fy зависит от идентичности предыдущему следую­щего предложения: если за предвдущим следует независимое пред­ложение, то изменение основного тона на стыке больше, чем в слу­чае, когда второе предложение является зависимым. Более того, если в высказывании остается единственное зависимое предложе­ние, то подъем основного тона после завершения независимого пред. ложения пропадает вообще. Весь участок "падение - подъем" основ­ного тона может не выявиться, если границы независимого предло­жения включают начало ограниченного вводного предложения (в зави­симости от числа слов, предшествующих границе: чем меньше слов, тем меньше Провал "падение - подъем fg ").

Внутри каждого предяожения в дополнение к изменению на гра­ницах предложений происходят изменения /д и на границах фраз в зависимости от числа "важных" слов в каждом предложении. Каждая фраэа с двумя и болев такими словами выделяется таким образом, что ее начало совпадает с нарастанием частоты основного тона, а завершение - со снижением и последующим подъемом. Изменение ча­стоты основного тона на границах фраз зависят от числа "важ­ных" слов фразы, т.е. фразам с большим числом таких слов соот­ветствует больший "провал" частоты основного тона; увеличивают этот провал также границы, помеченные знаками пунктуации. Внутри фраз начальный подъем fy продолжается на первом важном слове, а падение заканчивается на последнем важном слове этой фразы с неким подъемом к концу фразы. Все остальные важные слова "полу­чают" подъем и снижение /д примерно одинаковой величины.


Страница: