Машины, которые говорят и слушают
Рефераты >> Кибернетика >> Машины, которые говорят и слушают

Уффективное решение этих проблем, по-видимому,потребует построения такой системы, в которой последовательность процедур заключительной обработки чувствительна к различным сотрудничающим и конкурирующим отношениям между гипотезами, ато означает, что семантико-синтаксическая обработка облегчается на гипотезах, поддержанных одновременно несколькими источниками знаний, и задерживается на гипотезах, которые конкурируют, не согласуются с очень надежной гипотезой. Задержка гипотезы должна быть достаточно гибкой, недетерминистской, неокончательной, так как и слабая гипотеза при интерпретации высказывания может оказаться верной. Гибкая задержка осуществляется в Hearsay- П механизмом фокусировки внимания, который распределяет ресурсы так, чтобы в первую очередь рассмотреть наиболее обещающие гипотезы.

Синтаксические и семантические знания о проблемно-ориентированном языке Hearsay-П выражаются в компактной, легко читаемой грамматике» которая задается параметрическими структурными представлениями (PSR), являющимися множеством пар типа "определение - объект". psr используются для определения класса слов и фраз, которые могут выполнять синтаксические и семантические функции проблемно-ориентированного языка, состоящего для Hearsays И из простых вопросов. Например, psr:

($СЪА35: $QUEPY, $HAME: "PAPSED QUEPY", 6 : $QinME + $flfHAT,

El ТЕ L Ь +'$ ME + $ПЕ + ФТОПСЗ, 6 » WHAT + HAPPENED + $ АЮТ AY, e s WHAT + ф BE + THE + $N EWS+tRE + ^TOPICS

ЦСТЮМ t PASS, $LEV EL ! 300)

определяет класс возможных вопросов в терминах их альтернативных синтаксических реализации, аначок ® обозначает принадлежность к классу. Каждая член класса - это последовательность эталонов, составляющие которых, разделенные знаком "+", слова или фразы. «разовые сосгааяяшеи» помечаются значком $ и определяются в

32

свою очередь другими psr. faction pass означает, что реакция блока ЗАЗЗна распознавание люоого из пяти эталонов в классе должна трактоваться как признак вопроса ( $query ) .»level оценивает относительную завершенность частичного грамматического разбора, лежащего в основе гипотезируемой фразы PSR:

6 : $CL ASS ! $TOPICS,

ЈPL АСЕ,

$FOOD,

$TECHNOL ОСУ,

$ С OVER NT.IE:IT,

ФР01Т1Т1С,

$PEOPL E,

e ; $TOPICS + SCONJUN CTICOT + 3>TOPIG S, 6 : CACTIOH : PASS, LEVEL : 40)

и определяет класс возможных предметов разговора (.Topice) в терминах их семантических подклассов.

Как уже упоминалось, sass имеет набор сильных и слабых средств, представляющих различные виды обработки информации на синтаксическом и семантическом уровнях.

1.Правило распознавания порождает гипотезу о фразе по достаточно надежным гипотезам о составляющих фразы. sass рассматривает слова распознанными, если их оценки (в очках), определенные другими источниками знанчй, превышают некий порог. Составляющие фразы должны также удовлетворять некоторым структурным требованиям - например, таким, как временная смежность между составляющими. Правила распознавания ведут обработку снизу вверх, двигаясь от частичного грамматического разбора к полному. Они представляют собой сильные средства обработки (сила оценивается вероятностью того, что последовательность распознанных составгчющих может как-то осмысленно интерпретироваться) .

2. Правила предсказания гипотезируют сио-во или фразу в зависимости от вероятности контекста, определенного на предыдущих этапах распознавания высказывания. Правила предсказания выполняют обработку, перекрывая временной ин-Тврвая "островками надежности". Эти правила необходимы потому, что не все слова в произнесенном высказывании могут быть рас-чознаны снизу вверх, т.е. источниками знаний нижних уровней. ^ияа правила предсказания определяется условной вероятностью того, что предсказанные составляющие могут быть в высказывании при

Денном (распознанном ранее) контексте, ата сила обратно пропор-'тонаяьна числу составляющих,которые могут появиться в этом контексте.

Зак.480

3. Правила повторного разбора ( res-pelling rules ) производят обработка7 сверху вниз и численно оценивают составляющие предскапанной фразы, разбивая гипотезируемое предложение на гипотезы для последовательных составляющих или же "расщепляя" гипотезируемый класс на альтернативные гипотезы для различных составляющих высказывания. Правила повторного разбора (прочтения) проводят обработку, возвращаясь к словесному уров. ню, так что предсказание (о фразе) верхнего уровня может быть подвергнуто испытанию (слово за словом) источниками знаний нижнего уровня, если на верхнем уровне что-то не сходится.

4. Правила постдикции несЭходимы для того, чтобы уже после сформирования понятия подтвердить его большим числом "очков доверия", дать ему более высокую оценку, подтвердив существующую гипотезу о фразе другими гипотезами. Правила постдикции как более сильные включают правила предсказания и повторного прочтения, которуе слишком слабы, чтобы подтвердить создание гипотезы, но могут внести полезный вклад, когда гипотеза уже существует. Правила постдикц^и выполняют три функции:

а) позволяют объединять выводы, поддерживающие оцениваемую гипотезу на основе различных источников знаний;

б) дают воамсвность гилотеэирсвать слова и фразы с низкими первоначальными оценками за счет их распознавания на основе контекста»

в) способствуют фокусированию внимания на главных направлениях, определяемых возрастанием очков гипотез тех слов, которые контекстуально возможны (и таким ооразом могут считаться правильными), так что обработка высказывания в этих направлениях происходит по списку приоритетов в первую очередь.

Автоматическое превращение описательной информации о грамматике языка -Hearsay- П , заданной параметрическими структурными представлениями ( psr), в процедурную форму осуществляет ком-пиллятор суытет , который транслирует эти представления в правила распознавания, предсказания, повторного прочтения и постдикции. cvshet разбивает последовательности слов, составляющих высказывания и представленных PSR, на пары последовательных эталонов, формируя новые подпоследовательности и порождая для них соответствующие правила [ 13Й 3 .

Одна из самых интересных систем автоматического распознавания слитной речи - система harfy, разработанная по проекту arpa (США, Питсбург). Эта система по сравнению с другими разработками, проводившимися по этому проекту [l5lj,наиболее близка к практическому использованию. Словарь harpy составляет ЮН словоформ - слов телефонной информацион-

34

но-справочной службы о новостях. При испытаниях harpy была получена точность распознавания фраз, равная 95% на обучающей выборке и 92^ на контрольной. Система воспринимает слитную речь, не содержащую стилистических ошибок. В harpy информация о языке представлена фонетическим графом - интегральной сетью переходов с конечным числом состояний, не учитывающей априорные вероятности переходов. Распознавание осуществляется сравнением входной реализации, представленной маркированными сегментами, с этой сетью.


Страница: