Переводчик
Рефераты >> Информатика >> Переводчик

Генеральный словарь нельзя редактировать. Однако Вы можете открыть словарную статью из Генерального словаря, откорректировать ее, а затем сохранить в своем пользовательском словаре.

Пользовательский словарь

Пользовательский словарь - это словарь, который Вы можете создавать и пополнять самостоятельно. В него Вы можете вводить новые слова и словосочетания, а также сохранять измененные словарные статьи из других словарей, включая Генеральный. Количество пользовательских словарей не ограничено.

Зарезервированное слово

Зарезервированное слово - это слово (словосочетание), которое помечается во входном тексте как не требующее перевода. Чаще всего это бывают имена собственные, аббревиатуры, специальные наименования, совпадающие со значимыми словами (например, 'Windows 95', 'Miami Beach', 'Bill Gates'). Такие слова могут выводиться в тексте перевода символами исходного языка или транслитерироваться. Если Вы дополнительно укажете семантический класс, к которому можно отнести такое слово, это позволит упростить анализ структуры входного предложения и, следовательно, получить наиболее корректный перевод.

Макрос

Макрос (сценарий, скрипт) - это программа, написанная на одном из скриптовых языков, и использующая предоставляемую данным приложением объектную модель для настройки приложения или расширения его функциональности.

Препроцессор

Препроцессор - это набор функций, предназначенных для предварительной обработки входного текста с целью исключения из перевода или преобразования в соответствии с нормами выходного языка некоторых конструкций.

Стандартный препроцессор

Стандартный препроцессор – это препроцессор, позволяющий программе исключать некоторые конструкции из процесса перевода и либо оставлять их без изменений, либо трансформировать, согласно правилам языка, на который осуществляется перевод. Это могут быть имена файлов или адреса электронной почты, служебные символы, дата и время и т. д.

Тематика документа

Тематика документа - структура, созданная на базе выбранного шаблона тематики, наследующая все его компоненты, но, возможно, модифицированная в процессе работы.

Тематика документа позволяет настроить систему на качественный перевод документа, подбирая оптимальное сочетание компонентов тематики.

Шаблон тематики

Шаблон тематики включает следующие основные объекты:

  • Упорядоченный список подключенных словарей
  • Список зарезервированных слов
  • Упорядоченный список подключенных препроцессоров

Помимо этих основных объектов, шаблон тематики может включать некоторые расширенные свойства:

  • Ключевые слова
  • Базы переводов Ассоциированной памяти
  • Макросы
  • Алгоритмы перевода
  • Транслитерация незнакомых слов

Редактирование расширенных свойств шаблонов тематик доступно НЕ во всех приложениях системы перевода.

На основании шаблона тематики создается тематика документа.

На основании одного шаблона тематики может быть создано произвольное количество тематик документов (наследующих все компоненты шаблона), которые могут модифицироваться в процессе работы.

Общие принципы работы со словарями

Логика работы со словарями основывается на базовом принципе ядра систем машинного перевода семейства PROMT XT Family: словарь – это объект со своими свойствами.

Работа со словарем-объектом осуществляется при помощи стандартного диалога редактирования словарей.

Возможны следующие операции со словарями:

  • Создание нового пользовательского словаря-объекта;
  • Удаление пользовательского словаря-объекта;
  • Сохранение пользовательского словаря-объекта в файле архива словаря (файл с расширением .ADC);
  • Загрузка пользовательского словаря-объекта из файла архива словаря (файл с расширением .ADC);
  • Загрузка (с предварительной конвертацией) пользовательского словаря-объекта из файла пользовательского словаря версии PROMT 98 (файл с расширением .UDC).

Словарь-объект может создаваться тремя способами:

1. При помощи стандартной операции создания нового пользовательского словаря.

2. Загружаться в систему:

o Из файла архива словаря (файл с расширением .ADC)

o Из файла пользовательского словаря, созданного в более ранних версиях системы (файл с расширением .UDC)

3. При инсталляции специализированных словарей - программой Инсталлятор словарей и шаблонов тематик.

Основные отличия логики работы со словарями от PROMT® 98 и более ранних версий:

1. При загрузке архива словаря в систему все изменения, произведенные над словарем-объектом не будут отражены на файле архива словаря до тех пор, пока не будет явным образом выполнена команда Сохранить в архив словаря.

2. При загрузке в систему пользовательского словаря, созданного в предыдущих версиях системы (файл с расширением .UDC), производится его конвертация в формат PROMT XT Family. Сохранить измененный словарь можно только в архив словаря (файл с расширением .ADC), при этом его никак нельзя будет использовать в PROMT® 98 и более ранних версиях.

3. При удалении пользовательского словаря-объекта из системы у пользователя есть возможность предварительно сохранить словарь-объект как файл архива словаря.

4. Принципиально изменилась логика: словари не подключаются к системе как файлы (было в PROMT® 98 и более ранних версиях), словари существуют только внутри системы. Из системы словарь можно сохранить в архив словаря (файл с расширением .ADC) и вновь загрузить из этого архива словарь в систему, но при работе со словарем никакой физической связи между словарем в системе и файлом архива словаря не существует!

Основные объекты: "Шаблон тематики" и "Тематика документа"

Основными средствами настройки систем перевода семейства PROMT XT Family на перевод текстов из различных предметных областей являются:

  • Подключение специализированных и пользовательских словарей, соответствующих предметной области переводимых текстов;
  • Организация правильной иерархии поиска слов и терминов в подключенных словарях;
  • Использование списков зарезервированных слов;
  • Использование специальных препроцессоров для правильной обработки последовательностей символов специального вида (например, электронных адресов или URL).


Страница: