Вычислительные системы, сети и телекоммуникации. Лекции
Рефераты >> Программирование и компьютеры >> Вычислительные системы, сети и телекоммуникации. Лекции

ТЕКСТОВЫЕ ПРОЦЕССОРЫ

1. Виды текстов.

Все современные вычислительные машины имеют пакеты прикладных программ. На автоматизированных рабочих местах пользователей происходит централизация пакетов и их интеграция.

Интеграция ППП требует от пользователя достаточно высокой квалификации. Многие пакеты содержат не только прикладные проги, но и имеют встроенные средства разработки приложений.

Изначально все ВМ создавались для автоматизации вычислителей. Однако в настоящее время доля чистых вычислений мала - 9-10%, а остальное время уходит для обработки специфических видов информации. Доля обработки текстов, справок - 20% - для обработки графики.

Для обработки специфической информации (текстовой, графической, рисунков, фотографий) современные классические структуры ЭВМ подходят плохо. Только в последних разработках CPU Pentium MMX включены 57 новых команд для обработки специальной информации.

Суть команд: большой операцией можно обрабатывать большое количество точек находящихся на экране.

Программное обеспечение связанное с обработкой текстов получило название текстовых процессоров.

С каждым текстом связаны определенные особенности.

Текст - документ.

С понятием документа связано 4 аспекта:

1 аспект - содержательный, предполагает ясность и точность изложения, лаконизм достоверность информации, ее полнота, своевременность.

2 аспект - изобразительный (как выглядит документ). Визуальное впечатление от документа, какие средства использованы, шрифт, стиль, рубрикация документа.

3 аспект - операционный (какие средства использованы для подготовки документа)

4 аспект - внутримашинный (способ обработки и хранения). Он показывает, какая память нужна для обработки документа, какие средства должны привлекаться для работы документа.

Различают следующие виды документов:

1. Прозаический (от справки)

2. Табличный (символы)

3. Программный текст (для записи различных программ). Исторически этот тип появился первым.

Практически любые ППП содержат собственные средства для разработки собственные прог. Например: турбо-паскаль, турбо-си.

4. Поэтический (четверостишья и т.д.)

5. Графический (нет определяющих символов, а поле экрана предоставляется в определенной яркости и цветности). Каждая точка 16 цветов. Наиболее простые текстовые процессоры вместо графики используют псевдографику (для построения таблиц и т.д.).

6. Формульный текст (наличие строк, подстрок). Имеются верхние и нижние индексы.

7. Шаблонный

8. Смешанный (включающий любые сочетания из перечисленных).

2. Классификация текстовых процессоров.

В зависимости от используемого программного обеспечения пользователь имеет дело с различными текстовыми редакторами. Все они различаются своими возможностями и используемыми средствами.

В порядке нарастания их мощности:

1. Самые простые - встроенный редактор ДОС (F6 + ctrl Z) позволяет работать только с одной строчкой.

2. Встроенный редактор Norton, до 32 кб (позволяет обрабатывать до 20 страниц).

3. Редакторы компьютерных прог (турбо-паскаль, турбо-си).

4. Общепользовательские редакторы (Word, Lexicon, Multedit (только тексты), Wordstar).

5. Редакторы научных документов, использующихся для записи формул Unveditor, Chiwriter, Rt-chk.

6. Редакторы издательских систем. Имеют большой спектр для разработки издательских документов большой сложности (Word (самая маломощная), Page Marker, Ventura Publisher.

Размещение текстов по странице - верстка.

7. Корректоры текстов (исправляющие ошибки).

Спеллеры - средства для обнаружения ошибок, воспроизведение текста. Orfo.

8. Перекодировщики текстов. В интернете существует 4 различных кодировки текста.

3. Основные операции.

Любой текстовый процессор должен содержать следующие процедуры:

- процедуры набора и ввода текста

- редактирование текста

- печати документов

- ведение архивов

1 символ - 1 байт

256 различных комбинаций

Кроме стандартов имеются символы управляющие печатью. Управляющие символы включают в действие определенные проги.

Нажатие на enter, означает то, что в стандартном буфере данных, рассчитанном на 80 символов, закончить заполнение буфера на данной позиции. Содержимое буфера поместить в оперативную память, затем очистить. Буфер и курсор поместить в начало буфера для заполнения.

4. Тенденции развития.

4.1. Понятие гипертекста.

В настоящее время большое количество текстовых документов оседает в хранилищах автоматизированных данных, например в интернете. Организация хранилища, выборки и обработки текстовых документов предполагает их формализацию. При этом эта формализация несколько скрыта от пользователя.

Формализация в процессе поиска осущест. сл. обр.

1. Выявляются признаки, по которым мы будем осуществлять поиск необходимых документов. В количестве таких документов берутся ключевые слова.

Обычно в качестве ключевых слов рассматривают корни основных терминов + суффиксы.

Кроме ключевых слов каждая отрасль оперирует ключевыми понятиями. Это группы слов или определенные значения известных слов.

Словарь ключевых понятий называется «тезаурус». В пространстве ключевых понятий каждый документ образует своеобразный вектор. Вес каждого понятия определяется частотой его повторения в документе. Для поиска необходимых документов составляется поисковый образ, вектор которого показывает какой документ нам требуется.

Пример: А=16 (1), 27 (3), 195 (4), 327 (1), 592 (3).

16 - 16 слово

(1) - встречается 1 раз

Предположим, что в документе Д1 - 16 (2), 82 (3), 195 (2), 327 (2), 984 (2).

16 слово - 2 разряда

Белый шум - это выдача ложных сообщений на поисковый образ.

Чтобы ослабить влияние белого шума используется обратная связь. Обратная связь пользователей, в которой он дает свое отношение к результатам поиска позволяет усилить или ослабить веса отдельных составляющих вектора, что позволит в большей степени учесть интересы пользователей и усилить эффект работы системы.

4.1. Ключевые слова в документе позволяют провести нелинейную организацию текста. При этом поиск данных и их обработка осуществляется ассоциативно.

В интернете существует язык HTML - позволяет описывать ключевые слова в гипер-тексе.

4.1.2. Продукты мультимедиа предполагают дополнение гипертекста звуковыми и видео эффектами, что усиливает психологическое и эмоциональное воздействие на человека. Считается, что 70% информации человек принимает через органы зрения, 20% через органы слуха, смысловой канал - 8%.

Все продукты мультимедиа затрагивают в основном программное обеспечение ЭВМ, однако количественное воспроизведение звуковых и видеоэффектов накладывает требования и на технические средства. Продукты мультимедиа находят свое применение в интерактивных видеодисках (игры). Мультимедиа - различные тренажеры (летчики), обучающие среды, изучение различных новых технологий.


Страница: