Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение




НазваниеБаталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение
страница3/18
Дата30.09.2012
Размер2.08 Mb.
ТипУчебное пособие
1   2   3   4   5   6   7   8   9   ...   18

1.1. ОБЩАЯ ХАРАКТЕРИСТИКА

ЭТАПОВ ОБРАБОТКИ ДОКУМЕНТОВ




1.1.1. Общие сведения о работе с текстом


В данном разделе учебного пособия рассматриваются основные понятия, задачи и методы обработки текстовой информации с помощью средств персональной вычислительной техники. Рассматриваемая тематика является очень обширной и разноплановой, поскольку большинство воспринимаемой человеком информации, так или иначе, передается в виде текста.

При изучении материалов пособия выделяются следующие основные этапы обработки текстов:

  • ввод текста;

  • редактирование и сохранение документа;

  • публикации, поиск и открытие созданного документа;

  • изготовление больших и сложных текстовых документов, перевод текста.

Рассмотрим в сравнительной характеристике основные условия выполнения этих выделенных этапов.

1.1.2. Технологии ввода текста


На современном этапе развития компьютерных технологий ввод текста может осуществляться несколькими разными способами: набором текста с помощью клавиатуры компьютера; рукописным вводом; голосовым вводом; переводом бумажных документов в электронную форму.

Набор текста с помощью клавиатуры компьютера

Данный способ является самым распространенным применимо к текстовым редакторам и процессорам (Лексикон, AmiPro, MultiEdit, WordPad Microsoft Windows ХР, Word Perfect, Microsoft Word), настольным издательским системам и системам верстки (Corel Ventura Publisher, Adobe PageMaker, QuarkXPress), а также специализированных программ (например, редакторов научных текстов ТЕХ и MathOr). Для исключения грамматических ошибок в выпускаемых документах, книгах, газетах и других изданиях, предназначены программы проверки правописания (спеллеры или спелчекеры от английского spelling checking - проверка орфографии), Орфо, Lingvo Corrector, Пропись, Глагол, Корректор, SpellRus, Арф. Современные версии текстовых процессоров имеют встроенные системы проверки орфографии и грамматики, а также словари синонимов (тезаурусы).

При исключении операций редактирования и форматирования текстового документа в текстовом редакторе он представляет собой простейший технологический процесс. Однако в любом случае исполнения пожеланий заказчика или публикации текстового документа в начале набора текста требуется правильно выбрать используемый шрифт. Это очень важно также при наборе текстов в настольных издательских системах и системах верстки.

Начиная с XV века, разработкой шрифтов для книгопечатания занимались многие художники. Некоторые шрифты того времени применяются до сих пор (например, шрифт Клода Гарамона, на основе которого создана оцифрованная и русифицированная версия шрифта ITC Garamond). Первыми компьютерными шрифтами являются векторные и растровые типы шрифтов. Модификацией векторных шрифтов являются контурные шрифты.

Векторные шрифты отличаются от растровых по способу описания символов. Символы векторных шрифтов задаются в виде набора векторов, определяющих перемещение пера графопостроителя по носителю или электронного луча в трубке векторного дисплея. Эти шрифты имеют ограниченное применение, связанного с ограниченностью в применении выводных устройств векторного типа.

Растровые шрифты используется для вывода на экран дисплея и растровые устройства, (например матричные принтеры). Для печати с помощью лазерных принтеров либо для электронных публикаций их не применяют, так как обладают плохим качеством печати. Символы растровых шрифтов задаются матрицами, что приводит их к невозможности в масштабировании, поворотам, наклонам (трансформациям). Изменение размера или начертания шрифта происходит путем замены одного растра на другой. Преимущество – простота и быстрота программной процедуры вывода на печать.

Контурные шрифты отличаются от векторных тем, что их символы задаются в виде набора отрезков и гладких кривых, имеющих точное математическое описание. Для этих шрифтов больше возможностей для трансформации, но для вывода символов на растровое устройство необходима специальная программа – растеризатор. Они находят наибольшее применение, хотя и поддерживаются не всеми платформами.

Контурные шрифты получили распространение после 1985 г., когда фирма Аdobe выпустила стандарт шрифтов PostScript Type1 совместно с языком описания страниц PostScript. К наиболее распространенному стандарту этих шрифтов относится True Type в совместной разработке фирм Apple и Microsoft. Контурные шрифты True Type поддерживают до 65535 символов и отличаются от шрифтов Type 1 конструкцией построения контуров. Основой построения контуров Type 1 являются кривые 2-го порядка, а шрифтов True Type – модифицированные кривые 3-го порядка (кривые Безье).

Преимущества шрифтов Type 1: а) контуры символов более гладкие из-за отсутствия изломов в точках сопряжения; б) в контурах требуется меньшее количество точек, что снижает объем хранимой информации. Но в связи с необходимостью работы в интегрированной среде Windows большинство пользователей применяют шрифты стандарта True Type. На основе двух этих стандартах различные фирмы разрабатывают конкретные виды шрифтов.

Для настройки шрифтов в комплекте Windows необходимо выполнить команды: >Пуск >Настройки >Панель управления. В появившемся окне необходимо дважды щелкнуть левой клавишей мыши на знаке >Шрифты. В соответствующем окне появляется список шрифтов, из которого можно выбирать соответствующие виды из предлагаемых визуально внешних форм (написание букв, цифр, знаков препинания и т.д.).

Разработкой эксклюзивных шрифтов занимаются ряд фирм – ПараГраф (Россия); FontShop (Германия), Signature Software (США) и пр. В случае новой разработки фирма предлагает клиенту бланк, на котором пишутся отдельные буквы и фразы. Затем изображения сканируются, вводятся в компьютер и на основе профессиональных шрифтовых программ преобразуются в компьютерный шрифт.

Набор текста рукописным и голосовым вводом

Рукописный и голосовой способы набора текстов пока не находят широкого применения, хотя были разработаны и внедрены более 30 лет назад. Основными причинами этому являются дороговизна их разработки и сложности в реализации. Оба эти способа имеют ряд специфических преимуществ.

Рукописный ввод активно начал внедряться в последние 5–7 лет и реализуется преимущественно в составе портативных компьютеров (электронных записных книжках). При этом ввод данных организуется с помощью устройства, называемого электронным пером, внешний вид которого напоминает форму обычного карандаша. К основным платформам относятся Palm, PSron, Windows CE, Newton и д.р. D некоторых компьютерах наряду с рукописным вводом используется и голосовой ввод.

Голосовой ввод наибольшее применение находит в компьютерных устройствах управляющих технических систем, систем робототехники, телефонии и пр. Примером является управление сотовым телефоном с помощью голосового сигнала. Примером использования программ надиктовки является система Via Voice, система автоматического распознавания русской речи «Горыныч».

Программа «Горыныч» позволяет выполнять голосовой ввод текстов в компьютер в любом редакторе под управлением ОС Windows 3x / 9x / 2000x / NT. Ядром этой системы является американская программа Dragon Dictate. Скорость голосового набора текстов достигает до 500–700 печатных знаков в минуту и зависит от производительности, типа используемого компьютера. Программная система «Горыныч» осуществляет автоматический контроль правописания. Во время работы допускается дополнительное использование клавиатуры и манипулятора мыши.

Очевидно, что в ближайшем будущем рынок средств вычислительной техники будет перераспределяться в пользу ввода данных без помощи клавиатуры или с минимальным ее использованием.

Перевод бумажных документов в электронную форму

Необходимость такого преобразования обусловлена тем, что многие документы имеют форму бумажных изданий (деловые письма, чертежи, финансовая документация и т.д.) в виде трудно различимых факсов и ксерокопий. Чтобы иметь возможность быстро и правильно редактировать такие документы, а также публиковать их в различном виде, и возникает потребность в устройствах, обеспечивающих создание электронного образа бумажного документа. Такими компьютизированными устройствами являются сканеры.

Сканер – это устройство для считывания графической и текстовой информации в компьютер. Сканеры (вместе с соответствующим программным обеспечением) могут вводить в компьютер рисунки, а также распознавать символы, что позволяет быстро вводить напечатанный (а иногда и рукописный) текст в компьютер.

Устройства сканирования текстов подразделяются на две категории – узкоспециализированные (например, для работы с документами форматов А1 и А0) и универсальные. Для работы пользователей применяют универсальные ручные и автоматизированные сканеры. Ручные сканеры неудобны в работе и не могут обеспечивать удовлетворительное качество сканирования.

К автоматизированным типам сканеров относятся планшетные, слайдовые сканеры, сканеры апертурных карт, сканирующие головки. Из них наиболее предпочтительными являются планшетные типы сканеров. Они позволяют сканировать графические объекты сброшюрованных документов. На рис. 1.1 представлен общий вид сканера типа Mustek 1200 UB, на чувствительной поверхности которого расположен сканируемый документ.





Рис. 1.1. Вставки документа в сканер типа Mustek 1200 UB


В процессе сканирования документа верхняя крышка сканера опускается для световой герметизации. При работе с текстами на выходе процесса сканирования получаются неструктурированные данные, а лишь переведенная в электронную форму информация о внешнем виде отсканированного текстового фрагмента. Для восстановления смыслового содержания текста по его изображению используется специальный класс ПО, получивший название программ распознавания образов – OCR.

На российском рынке программных продуктов преимущественное использование находит пакет Fine Reader. FineReader - это система оптического распознавания текстов, предназначенная для преобразования полученного с помощью сканера графическое изображение (картинку) в текст (т.е. в коды букв, «понятные» компьютеру). Этот пакет был разработан российской компанией ABBYY и внедрен на рынке в июле 1993 г. Ее альтернативой является система CuneiForm компании Cognitive Technologies.

Общее качество сканируемого изображения определяет метод, которым сканер собирает данные. Каждый класс сканеров (планшетный - flatbed, с подачей листа - sheetfed, ручной – handheld и барабанный - drum) имеет собственный базисный метод для проведения просмотра. При этом к наиболее важным характеристикам устройства сканирования относятся разрешение сканирования и порог чувствительности.

Разрешение сканирования учитывается в специфике работы устройства. В процессе сканирования документ проходит над сканирующей линейкой, состоящей из нескольких камер (обычно не более трех). Эти камеры во многом похожи на фотоаппараты, которыми мы пользуемся в обычной жизни, за тем исключением, что изображение фиксируется не пленкой, а массивом CCD. Массив состоит из нескольких тысяч светочувствительных регистрирующих элементов (приборов с зарядовой связью), расположенных в ряд. На рис. 1.2 показан общий вид линейки сканирования в ходовой части устройства, расположенной под цветопрозрачной плоскостью (стеклом).





Рис. 1.2. Общий вид ходовой части сканера с линейкой сканирования


Когда свет попадает на массив, каждый элемент генерирует электрический сигнал – чем больше света, тем выше сигнал. Сгенерированный каждым элементом сигнал, называемый пикселем, затем конвертируется в цифровое значение от 0 до 255 (что называется значением в шкале серого). Поскольку массив одномерный, необходимо двигать документ (или считывающее устройство), давая камерам возможность захватывать изображение построчно. Каждая из этих строк называется строкой сканирования. Собрав все строки сканирования, мы получим полный рисунок изображения. Разрешение в современных моделях сканеров формата АО не превосходит 400 DPI (точек на дюйм).

Увеличение разрешения достигается использованием специального программного обеспечения, которое интерполирует результаты сканирования. Программное обеспечение сканера вставляет дополнительный пиксел между каждой парой соседних пикселев и присваивает добавленному пикселю усредненное значение цвета прилежащих пикселев.

Значение разрешения в направлении движения оригинала определяется скоростью перемещения документа относительно линейки сканирования (камер CCD). Если вас больше интересует скорость, а не безукоризненное качество изображения, то, уменьшая разрешение сканирования, вы можете тем самым уменьшить время сканирования.

Порог чувствительности учитывается в процессе выбора надлежащего качества изображения. Полутоновые сканеры производят два типа данных: полутоновые и бинарные. При полутоновом способе воспроизведения каждый пиксел может иметь много возможных уровней яркости. При бинарном – только два возможных уровня. Перевод полутоновых данных в бинарные происходит за счет процесса, называемого выбором порога чувствительности. В полутоновом изображении яркость каждого пиксела выражается как значение от 0 до 255,0 – белое и 255 – черное. Чтобы преобразовать это значение в бинарное, сканер должен определить точку в этом диапазоне, выше которой пиксел становится белым, а ниже – черным. Эта точка и называется порогом чувствительности.

Рассмотрим особенности выбора используемого типа сканера. При приобретении сканера необходимо предусмотреть, чтобы документация сканера и сопровождающего программного обеспечения была на русском языке. В документации должны быть указаны адреса центров технического обслуживания. Сканер должен иметь в комплекте TWAIN-драйвер совместимый с той операционной системой, в которой предполагается его использовать. Обычно на коробке сканера при этом присутствует логотип Twain – compliant или Twain – compatible. Как правило, все современные сканеры имеют TWAIN-драйвер, совместимый с MS Windows. Кроме того, все сканеры подключаемые через SCSI, одинаково успешно работают в MS Windows 2000х и Windows NT. Проблему могут составить только сканеры, подключаемые через параллельный порт или специальные карты, при работе в MS Windows NT.

Необходимо обратить внимание на диалог с опциями сканера, который возникает перед сканированием. Желательно чтобы в этом окне были легко доступны следующие опции - Выбор типа изображения (черно-белый, серый, цветной). В идеале еще и серый с 16 градациями (обычно только с 256 градациями) – это позволит включать встроенный в систему FineReader автоматический подбор яркости при сканировании в сером (обычно серое изображение с 16-градациями сканируется быстрее за счет меньшего объема информации, чем с 256 градациями).

Другой важной операцией при подборе сканера является Выбор разрешения. Это связано с необходимостью регулировки яркости у всех типов изображения. Часто у черно-белых изображений регулировка яркости осуществляется не выбором яркости (brigthness), а выбором его порога (threshold). Это ничем не хуже, однако если затем отключить опцию "Показ диалога TWAIN-драйвера", то пользователь скорее всего не сможет регулировать яркость.

Необходимо обратить внимание на скорость сканирования в режиме черно-белого изображения (300 dpi). Желательно, чтобы это время не превышало 1–2 минуты. Обратите внимание на скорость сканирования в режиме цветного изображения (300 dpi). Желательно, чтобы это время не превышало 5–6 минут. В некоторых дешевых моделях, подключаемых через параллельный порт, это время может достигать огромных значений.

Некоторые TWAIN-драйверы при запуске сканирования показывают окно с сообщением о том, что идет разогрев (Warming …) или калибровка (Calibrating …). Как правило, это занимает около минуты. Иногда эта операция происходит при каждом запуске сканирования, даже если сканирование идет практически непрерывно или сканируется предварительное изображение (Preview). Как утверждают разработчики сканеров, это необходимо для более корректной цветопередачи. Желательно, чтобы этого режима не было вообще или чтобы он был отключаемым.

1.1.3. Редактирование и сохранение документов


Особенности работы с текстовыми редакторами

В понятии о редактировании документа подразумевается изменение набранного текста и придание ему надлежащего вида. Например, удаление ошибочных символов, вставка текстовых массивов или форматирование текста, связанное с изменением параметров шрифтов и абзацев. Рассмотрение конкретных приемов и средств редактирования текстовых документов применительно к текстовому процессору MS Word 2003, как приложения интересующего нас Microsoft Office 2003, будет выполнено в следующей главе учебного пособия.

Сохранение документа в одном из многообразных существующих форматов является завершающей стадией работы по подготовке документа. Чтобы максимально обезопасить работу пользователя (или делового партнера) от возможных конфликтов стараются сохранять документ в подходящем формате. Несмотря на кажущуюся тривиальность здесь необходимо выполнить также требования исходя из следующих условий:

  • может возникнуть необходимость работы с фрагментами текстового файла в других приложениях (не в тех, которые предполагались изначально);

  • разными текстовыми процессорами поддерживаются разные форматы; и не всегда они совместимы;

  • проблемы возникают при открытии документа на другой платформе (исчезновение рисунков, пропажа форматирования и т.д.).

В приложении MS Word предусмотрены встроенные конверторы в свой внутренний формат doc, которые можно подключить при инсталляции. Тогда при завершении работы с документом программа Word предлагает разные расширения для его сохранения.

Рассмотрим основные особенности наиболее часто употребляемых форматов текстовых документов.

ASCII (американский стандартный код для обмена информацией) - формат в котором одной букве языка присваивается один байт.

Для стандартизации разрабатываемых компьютерных средств в 1961 г. Американский национальный институт стандартов (ANSI) в своем комитете X3.4 приступил к обобщению разработок универсального кода для представления символов алфавита, цифр и управляющих кодов. В настоящее время под ASCII формат выпускается большое количество оборудования и операционных систем (ОС). При этом в разных ОС осуществляется разные реализации этого формата. Например, кодировка >Перевод строки (ПС) в ОС семейства UNIX реализуется как команда (ПС). В ОС MS DOS и Windows она выполняется как (ПС) + (ВК). При этом текст, созданный под UNIX в формате ASCII, открывается в редакторе Windows NotePad, но представляется в виде одной сплошной строки.

DOC – формат является внутренним форматом MS Word, который присваивается по умолчанию в каждой операции сохранения текста.

Текстовые документы в MS Word 2000x/9х являются совместимыми по формату, но более ранние верные не являются совместными.

RTF – это формат обмена документов между текстовыми процессорами. Его разработка в 1986 г. фирмой Microsoft является отдельным этапом в технологиях сохранения и передачи текста.

Он отличается совершенной внутренней организацией при передаче всех элементов форматирования. Хорошо описан документально, специфицирован и распознаваем практически всеми офисными приложениями.

HTML – универсальный язык разработки гипертекста, применяемый в Интернет для разработки Web – страниц

В текстовых процессорах MS Word 2000x этот формат является внутренним форматом и занимает равноправное положение с форматом DOC.

Ведение архива текстов. Использование ПК для подготовки текстовых документов ставит перед пользователями задачу издания и ведения архива текстов на магнитных дисках (мд). ведение архива включает в себя операции: просмотр оглавления архива; чтение текстов из архива; запись текстов в архив; копирование текстов; переименование текстов; удаление текстов.

Просмотр оглавления архива на МД. Просмотр оглавления - часто используемая операция, бывает необходима для поиска дискеты, содержащей нужный jtckct, для анализа содержимого МД перед выполнением сервисных функции над файлами. На экран дисплея выдаются краткие сведения о содержимом нужного диска. Как правило, эти сведения ограничиваются именем файла вместе с расширением.

Чтение текста с МД. Операция выполняется при подаче пользователем специальной команды редактора. Для операции чтения документа с МД первостепенным является правильное задание имени файла. Как правило, если файл расположен в текущем подкаталоге, то достаточно задать только имя файла. В противном случае надо задать полный путь к файлу, например:

C:\mybook\chast1.doc

Запись текста на МД. Операция выполняется при подаче пользователем специальной команды редактора. Существует возможность записать на МД весь текст или его часть. После подачи команды текстовый редактор запрашивает у пользователя имя, под которым надо записать текст в виде файла на МД. Особенности задания имени такие же, как и для операции чтения с МД. Выбор расширения имени зависит от типа текстового документа.

Применение издательских систем

Компьютерные издательские системы используются для создания книг, каталогов, буклетов и других видов сложных документов. Технология работ с такими системами значительно проще по сравнению с традиционной полиграфией. Настольная издательская система PageMaker предназначена для компьютерной верстки печатных изданий любого рода, в том числе для распространения в World Wide Web и других сетях.

К основным средствам программы PageMaker, с помощью которых формируется документ, относятся:

  • автоматическое "перетекание" текста через все страницы документа;

  • слияние и переплетение нескольких текстовых файлов внутри одного документа;

  • газетный стиль "перетекания" текста по столбцам;

  • форматирование и отбивка любой части абзаца, предложения или слова;

  • глобальное форматирование текста и заголовков;

  • мощное управление границами страницы, включая автоматическую нумерацию страниц;

  • генерация содержания и предметного указателя;

  • различные способы обтекания текста вокруг графики;

  • топографические средства управления точным размещением каждого символа на странице.

Подробнее остановимся на возможностях программы Adobe PageMaker версии 7.0. Программа отвечает всем требованиям стандарта Windows 95 и Windows NT: она поддерживает контекстные меню, краткие подсказки для инструментов, длинные имена файлов.

PageMaker интегрируется с другими родственными программами: Adobe Illustrator и Adobe Photoshop. Благодаря новому интерфейсу, все эти программы теперь имеют похожие палитры, команды меню и горячие клавиши, что позволяет легко переключаться между программами. Интеграция состоит и в том, что можно перетаскивать объекты из одной программы в другую методом "буксировки".

Наличие набора готовых шаблонов документов позволяет пользователям без излишних знаний в полиграфии, издавать публикации на достаточно высоком уровне. Профессионалам предоставляются средства, облегчающие возможность создания страничных шаблонов и шаблонов документов. Можно быстро изменить верстку множества страниц, изменив один страничный шаблон. В одном документе можно использовать несколько страничных шаблонов, оформляя страницы по-разному, что немаловажно при издании иллюстрированных журналов.

Что бы пользователи ни делали: изменяли размер или ориентацию страниц, меняли число и ширину колонок, меняли страничные шаблоны - PageMaker переверстывает издание практически мгновенно. При верстке можно заранее зарезервировать место для текста или графики, которых еще нет. Для этого применяются рамки. Программа обеспечивает высокое качество цветных изданий. Благодаря полной поддержке последних международных цветовых стандартов, можно добиться точного воспроизведения цвета при печати.

Появилась возможность распространения изданий в Интернете. Для этой цели в версии 7.0 появилась возможность создавать гипертекстовые ссылки, работать с Web-адресами, автоматически конвертировать графику и экспортировать файлы в Web форматы для распространения в WWW.

Текстовые и графические объекты можно располагать на различных слоях, чтобы они не мешали друг другу при просмотре и редактировании. Слои можно запирать, делать невидимыми и запрещать вывод их на печать или в файл. Таким образом, можно создавать разные варианты одного и того же документа или сопровождать его разными комментариями и пометками.

Можно зарезервировать место для текста и графических изображений, которых еще нет, с помощью рамок.

Для каждой страницы можно задать свои направляющие колонки, направляющие линейки и базовые линии. Модульные сетки можно задавать не только для документа, но и для страничных шаблонов. Можно также копировать модульные сетки из готовых страниц и сохранять их в файле для последующего использования.

1.1.4. Публикация, поиск и перевод текстовых документов


Выполнение операций публикаций и поиска документов

После создания и сохранения документа выполняется затем его публикации. Публикация документа пользователем является своего рода визитной карточкой. В зависимости от типа представления документа условно выделяются три вида публикаций:

  • печать документа;

  • электронная публикация;

  • публикация Web – документов.

Печать документов – это процесс создания его твердой копии на бумаге или прозрачных пленках. Создание печатных документов связано с необходимостью оформления рекламных буклетов фирм, подготовкой различных научных трудов, учебных пособий и т.д. Печать выполняется с помощью принтеров, которые являются периферийными устройствами компьютеров.

Для подключения принтера к ПК можно использовать порт Lpt, интерфейсы USB, IrDA, Blue Tooth. Последние два из перечисленных основаны на технологии приемо-передачи инфокрасного излучения и радиосигналов. При этом текст просто подносится к принтеру на близкое расстояние и под управлением ПК осуществляется его распечатка.

Электронная публикация представляет собой процесс окончательного представления документа в электронном виде с возможностью переноса его в том же виде другим пользователем и чтение с экрана вне зависимости от способа переноса. Можно отправить созданный документ другому пользователю разными способами: по электронной почте; при публикации в Интернет в виде Web – страницы; на гибких носителях, например, дискете.

Публикация документов по электронной почте или в виде Web – страниц отмечается рядом преимуществ:

  • быстротой доставки, когда электронный документ может быть получен практически мгновенно при его обнаружении на Web – узле и последующей загрузки;

  • легкостью аннотирования с возможностью добавления собственных электронных замечаний; конструкции электронных книг позволяют выделять текст и вносить аннотации, по которым можно осуществлять поиск;

  • экономические преимущества обусловлены отсутствием затрат на печать; минимальная стоимость хранения и доставки, цена текста будет снижаться;

  • экологические преимущества связаны с экономией бумаги, что предотвращает от вырубки большого массива деревьев; электронные документы могут загружаться в электронные книги и после изданий стираться, а не перерабатываться во вторичное сырье.

Транспортировка документов на гибких носителях имеет ряд специфических особенностей. В этом случае могут возникать проблемы, когда у получателя документа не тот текстовый редактор (в котором создавался документ) не та версия ОС и установка шрифтов. Иногда необходимо на месте исправлять различные ошибки или вносить изменения, используя непривычные инструменты и технологии. Применение формата RTF не способствует передаче средств и команд, с которыми создаются документы. При этом графические объекты и особенно таблицы в цвете распознаются еще хуже.

Стандартом передачи графического представления информации между системами разработки страниц (программами обработки изображений, верстки, текстовыми процессорами и пр.), а также принтерами высокого разрешения является язык описания страниц Post Script. Его основой является возможность свободно комбинировать текст и графические изображения с применением к ним одинаковых наборов преобразований.

При всей высокой эффективности и универсальности Post Script не отвечает требованиям процесса производства документов, так как разрабатывался для устройств вывода, а не для их операторов. Хотя он называется языком описания страниц, но скорее является языком описания документов. В файле Post Script нельзя предсказать, как выглядит страница n без обработки всех n-1 страниц, так как некоторые составляющие n-ой страницы (шрифты или цвета) содержат описание на предыдущих страницах. Все это усложняет выполнение операций редактирования документов.

Значительное облегчение при работе с большими документами было достигнуто с разработкой фирмой Adobe формата PDF (Portable Document Format – переносимый формат документов). Первоначально PDF задумывался как альтернатива печатным документом и организации безбумажного офиса. Для работы с PDF – файлами использовался пакет Acrobat, который до версии 4.0 состоял из двух частей: Acrobat Distiller для конвертирования документов в PDF – файлы; Acrobat Reader для открытия и чтения файлов. В современных версиях 7.0 предусматривается возможность конвертирования файлов, а также создавать и редактировать документы.

Поиск и открытие документа зависит от того, где он опубликован. Для поиска информации Web – страниц используются инструментальные средства Интернет. Например, с использованием информационно – поисковых систем Рамблер, Аппорт, Альта Виста и др. Если документ был сохранен в файловой системе то его поиска можно осуществить средствами OC Windows (c выполнением команд >Пуск >Поиск и последующим выбором параметров местоположения файла).

Характеристика программных систем перевода текстов

К настоящему времени на рынке программных продуктов имеется немало инструментальных средств языковой инженерии, позволяющих пользователям понимать получаемую информацию и поставлять свои документы на большом числе языков. К таким средствам относятся программы проверки орфографии и грамматики, системы надиктовки и пакеты информационного поиска, а также программы автоматического перевода. Основной задачей в использовании программ-переводчиков является реализация межъязыковой коммуникации.

К основным преимуществам в использовании автоматических переводчиков относятся быстрота и дешевизна обработки текста. Для специалиста предметной области со слабой языковой подготовленностью компьютерный перевод текста в черновом варианте дает общее представление решаемой проблемы. Несуразные получаемые тексты в автоматизированном переводе дают возможность квалифицированному переводчику создавать высокохудожественные документы.

К известным типам программ машинного перевода относятся такие, как Power Translator (фирма Lernout$Haspie), Transcend (фирма Transparent Language), Systran (фирма Systran), Reverso/PROjectMT (фирма ПРОМТ), Сократ (фирма Арсеналъ) и др. Из них признанным лидером на рынке программ является фирма Systran. Наибольшая часть российского рынка занята фирмой ПРОМТ, разработки которой распространяются под торговой маркой Reverso/PROjectMT.


При работе с конкретной программой-переводчиким можно воспользоваться (дополнительно к собственным специализированным словарям) услугами других программных словарей. Например, при работе с программой ПРОМТ можно воспользоваться услугами словарей Lingvo (фирма Бит) или Контекст (фирма Информатик), а для проверки орфографии -программами Пропись (Агама), Lingvo Corrector (Бит) или ОРФО (Информатик). Можно также прямо из окна ПРОМТ вызвать одну из двух популярных в России программ распознавания символов - FineReader (Бит) или CuneiForm (Cognitive Technologies).

В хронологическом порядке универсальные сервисы системы ПРОМТ стали поставляться с разработкой версии 4.0, включающая в себя следующие варианты:

  • PROMT 98 Гигант – многопользовательская интегрированная система, обеспечивающая связный перевод с основных европейских языков (английский, немецкий, французский и русский); генеральные языки содержат порядка 120 тысяч лексических единиц для каждого языкового направления; интегрируемая среда функционирует с 4 модулями (PROMT – лингвистическая среда, File Translator – приложение для обработки больших документов, WebWiev – решение для Интернет, Qtrans – переводчик небольших текстов из Clipboard или набираемых с клавиатуры);

  • PROMT Интернет – интегрированный пакет для работы в Интернет при объединении 3 систем (модуль перевода в MS Explorer, WebTranSite и WebWiev);

  • Magic Gooddy 98 – мультимедийный переводчик для ПК;

  • Pocket PROMT – интегрированная система перевода для портативных ПК на основе ОС Windows CE.

Используемые дополнительные типы словарей могут иметь разную тематическую направленность (автомобильный, Медицинский, Нефтехимический, Строительный, Финансовый и банковский, Аэрокосмический, Биологический, Политехнический, Юридический и пр.). Наилучшие сервисные возможности получены в системе PROMPT 7.0, технология работы с которой рассматривается в последней главе материалов данного раздела.

1   2   3   4   5   6   7   8   9   ...   18

Похожие:

Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconЛекция 4 Программное
Новые термины и понятия: программа, программное обеспечение, базовое программное обеспечение, системное программное обеспечение,...
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconЛабораторная работа №7 по дисциплине «Прикладное программное обеспечение»
«Прикладное программное обеспечение» для студентов, обучающихся по специальности «Информационные системы и технологии»
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconРабочая программа по дисциплине «Системное и прикладное программное обеспечение» для специальности "Прикладная математика и информатика"
«Системное и прикладное программное обеспечение» для специальности "Прикладная математика и информатика"
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconПрограмма по дисциплине: информатика и применение компьютеров в научных исследованиях (Прикладное программное обеспечение). Продвинутый курс
Информатика и применение компьютеров в научных исследованиях (Прикладное программное обеспечение). Продвинутый курс
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconПрограмма по дисциплине: информатика и применение компьютеров в научных исследованиях (Прикладное программное обеспечение). Продвинутый курс
Информатика и применение компьютеров в научных исследованиях (Прикладное программное обеспечение). Продвинутый курс
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconПрограмма учебной дисциплины «Прикладное программное обеспечение»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 040100. 62 «Социология»...
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconПрограмма учебной дисциплины «Прикладное программное обеспечение»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 040100. 62 «Социология»...
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconПрограмма дисциплины «Прикладное программное обеспечение» для направления 040100. 62 «Социология»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки/специальности...
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconУчебное пособие Липецк 2001 ноу «Липецкий эколого-гуманитарный институт» А. К. Погодаев > В. В. Дозоров Программное обеспечение автоматизированных систем. Разработка приложений баз данных
Программное обеспечение автоматизированных систем. Разработка приложений баз данных: Учебное пособие Липецк: лэги, 2002. 71 с
Баталов С. А., Исхаков З. Ф., Абросимова М. А. Информатика учебное пособие Часть 3 прикладное программное обеспечение iconЛекция Прикладное программное обеспечение
Назначение, состав и классификация прикладного по. Прикладное по общего назначения. Офисные программы. Программы работы с текстовыми...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница