top of page

Введение.

Профессиональный модуль «Обработка отраслевой информации» включает в себя два раздела: Первый – «Обработка отраслевой информации», включает в себя междисциплинарного курса «Обработка отраслевой информации» на которых вам будет начитан теоретический материал, в МДК включен большой объем ЛПЗ. По окончанию изучения каждой темы будет проводиться тестирования. Промежуточная аттестация проводится в форме  дифференцированного зачета. Итоговая атистация в виде квалификационного экзамена.  Второй раздел:  «Обслуживание аппаратных средств» будет проводиться отдельно.

МДК предусматривает изучение основных правил создания и форматирования текстовых документов, электронных таблиц с использованием возможностей персонального компьютера, верстку текста с помощью специально предназначенных для этого приложений, правил введения формул в ячейки электронной таблицы и расчета по ним, графического отображения результатов расчета, а также навыков автоматизированного счета. Также в МДК входит изучение основ разработки презентаций и работы с редактором векторной графики - Corel Draw, а также изучение редакторов растровой графики, изучаются способы обработки аудио- и видеоинформации.

Результатом освоение программы ПМ будет являться овладение вами  видом профессиональной деятельности «Обработка отраслевой информации». Также вы должны освоить следующими профессиональными компетенциями:

  1. Обрабатывать статический информационный контент;

  2. Обрабатывать динамический информационный контент;

  3. Осуществлять подготовку оборудования к работе.

  4. Настраивать и работать с отраслевым оборудованием обработки  информационного контента;

  5. Контролировать работу компьютерных, периферийных устройств и телекоммуникационных систем, обеспечивать их правильную эксплуатацию.

Работа с текстовыми документами

Начнем мы изучение курса с работы с текстовой информацией.

В этой теме мы рассмотрим основные понятия, задачи и методы обработки текстовой информации с помощью персональных компьютеров. Тема эта очень обширна и разнопланова, поскольку большинство воспринимаемой человеком информации так или иначе передается в виде текста. Постараемся максимально сжато и лаконично обсудить приемы работы с текстовыми документами.

Рассмотрим классификации и описанию самых общих задач обработки текстовых документов. Выделим несколько этапов обработки документов:

  1. ввод текста;

  2. редактирование;

  3. сохранение документа;

  4. публикация;

  5. поиск и открытие созданного документа;

  6. перевод.

Выделим несколько этапов обработки текстовых документов:

  1. Ввод текста.

На данном этапе развития научной и технической мысли ввод текста может осуществляться несколькими разными способами:

 - набором текста при помощи клавиатуры;

 - переводом бумажных документов в электронную форму;

 - голосовым вводом;

 - рукописным вводом.

а) Набор текста при помощи клавиатуры. Этот способ в настоящее время является самым распространенным. Он представляет собой, как правило, довольно простой технологически процесс, если, конечно, не стараться сразу придать документу окончательно оформленный вид, а заняться этим при редактировании. Но в любом случае, в зависимости от пожеланий заказчика и вида последующей публикации наборщик должен правильно выбрать шрифт, который он будет использовать при наборе. Поэтому, говоря о наборе текста, прежде всего поговорим о шрифтах.

Шрифт (Schrift от нем. schreiben — писать) – это графический рисунок начертания букв и знаков, составляющих единую стилистическую и композиционную систему.

Шрифты создаются художниками в соответствии с образным замыслом, требованиями единства стиля и графической композиции, прикладными задачами, а также в соответствии с конкретными смысловыми и художественно-декоративными задачами.

б) Перевод бумажных документов в электронную форму. Необходимость такого преобразования обусловлена тем, что огромные массивы информации передаются в виде трудноразличимых факсов, ксерокопий и т.п. Для того чтобы иметь возможность быстро и правильно редактировать такие документы, а также публиковать их в дальнейшем в разном виде, и возникает потребность в программном обеспечении, обеспечивающем создание электронного образа бумажного документа, а также в соответствующих устройствах.

 На сегодняшний день такими устройствами являются сканеры. Условно их можно разделить на две категории: универсальные и узкоспециализированные, к которым предъявляются специальные профессиональные требования. Универсальные сканеры, в свою очередь, будем делить на ручные и планшетные.

  1. Ручные неудобны в использовании и чаще всего не могут обеспечить удовлетворительное качество сканирования.

  2. Планшетные, позволяющие сканировать книги в не разобранном виде. Кроме того, они дают возможность сканировать включенные в документ графические объекты различной природы.

Непосредственным результатом работы сканеров является так называемый графический образ информации. В результате возникает Чрезвычайно сложная задача восстановления смыслового содержания текста по его изображению. Для ее решения предназначен специальный класс программного обеспечения, получивший название программ распознавания образов - OCR (от англ, optical character recognizer). В принципе, на рынке ПО присутствует немало пакетов данного назначения, но среди них реально удовлетворяют требованиям пользователя лишь несколько. В России явным лидером выступает пакет Fine Reader российской компании ABBYY.

в) Голосовой и рукописный ввод. Голосовой и рукописный способы ввода  в большую популярность получили в мобильных устройствах.  Например, возможность голосового набора, ручной набор в планшетных ПК и смартфонах. В поисковой системе Google в новых версия OS Android, появилась возможность выполнять поиск как по произнесенным фразам, так и по рукописному тексту. Хотя и в других отраслях эти способы ввода тоже используются. Например системах распознания речи. В Windows 7 такая функция присутствует, хотя русский язык не поддерживает.

Примером голосового ввода можно привести разработку наших отечественных программистов Горынич, а из популярных войснот самостоятельная программа, разработана на базе интернет обозревателя Google Сhrome.

Для рукописного ввода вполне достаточно встроенных  возможностей, реализуемых имеющимися службами последней версии Windows 8 и 7.  Вплоть до распознания математических формул.

2) Редактирование.

Мы будем понимать под редактированием изменение набранного текста и придание ему надлежащего вида, будь то простое удаление ошибочных символов, вставка текстовых массивов либо так называемое форматирование.

3) Сохранение документа.

Сохранение в одном из многообразных существующих форматов является завершающей стадией основной работы по подготовке текстового документа.

Это обязательный и весьма ответственный шаг несмотря на всю его кажущуюся тривиальность. Во-первых, потому что, видимо, бессмысленно выполнять какую-либо работу, не позаботившись о сохранности результата. Во-вторых, потому что выбор формата сохраняемого документа зависит от того, где и как мы собираемся дальше с ним работать. На самом деле, наибольшие проблемы возникают при открытии документа, особенно на другой платформе: вдруг оказывается, что пропало все форматирование, исчезли рисунки, текст не читаем и т. д. Для того чтобы максимально обезопасить себя либо делового партнера, от возможных неурядиц, и стараются сохранять документ в наиболее подходящем формате.

Примером являются разные версии пакета приложений MS Office. На данный момент в последней версии, по умолчанию, документы сохраняются в формате .docx, .pptx, .xlsx, которые более старые версии прочитать не способны. Поэтому приходиться сохранять документы для версий 97 и ранее, либо использовать сторонне ПО для конвертирования документов.

Кроме этого, необходимо иметь общее представление о существующих форматах текстовых документов, поэтому, не углубляясь во все их многообразие и внутреннюю структуру, опишем основные особенности наиболее часто употребляемых форматов.

 

ASCII

 Самый заслуженный и давно существующий формат - ASCII (American Standard Code for Information Interchange - американский стандартный код для обмена информацией). Он имеет самую простую организацию: например, в английском алфавите (впрочем, как и в русском) одной букве соответствует один байт.

Код ASCII стал общим знаменателем для компьютеров, которые ранее не имели Друг с другом ничего общего. Всем буквам, цифрам, знакам препинания и другим символам (управляющим кодам) были поставлены в соответствие стандартные числовые значения. К примеру, заглавная буква "А" обозначалась числом 65. Однако 60-е еще не отличались высоким уровнем стандартизации. В одних только аппаратных средствах корпорации IBM использовалось девять различных наборов кодировки символов.

 

RTF

 RTF (Rich Text Format) - формат обмена документов между текстовыми процессорами. Он был разработан Microsoft в 1986 году и с тех пор существует, в определенном смысле, параллельно остальным. Появление его явилось очередной вехой в разработке средств сохранения и передачи текста. Главное его достоинство в том, его внутренняя организация предусматривает передачу всех элементов форматирования: размера и параметров шрифта, параметров абзацев и т. д. Он очень хорошо специфицирован, описан документально, довольно просто и строго организован и хорошо распознаваем практически всеми офисными приложениями.

 

DOC

 Пожалуй, наиболее интересующий нас формат - это формат DOC, который является, по сути, внутренним форматом MS Word. Необходимо учитывать, что MS Word 2000 и MS Word 97 полностью совместимы по формату, но более ранние версии - нет, поэтому при сохранении документа, даже если мы собираемся в дальнейшем работать с ним исключительно в MS Word, нужно обратить особое внимание на его версию. При сохранении документа в текстовом процессоре MS Word предлагает по умолчанию именно формат DOC. Как правило, имеет смысл принять это предложение, если, конечно, нет каких-либо особенных идей относительно дальнейшей публикации либо переноса файла в другие приложения. Более подробно о сохранении документа в MS Word мы поговорим в соответствующем разделе.

 

HTML

 Последний формат сохранения текстовых документов, о котором будет упомянуто здесь, - формат HTML (Hypertext Markup Language). HTML - универсальный язык разметки гипертекста, применяемый в Интернете для разработки Web-страниц. Основные характеристики его будут описаны в главе 11, посвященной глобальным вычислительным сетям. Отметим лишь, что для Word 2000 формат HTML является внутренним, равноправным с исконно "родным" форматом DOC.

 

Office Open XML

Серия  форматов файлов для хранения электронных документов пакетов офисных приложений — в частности, Microsoft Office. Формат представляет собой zip-архив, содержащий текст в виде XML, графику и другие данные, которые могут быть переведены в последовательность битов (сериализованы) с применением защищённых патентами двоичных форматов, спецификации которых были опубликованы Microsoft для пользователей OOXML на условиях Microsoft Open Specification Promise (англ.).

Язык XML (Extensible Markup Language). Сжатая форма общего языка разметки SGML (Standard Generalized Markup Language), позволяющая разработчикам создавать настраиваемые теги, обеспечивающие более гибкое упорядочение и представление информации.

XML — рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML — текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML).

 

 

4) Публикация.

Это представление документа в его окончательном, готовом виде. В зависимости от типа представления документа условно выделим два  вида публикации.

- печать документа;

Печать документа - это создание его твердой копии на бумаге или прозрачных пленках. Печать осуществляется посредством принтеров, которые являются внешними устройствами для компьютера и подключаются к нему через один из существующих на данный момент интерфейсов либо подсоединяются непосредственно в сеть, являясь самостоятельной единицей в ней.

- электронная публикация;

Будем понимать под электронной публикацией окончательное представление документа в электронном виде с возможностью переноса ею в том же виде другим пользователям и чтения с экрана вне зависимости от способа переноса.

Электронные книги. Так как давно известно, что чтения с монитора неудобно и приводит к усталости глаз, появилось новом поколении устройств - электронные книги. Специализированные аппаратные устройства, тексты в которые загружаются электронным способом.

Преимущество электронных публикаций очевидно: мгновенная доставка (огромное количество онлайн магазинов и библиотек); простота в дублировании и хранении, экономическая выгода; компактность. Экономическая выгода. Учитывая отсутствие затрат на печать, минимальную стоимость хранения и доставки, цена текста должна существенно снизиться. В большинстве случаев электронные версии должны обходиться намного дешевле, чем печатные издания. Уже существует готовый рынок профессиональных пользователей, таких как врачи, юристы, экономисты, каждый из которых сейчас тратит немалые деньги на справочники и журналы, причем им приходится покупать и периодически выпускаемые обновленные версии справочников. Пользуясь электронными книгами, они смогут сэкономить и время, и деньги.

Благодаря разработкам фирмы Adobe для   электронныч публикаций был разработан формат PDF. В дальнейшем появились .iso, .fb2 и т.д.

Программы просмотра. Исходные тексты Adobe достаточно открыты, что позволяет третьим фирмам создавать программы с равными или даже более широкими возможностями, чем оригинальные продукты

Пример foxit reader.

5) Поиск и открытие созданного документа;

Для того чтобы возобновить работу с созданным и сохраненным документом, прежде всего необходимо его найти и открыть. Для поиска документов любая ОС обладает встроенной поисковой системой с расширенными функциями, позволяющими искать документы, заданных размеров, даты создания/изменения и т.п. А для поиска в Интернете также имеется огромный перечень поисковый систем. Для открытия и просмотра содержимого можно использовать то же ПО, с помощью которого этот документ был создан, или специальные программы, предназначенные для чтения документов того, или иного формата. Например, для электронных публикация в формате PDF, можно использовать программы Acrobat Reader, PDF XChange Viewe, Foxit Reader и т.п.

6) Перевод.

Иногда возникает необходимость перевести текст на другой язык. Для этих целей используется специальное ПО - автоматизированными переводчиками, хотя с возросшей общедоступностью интернета большой популярностью начали пользоваться онлайн-переводчики.

Одной из распространённых компаний занимаю разработкой автоматизированных переводчиков является российская компания PROMT.

Автоматический перевод часто вызывает нарекания по поводу "глупостей", которые пишет программа, как то: перевод имен собственных, неправильная структура предложения, отсутствие связи существительного с прилагательным и т. д. Нарекания вполне закономерные, но при этом не учитывается, что автоматизированный перевод несет в себе ряд явных преимуществ, надо только умело ими воспользоваться. К числу неоспоримых преимуществ относятся быстрота и "сравнительная, относительно ручного перевода, дешевизна обработки текста

На самом деле, как показывает опыт, автоматизированными переводчиками надо пользоваться, в определенном смысле, как словарями-подсказчиками, то есть для создания чернового варианта текста, подлежащего в дальнейшем корректированию пользователем - специалистом в данной области. Для этого удобно разбирать экранную страницу на две части: одновременно в одной из них будет находиться содержимое исходного текста, в другой - переведенного.

Далее

bottom of page