Способы преобразования текстовой информации

Информатика

Именная карта банка для детей
с крутым дизайном, +200 бонусов

Закажи свою собственную карту банка и получи бонусы

План урока:

Текст как форма представления информации

Текст (от лат. textus – ткань, объединение, сочетание) — это произвольная человеческая мысль, письменно выраженная упорядоченной цепочкой языковых знаков. В информатике совокупность связанных по смыслу знаков, несущее в себе какое-либо информационное сообщение, является текстовой информацией .

Примером текстовой информации может служить параграф школьного учебника, детская считалка, ремарка актера в пьесе, расписание уроков, магазинный чек и т.д.

Издавна люди пытались сохранить различного рода сведения на таких носителях, как камень, глина, береста, папирус, на смену которым пришла повсеместно используемая бумага.

Письменный текст записывали различными инструментами – острой костяной палочкой, перьевыми ручками, авторучками и с позапрошлого века стали печатать на пишущих машинках.

Чтобы зафиксировать большой объем информации или изменить смысл предложений, необходимо было проделывать огромную работу, трудоемкую и длительную. С помощью компьютера текстовую информацию можно с легкостью не только вводить, но и редактировать, сохранять, передавать и печатать любое количество копий на принтере. Компьютерные программы коренным образом изменили технологию письма . В современном мире все чаще бумажные документы заменяются электронными.

Причиной перехода к безбумажным технологиям во многих сферах деятельности человека является увеличение скорости и качества обработки информации, уменьшение себестоимости электронных носителей при росте цен на бумагу вследствие мирового экологического кризиса.

Представление текстовой информации в компьютере –это преобразование вводимых символов с помощью кодовой таблицы. Современная универсальная таблица кодировки Unicode позволяет охватить более 65 тысяч символов различных алфавитов, цифры, знаки препинания, математические и другие символы.

Фрагмент кодовой таблицы Unicode

Для каждого знака в памяти компьютера выделяется 2 байта или 16 бит двоичного кода. Таким образом, можно вычислить объем текстовой информации, легко перемножив количество символов (включая пробелы) на информационный вес одного символа. Для выражения крупных объемов информации используются такие единицы измерения, как килобайты, мегабайты и гигабайты.

Единицы измерения информации

Различают следующие виды текстовой информации:

  • фактуальная (отражает события, описание людей, мест действия, времени и т.д.);
  • концептуальная (открывает замысел автора, его позицию, точку зрения);
  • подтекстовая (дополнительная информация, позволяющая полнее раскрыть предыдущие виды информации).

Большинство текстов имеют сложную структуру, подразумевающую сочетание различных типов сведений: когнитивных, оперативных, эмоциональных и эстетических. Каждый из видов информации в тексте характеризуется своими особыми способами языкового выражения.

  • когнитивная информация – отражает объективные, абстрактные и логически завершенные сведения об окружающем мире (например, название и контакты предприятия в рекламном объявлении);
  • оперативные сведения представляют собой побуждение к совершению каких-либо действий (призыв приобрести продукт);
  • для эмоционального сообщения характерна субъективность, конкретность и образность (оценка качества продукта);
  • эстетическая информация транслирует чувства, возникающие у автора (это фразеологизмы, метафоры и др. выразительные средства).

Текстовые документы

В целях упрощения работы с письменной информацией создали специальное программное обеспечение – текстовые редакторы (процессоры). Каждый текст, написанный в нем, будет называться текстовым документом. Это может быть и научная статья с формулами, и рассказ, и рекламное объявление.

Компьютерный текстовый документ как структура данных, реализованная с помощью гиперссылок, называется гипертекстом . Такой метод организации электронного документа позволяет в кратчайшие сроки переходить к необходимым сведениям и устанавливать связи между различными фрагментами текста.

Основные объекты текстового документа

Различают следующие основные структурные единицы текстового документа:

  • символ – самый маленький элемент текста;
  • слово – буквенный или цифровой ряд, ограниченный пробелами или символами препинания;
  • абзац – набор письменных элементов, начинающийся с красной строки;
  • строка – ряд символов внутри абзаца, который расположен в пределах одной горизонтальной линии между границами полей документа;
  • фрагмент – произвольная непрерывная часть текста (может быть какодно слово, строчка, абзац, так и весь документ).

Страница в текстовом документе – это отрывок текста, помещающийся на листе определенного формата.

Компьютер – основной инструмент работы с текстом

В современном мире компьютер – уникальное устройство, в том числе и для работы с текстовой информацией. Элементарные программы для текстовых документов имеют возможность создания текстов, составленных из символов, печатаемых с клавиатуры, и небольшой комплект инструментов для оформления информации. Для подготовки наиболее сложных текстов с графиками, табличным представлением данных, надписями, схемами, картинками и фотографиями целесообразно использование сильных текстовых процессоров.

Среди множества программ, предназначенных для работы с текстовой информацией, выделяют следующие:

  1. Foxit Reader – бесплатная программа для открытия текстовых документов в формате PDF. Кроме просмотра, она имеет возможность редактировать и отправлять текст на печать.
  1. Libre Office Writer– свободное офисное приложение. Прямой аналог Open Office Writer.Текстовый документа, напечатанный в этой программе, будет иметь формат ODF.
  1. Adobe Reader – удобная программа для работы текстовыми документами в формате PDF, используемого для создания текстовой информации высокого качества.
  1. Open Office Writer– бесплатное программное обеспечение, полная альтернатива приложению Microsoft Office Word. Поддерживает многие форматы. Из минусов данного приложения – отсутствует автоматическая проверка грамматики.
  1. Word Pad – стандартная программа операционной системы Microsoft Windows, обладающая ограниченными функциональными возможностями.
  1. В большинстве случаев для создания текстового документа используют программу Microsoft Word, имеющую богатый арсенал инструментов для обработки текстовой информацией. Позволяет создавать документы различной сложности.
Читайте также:  Способы обнаружения точки эквивалентности

Основные стадии подготовки электронного текстового документа:

  1. Ввод (набор символов).
  2. Редактирование.
  3. Форматирование.
  4. Печать.

Ввод текста

К устройствам ввода текстовой информации относится графический планшет, сканер, сенсорный экран и самое распространённое — клавиатура. Она позволяет вводить числа, буквы, различные знаки и управлять действиями компьютера служебными клавишами.

При вводе текстовой информации следует придерживаться несложных правил:

  1. Любой символ препинания, кроме тире, печатается сразу же после буквы. Затем нужно поставить пробел, нажав соответствующую клавишу. Исключение составляет « – », которое выделяется пробелом с 2 сторон.
  2. Для выравнивания текста по центру, по ширине, по левому или правому краю, недопустимо печатание нескольких пробелов или использование клавиши Tab. Это действие выполняет специальная кнопка в текстовом редакторе.
  3. Между словами должен быть исключительно один пробел. Легко отследить это поможет включение режима отображения непечатаемых символов.
  1. Каждый абзац начинается после нажатия на клавишу Enter с новой строки.
  2. Отступ для абзаца создается нажатием на Tab.

Редактирование текста

Редактирование текста представляет собой процедуру внесения необходимых правок. Этот этап подготовки документа требует внимания и усидчивости.

В процессе редактирования текста изменяется содержание текста. В результате работы текст должен стать грамотным и понятным.

Основными функциями редактирования текста являются:

  • выделение текстового отрывка;
  • удаление, копирование, перемещение и вставка необходимых фрагментов текста;
  • корректировка документа, включающая в себя подстановку вместо повторяющихся слов синонимов, устранение грамматических, пунктуационных, орфографических и стилистических ошибок.

Редактирование текста осуществляется перемещением курсора в необходимое место с помощью мыши либо нажатием служебных клавиш (их комбинации).

Основные сочетания клавиш

Работать можно как с отдельными знаками, строками, абзацами,так и со всем текстом. Прежде всего нужный фрагмент следует выделить. Для этого нужно установить курсорную стрелку в начало элемента и, зажимая левую кнопку мышки, провести до его окончания.

Далее можно его скопировать, вырезать, удалить соответствующими кнопками или сочетаниями клавиш.

Microsoft Word – самая популярная программа для редактирования текста. Она обладает богатыми возможностями и удобным интерфейсом. Основные средства для редактирования текста в Word:

  1. Режим вставки и замены символов (в первом режиме при печатании знаки вставляются между уже имеющимися, а при втором – очередные символы заменяют ранее напечатанные при вводе) Файл→Параметры→Дополнительно
  1. Режим Тезауруса (используется для автоматической замены выделенных слов синонимами)
  1. Автоматическая проверка правописания (проверка орфографии и грамматики)
  1. Средства рецензирования (позволяет создавать примечания, исправления и другие операции, не изменяя исходный текст) вкладка Рецензирование

Форматирование текста

Следующий этап обработки текста заключается в его форматировании. Форматирование текста подразумевает изменение внешнего вида документа. Информация подвергается оформлению по необходимым критериям.

Форматирование текста представляет собой:

  • выбор параметров страницы;
  • форматирование символов;
  • форматирование абзацев;
  • создание списков.

Вначале выбирается альбомная или книжная ориентация страницы (Разметка страницы → Ориентация).

Также в этой вкладке можно устанавливать различные параметры страницы (поля, размер, колонки и т.д.)

Нумерация страницы производится нажатием на кнопку Вставка → Номер страницы.

В процессе форматирования текста изменяется размер, начертание и цвет шрифта на Главной вкладке.

Оформление абзацев состоит в выравнивании текста относительно границ страницы (по левому или правому краю, центру или ширине).

Применение номерованных или маркированных списков позволит облегчить восприятие текстовой информации.

Подготовка документа заканчивается его распечатыванием. Для этой цели используют принтеры (устройства, переводящие электронную информацию на бумажный носитель) разного типа:

  • матричного (изображение состоит из точек, формируемых ударным способом тонкими иглами);
  • струйного (чернила поступают через крохотные отверстия – сопла);
  • лазерного (печать происходит с помощью лазерного сверхтонкого луча).

Лазерные принтеры обеспечивают самую качественную печать.

Источник

Информатика. 10 класс

Конспект урока

Информатика, 10 класс. Урок № 15.

Тема — Обработка текстовой информации

Когда вы хотите получить результат в какой-то области деятельности, то используете некоторую технологию, т. е. совокупность методов и инструментов.

Изучая предмет «Технология», вы знакомились с так называемыми «материальными» технологиями — технологиями обработки древесины, металла, ткани, лазерными технологиями, космическими технологиями, прототипированием и др.

Информационные же технологии отличаются тем, что как исходным материалом для них являются данные, так и для их применения также используются данные.

Информационные технологии (ИТ) — это совокупность методов, производственных процессов, программно-технических и лингвистических средств, объединённых с целью сбора, обработки, хранения, отображения и использования информации, представленной в цифровой форме.

По мере распространения компьютеров — универсальных устройств для обработки данных — сформировалась отдельная отрасль Информационные технологии (ИТ). Это очень важное и перспективное направление.

На уроках информатики основной школы информационные технологии классифицировались по видам обрабатываемой информации.

Исследование базовых принципов обработки информации мы начнём с обработки текста.

Читайте также:  Способ восстановления волос у мужчин

Среди вариантов текстовых документов можно выделить художественный текст, научный текст, деловой документ, рекламный текст, личный документ.

Наборы правил, рекомендуемых для создания каждого из перечисленных видов текста, различны.

В зависимости от выбранного вида текста следует подбирать и программное обеспечение (ПО). Рассмотрим классификацию ПО по назначению. Когда нужен текстовый документ простой структуры, то достаточно использовать текстовый редактор, например Блокнот для ОС Windows. Другими подобными текстовыми редакторами являются leavepad, gedit и др. Все текстовые редакторы имеют ограниченный набор функций для работы с текстовой информацией, но очень хорошо подходят для всевозможных заметок.

Более сложными программными комплексами для работы с текстовой информацией являются текстовые процессоры. Наиболее широко известны MS Word, LibreOffice Writer. Это полнофункциональные инструменты для работы с текстом, позволяющие включать в него таблицы и графические изображения, форматировать и структурировать текст, применять автоматическую нумерацию страниц и многое другое.

Бывают ситуации, когда нужно оформить текст с большим количеством специфических знаков, например, математических, химических или других формул. Обычно это касается разного рода научных материалов, а также студенческих курсовых работ. В этом случае удобно использовать свободно доступную систему подготовки публикаций TEX и наиболее популярную версию LaTEX.

Книги, журналы, другие многостраничные документы, требующие специального расположения текста, иллюстраций и других сложных объектов на странице, проходят весь цикл допечатной обработки на компьютере с использованием комплекса программных средств, называемых издательскими системами. Процесс создания компьютерного макета будущего печатного издания называют вёрсткой, а точную копию самого издания принято называть оригинал-макетом.

В качестве примеров таких программ можно назвать QuarkXPress, Adobe InDesign, Scribus. Последняя из них распространяется свободно, поэтому каждый из вас может её освоить.

Электронные словари и переводчики — это ещё одна группа программ для работы с текстами. Примерами таких программ являются — PROMT (translate.ru), ABBYY Lingvo.

Некоторые современные браузеры позволяют осуществлять автоматический перевод содержания страниц сайта на выбранный вами язык. Онлайн переводчики встроены в такие поисковые системы как Яндекс и Google.

Существует особый вид словарей — тезаурус — связь слов в них происходит на основе каких-либо лексических отношений. Например, слова-синонимы, слова-антонимы и т. д.

Когда вам нужно редактировать текст, напечатанный, например, в журнале, то для таких целей подходят системы оптического распознавания текста. С их помощью графическое изображение, получаемое при сканировании, преобразуется в текстовый документ в формате, удобном для редактирования. Наиболее известным является продукт отечественной компании ABBYY, который называется ABBYY FineReader.

Программы для работы с текстовой информацией используются ещё для создания текстов программ на языках программирования. Как правило, они интегрированы в системы программирования, но могут быть и самостоятельными программами или являться частью HTML-редакторов, в которых создаются веб-страницы. Примерами могут служить Geany, веб-редактор Blue Fish.

Нужно понимать, что многообразие ПО для работы с текстами представленными программами не заканчивается, их значительно больше. Каждый из вас при желании может составить расширенную схему, дополнив её другими программными продуктами.

Поговорим о подготовке текстовых документов. Она включает в себя три основные группы операций: ввод, редактирование и форматирование.

Ввод текста может осуществляться как прямым набором текста с клавиатуры, так и сканированием печатного документа. Операция ввода текста служит для формирования первоначального содержимого текстового документа и сохранения его в памяти компьютера.

Вспомним основные правила набора текста:

— между словами может быть только один пробел;

— переход на новую строку происходит автоматически;

— нажатие клавиши Enter означает конец абзаца;

— перед одинарными знаками препинания (: ; , . ! ?) пробел не ставится, а после них ставится;

— для скобок и других парных знаков (кавычки) пробелы ставятся с внешних сторон (до открывающих и после закрывающих), а внутри пробелы не ставятся;

— тире окаймляется пробелами с двух сторон, «дефис» в словах вводится без пробелов;

— для ввода римских цифр используются прописные латинские буквы I, V, X, L, C, D, M;

— для ввода неразрывного пробела используется комбинация клавиш Ctrl+Shift+пробел. В основном этот знак используется для записи дат, инициалов и другой информации, которую не принято писать на разных строках.

Для контроля ввода информации с клавиатуры полезно включать отображение непечатных символов. Эти символы не выводятся на печать, но отражают структуру документа. Рассмотрите примеры отображения некоторых скрытых символов для LibreOffice Writer в таблице.

Для автоматизации ввода существуют инструменты Автозамена, который автоматически исправляет наиболее частые опечатки и Автотекст, позволяющие по первым буквам автоматически вставить короткую фразу из списка элементов автотекста.

Большим преимуществом компьютерной технологии создания текстовых документов является возможность его редактирования, т. е. правки. Ввод и редактирование документа часто происходят параллельно. Редактирование существующего электронного документа происходит за счёт копирования, перемещения или удаления выделенных фрагментов текста, перестановки частей документа, слияния нескольких документов, разбиения одного документа на несколько более мелких и др.

Для того чтобы точно определить, как будет выглядеть текст на экране монитора или на листе бумаги после печати на принтере, используется операция форматирования. Операции форматирования могут применяться к отдельным объектам текстового документа, в этом случае говорят о прямом форматировании. Объекты и некоторые их свойства представлены на схеме.

Читайте также:  Способы заточки слесарного инструмента

В случае большого документа принято применять форматирование ко всему документу в целом — в этом случае используется стилевое форматирование. Однотипным структурным элементам текста назначается определенный стиль форматирования, т. е. набор параметров форматирования (шрифт, абзацные отступы и т. д.).

При создании текстовых документов следует придерживаться определённых правил:

• желательно выбирать один формат для всего основного текста, а для заголовков и смысловых фрагментов выбирать другой формат;

• количество разных цветов и шрифтов документа принято выбирать не более трёх;

• размер символов и междустрочный интервал выбираются комфортными для чтения;

• цветовая гамма должна соответствовать назначению документа;

• однотипную информацию лучше представлять в списках и таблицах;

• графические изображения использовать для того, чтобы дополнять содержание текста, их нужно выдерживать в едином стиле;

• фон и поля документа следует делать единообразными.

Для автоматизации работы текстовые процессоры содержат такие инструменты, как шаблоны, макросы и другие средства работы со структурными компонентами документа. Чтобы работать с шаблоном документа в текстовом процессоре LibreOffice Writer, достаточно в меню Файл выбрать Создать. Шаблоны…

Все шаблоны распределены по категориям:

• личная корреспонденция и документы;

• прочие деловые документы;

Среди шаблонов представлены современные деловые письма, резюме, визитки и др. Имеется возможность импорта/экспорта шаблона.

При работе с большими документами часто приходится выполнять некоторую одинаковую последовательность действий над разными фрагментами текста. Например, выделить определённым образом название школы во всём документе. Это занимает много времени. Для автоматизации процесса используются Макросы. В них один раз записывается необходимый алгоритм, макрос сохраняется и затем его можно применять к любому тексту в любое время для автоматизации процесса работы с документом.

В многостраничных документах (книгах, журналах, рефератах и т. д.) принято выделять структурные элементы — главы, параграфы, пункты и т. п., создавая при этом иерархическую структуру документа. Посмотрите на структуру своего учебника информатики. Вы видите, что в нём есть главы и параграфы. Главы находятся на первом уровне структуры документа, параграфы — на втором уровне.

В текстовых процессорах существуют специальные стили для создания иерархической структуры документа. Например, в LibreOffice Writer это стили с именами:

Если в документе к заголовкам разного уровня применено стилевое форматирование, то текстовый процессор автоматически создаст оглавление документа после специальной команды пользователя.

Современные текстовые процессоры устроены таким образом, что позволяют совершать совместную работу над одним и тем же документом. Вариантов организации такого совместного взаимодействия несколько, при этом существует возможность отслеживания внесенных в документ изменений каждым пользователем команды, поэтому важно, чтобы в документ были внесены корректные данные о пользователе, поскольку именно они останутся в редактируемом документе.

Проектной деятельности уделяется особое внимание в последнее время. В соответствии с ФГОС СОО, каждый ученик старшей школы готовит индивидуальный проект. Существуют определённые требования к оформлению проекта. Во многом они схожи с оформлением реферата.

Основные требования таковы:

• на листах белой бумаги формата А4 (210 х 297 мм);

• стандартные размеры полей обычно по 20 мм с каждой стороны;

• междустрочный интервал — полуторный;

• размер шрифта 12—14 пунктов;

• выравнивание абзаца по ширине;

• отступ первой строки 8—12 мм.

При работе с текстом существует множество задач, не связанных с процессом ввода и обработки. Представим некоторые возможности обработки текстовой информации, относящиеся к компьютерной лингвистике:

• поиск текста по заданным признакам;

• рубрицирование текста — разбиение текста на тематические подпотоки по заранее заданным рубрикам;

• реферирование текста — подготовка сокращённой версии;

• перевод текста с одного языка на другой;

• анализ текста на предмет выявления заимствований.

Многие из них вы можете исследовать самостоятельно. Остановимся лишь на системах, выявляющих заимствование текстов, например, на российском интернет-проекте антиплагиат (antiplagiat.ru) для проверки текстовых документов на наличие заимствований из сети Интернет и других источников. Это хороший помощник при создании авторских работ. Не забывайте, что уникальность текста в исследовательской или проектной работе должна составлять не менее 75%.

На сегодняшнем уроке мы определились с понятием информационных технологий.

Начали рассмотрение современных ИТ с возможностей программного обеспечения для работы с текстовой информацией.

Систематизировали программное обеспечение для работы с текстом в зависимости от назначения.

Рассмотрели три основные группы операций при работе с текстовой информацией — ввод, редактирование и форматирование.

Выяснили, что компьютерные технологии не только позволяют автоматизировать процесс создания текстовых документов за счет возможности работы с фрагментами, проверки правописания, использования шаблонов, макросов и др., но и решать множество других задач обработки текстовой информации.

Эти задачи относятся к области компьютерной лингвистики. К ним можно отнести поиск, рубрицирование, реферирование, перевод и анализ текста.

Источник

Оцените статью
Разные способы