Информационные технологии
Представления информации
Сообщение как материальная форма представления информации
Одно из (специфических) свойств информации заключается в том, что она существует в виде различных материальных форм. Форма представления информации может меняться в процессе ее обработки или использования. Например, информация, передаваемая по телеграфу, сначала может быть представлена в виде текста на бумаге, затем телеграфист переносит ее на магнитный носитель, где она существует в виде различным образом намагниченных участков, далее она может быть преобразована в электрические импульсы в проводнике и т.д. Информация является общим абстрактным содержанием в различных формах представления.
Различные материальные формы представления информации называются сообщениями, содержащими данную информацию. Различные сообщения могут содержать одну и ту же информацию. В качестве примера на рис.6.1 показаны различные представления числа 4: в виде разноформатных начертаний арабской цифры 4, римской цифры, слова «четыре», записи числа 4 в двоичной системе счисления .
Еще одним подобным примером является возможность записи чисел в различных системах счисления. Следует заметить, что информация может быть облечена не только в графическую форму. Произнесенное человеком слово «четыре» также является сообщением, представляющим число 4. Нетрудно привести множество других примеров такой «многоликости» информации.
Следует заметить, что практический интерес представляют только такие материальные формы представления информации, которые могут быть восприняты человеком и другими живыми существами. Предполагается, что человек воспринимает сообщения непосредственно своими органами чувств или с использованием специальных приборов или средств. Органы чувств человека можно рассматривать как естественные (созданные природой) регистрирующие и измерительные средства (датчики).
Формы сообщений (сигналы, изображения, знаки, языковые сообщения)
Можно выделить несколько основных форм сообщений (в порядке возрастания их сложности).
Сигналы представляют собой некоторые физические величины или свойства физической среды, изменяющиеся во времени. Чаще всего такими величинами являются: напряженность электрического поля, величина электрического тока, интенсивность светового потока, давление газа и т.п.
Сигналы воспринимаются органами чувств человека или других животных, а также специально предназначенными для регистрации сигналов техническими устройствами — датчиками. Принятые сигналы, как правило, преобразуются в другую форму. Например, микрофон преобразует звуковые колебания (периодические изменения давления атмосферы) в переменный электрический ток, а световые или звуковые сигналы преобразуются органами чувств высших животных в импульсы (т. е. тоже сигналы) электрохимической природы. На рис.6.2 показан график звуковых колебаний, возникающих при произнесении слова «четыре».
Чаше всего информация в виде сигналов используется в системах управления техническими объектами для описания изменения состояния объектов с течением времени. Отклонение этих сигналов от требуемых по условиям эксплуатации значений приводит к выработке системой управления сигналов, представляющих управляющую информацию. Получение, обработка и анализ сигналов о состоянии управляемого объекта и внешней среды, а также генерация управляющих сигналов рассматриваются в теории управления.
Изображения можно рассматривать как многомерные и пространственные сигналы (фотографии, карты, графики и т.п.), в которых регистрируемые параметры физической среды зависят не от времени, а от пространственного положения. Для черно-белой фотографии таким параметром является степень почернения фотоматериала (фотопленки или фотобумаги ).
Физические величины, изменения которых рассматриваются как сигналы или изображения, называются параметрами сигналов. Если параметры сигналов принимают конечное число значений, то такой сигнал называется дискретным.
Некоторые повторяющиеся образцы (фрагменты) сигналов (изменяющихся во времени или в пространстве) в процессе общественной практики человека обособляются, выделяются и трактуются как некоторые новые сущности, а не просто как произвольные фрагменты сигнала. Таким образом возникают фонемы (акустические сигналы) и графемы. Эти новые сущности являются элементами, на основе которых формируется речь и письмо. Число этих элементов конечно. Графемы и фонемы являются частными случаями более общего понятия — знака. Знаком можно считать любую сущность, отличную от других сущностей. Примерами знаков являются буквы различных естественных языков, всевозможные условные обозначения на картах, схемах и других документах, дорожные знаки и многое другое. Разнообразные примеры наборов знаков приведены в 27.
Последовательность знаков, сменяющих друг друга во времени, можно рассматривать как дискретный сигнал. Например, последовательность фонем представляет собой речевое сообщение. Аналогичным образом расположение графем может восприниматься как письменное сообщение. Таким образом, представление информации в виде знаков является основой речи, письменности, а также способов хранения, передачи и обработки информации.
Условно можно выделить научные дисциплины, которые преимущественно занимаются изучением рассмотренных трех форм представления информации. Это анализ и обработка сигналов , распознавание образов и информатика. Еще раз следует подчеркнуть, что это разделение достаточно условно. Некоторые вопросы рассматриваются в нескольких дисциплинах одновременно.
Учитывая вышеизложенное, можно сказать, что информатика занимается изучением сбора (получения), хранения, поиска, обработки и выдачи информации, представленной в знаковой форме. Знаки — это всего лишь одна из материальных форм информации. Но помимо формы представления информация может характеризоваться содержанием или смыслом, который приписывается человеком.
Следует отметить, что наряду с термином «информация» используется термин «данные» (иногда как синонимы). В [28]предлагается различать эти два термина и считать, что данные суть факты, идеи, сведения, которые представлены в знаковой (символьной) форме, позволяющей производить их передачу, обработку и интерпретацию (т.е. толкование, объяснение, раскрытие смысла), а информация — это смысл, который человек приписывает данным на основании известных ему правил представления в них фактов, идей, сообщений.
Полезно сделать еще одно замечание относительно терминов «знак» и «символ». Некоторые знаки приобретают определенное значение. К примеру, буквы свидетельствуют об алфавите, в который они входят, и о языке, который использует эти буквы. Но некоторые буквы (знаки) имеет для людей более глубокий смысл. Например, знак , помимо того, что он является буквой греческого алфавита, означает для людей, знакомых с математикой, отношение длины окружности к длине ее диаметра. Поэтому символом целесообразно называть знак, который имеет специальный смысл (значение), связанный с определенной областью человеческой деятельности. Примерами символов являются следующие знаки: ©, @, $, §, ∞ .
Число исходных для представления информации знаков, как правило, невелико (несколько десятков), а потребность в знаках, представляющих информацию о реальном мире, существенно превышает это количество и постоянно возрастает с развитием человечества, усложнением производственных отношений. Неограниченный запас новых языковых сообщений может быть получен из конечного множества знаков путем их комбинирования или составления из них последовательностей первичных знаков. Именно такой принцип лежит в основе большинства естественных языков. Несмотря на особенности каждого естественного языка, они имеют много общего. Для изучения общих принципов постро-ения языков разработаны формальные (математические) модели, которые так и называются — формальные языки .
Источник
Способы которыми можно представить сообщения
Воспринимая информацию с помощью органов чувств, человек стремится зафиксировать ее так, чтобы она стала понятной и другим, представляя ее в той или иной форме.
Музыкальную тему композитор может наиграть на пианино, а затем записать с помощью нот. Образы, навеянные все той же мелодией, поэт может воплотить в виде стихотворения, хореограф выразить танцем, а художник — в картине.
Для этого вы пользуетесь визуальными средствами представления информации: числами, таблицей, рисунком.
Таким образом, информацию можно представить в различной форме:
- знаковой письменной, состоящей из различных знаков, среди которых принято выделять:
- символьную в виде текста, чисел, специальных символов (на
пример, текст учебника); - графическую (например, географическая карта);
- табличную (например, таблица записи хода физического эксперимента);
- в виде жестов или сигналов (например, сигналы регулировщика
дорожного движения); - устной словесной (например, разговор).
- в виде жестов или сигналов (например, сигналы регулировщика
Форма представления информации очень важна при ее передаче: если человек плохо слышит, то передавать ему информацию в звуковой форме нельзя; если у собаки слабо развито обоняние, то она не может работать в розыскной службе. В разные времена люди передавали информацию в различной форме с помощью: речи, дыма, барабанного боя, звона колоколов, письма, телеграфа, радио, телефона, факса. Независимо от формы представления и способа передачи информации, она всегда передается с помощью какого-либо языка.
На уроках математики вы используете специальный язык, в основе которого — цифры, знаки арифметических действий и отношений. Они составляют алфавит языка математики. На уроках физики при рассмотрении какого-либо физического явления вы используете характерные для данного языка специальные символы, из которых составляете формулы. Формула — это слово на языке физики.
На уроках химии вы также используете определенные символы, знаки, объединяя их в «слова» данного языка.
Существует язык глухонемых, где символы языка — определенные знаки, выражаемые мимикой лица и движениями рук.
Основу любого языка составляет алфавит — набор однозначно определенных знаков (символов), из которых формируется сообщение. Языки делятся на естественные (разговорные) и формальные. Алфавит естественных языков зависит от национальных традиций. Формальные языки встречаются в специальных областях человеческой деятельности (математике, физике, химии и т. д.). В мире насчитывается около 10 000 разных языков, диалектов, наречий. Многие разговорные языки произошли от одного и того же языка. Например, от латинского языка образовались французский, испанский, итальянский и другие языки.
Информация становится понятной, если она выражена языком, на котором говорят те, кому предназначена информация.
В процессе развития человеческого общества люди выработали большое число языков. Примеры языков:
- · разговорные языки (в настоящее время в мире их насчитывают более 2000);
- · языки мимики и жестов;
- · языки чертежей, рисунков, схем;
- · языки науки (математики, химии, биологии и т.д.);
- · языки искусства (живописи, музыки, скульптуры, архитектуры и т.д.);
- · специальные языки (азбука Брайля для слепых, азбука Морзе, Эсперанто, морской семафор и т.д.);
- · алгоритмические языки (блок-схемы, языки программирования).
Язык –– это знаковая система, используемая для целей коммуникации и познания. Основой большинства языков является алфавит – набор символов, из которых можно составлять слова и фразы данного языка.
- · набором используемых знаков;
- · правилами образования из этих знаков таких языковых конструкций, как “слова”, “фразы” и “тексты” (в широком толковании этих понятий);
- · набором синтаксических, семантических и прагматических правил использования этих языковых конструкций.
Все языки можно разделить на естественные и искусственные.
Естественными называются “обычные”, “разговорные” языки, которые складываются стихийно и в течение долгого времени. История каждого такого языка неотделима от истории народа, владеющего им. Естественный язык, предназначенный, прежде всего, для повседневного общения, имеет целый ряд своеобразных черт:
- · почти все слова имеют не одно, а несколько значений;
- · часто встречаются слова с неточным и неясным содержанием;
- · значения отдельных слов и выражений зависят не только от них самих, но и от их окружения (контекста);
- · распространены синонимы (разное звучание — одинаковый смысл) и омонимы (одинаковое звучание — разный смысл);
- · одни и те же предметы могут иметь несколько названий;
- · есть слова, не обозначающие никаких предметов;
- · многие соглашения относительно употребления слов не формулируются явно, а только предполагаются и для каждого правила есть исключения и т.д.
Основными функциями естественного языка являются:
- · коммуникативная (функция общения);
- · когнитивная (познавательная функция);
- · эмоциональная (функция формирования личности);
- · директивная (функция воздействия).
Искусственные языки создаются людьми для специальных целей либо для определенных групп людей: язык математики, морской семафор, язык программирования. Характерной особенностью искусственных языков является однозначная определенность их словаря, правил образования выражений и правил придания им значений.
Любой язык –– и естественный и искусственный –– обладает набором определенных правил. Они могут быть явно и строго сформулированными (формализованными), а могут допускать различные варианты их использования.
Формализованный (формальный) язык –– язык, характеризующийся точными правилами построения выражений и их понимания. Он строится в соответствии с четкими правилами, обеспечивая непротиворечивое, точное и компактное отображение свойств и отношений изучаемой предметной области (моделируемых объектов).
В отличие от естественных языков формальным языкам присущи четко сформулированные правила семантической интерпретации и синтаксического преобразования используемых знаков, а также то, что смысл и значение знаков не изменяется в зависимости от каких-либо прагматических обстоятельств (например, от контекста).
Большинство формальных языков (созданных конструкций) строится по следующей схеме. сначала выбираетсяалфавит, или совокупность исходных символов, из которых будут строиться все выражения языка; затем описываетсясинтаксис языка, то есть правила построения осмысленных выражений. Буквами в алфавите формального языка могут быть и буквы алфавитов естественных языков, и скобки, и специальные знаки и т.п. Из букв, по определенным правилам можно составлять слова и выражения. Осмысленные выражения получаются в формальном языке, только если соблюдены определенные в языке правила образования. Для каждого формального языка совокупность этих правил должна быть строго определена и модификация любого из них приводит чаще всего к появлению новой разновидности (диалекта) этого языка.
Формальные языки широко применяются в науке и технике. В процессе научного исследования и практической деятельности формальные языки обычно используются в тесной взаимосвязи с естественным языком, поскольку последний обладает гораздо большими выразительными возможностями. В то же время формальный язык является средством более точного представления знаний, чем естественный язык, а следовательно, средством более точного и объективного обмена информацией между людьми.
Формальные языки часто конструируются на базе языка математики. Веком бурного развития различных формальных языков можно считать XX век.
С точки зрения информатики, среди формальных языков наиболее значительную роль играют формальный язык логики(язык алгебры логики) и языки программирования.
Возникновение языков программирования приходится на начало 50-х годов XX века.
Языков программирования и их диалектов (разновидностей) насчитывается несколько тысяч. Классифицировать их можно по-разному. Некоторые авторы разбивают все многообразие языков программирования на процедурные и декларативные. В процедурных языках преобразование данных задается с помощью описания последовательности действий над ними. В декларативных языках преобразование данных задается посредством описания отношений между самими данными. Согласно другой классификации, языки программирования можно разделить на процедурные, функциональные, логические, объектно-ориентированные. Однако любая классификация несколько условна, поскольку, как правило, большинство языков программирования включает в себя возможности языков разных типов.Особое место среди языков программирования занимают языки, обеспечивающие работу систем управления базами данных (СУБД). Часто в них выделяют две подсистемы: язык описания данных и язык манипулирования
Теория кодирования – это раздел теории информации, связанный с задачами кодирования и декодирования сообщений, поступающих к потребителям и посылаемых из источников информации.
Теория кодирования близка к древнейшему искусству тайнописи – криптографии. Над разработкой различных шифров трудились многие известные ученые: философ Ф. Бэкон, математики Д.Кардано, Д. Валлис. Одновременно с развитием методов шифровки развивались приемы расшифровки, или криптоанализа.
В середине ХIХ в. ситуация изменилась. Изобретение телефона и искрового телеграфа поставило перед учеными и инженерами проблему создания новой теории кодирования. Первой ориентированной на технику системой кодирования оказалась азбука Морзе, в которой принято троичное кодирование (точка, тире, пауза).
Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.
Двоичный алфавит состоит из двух цифр 0 и 1.
Цифровые ЭВМ (персональные компьютеры относятся к классу цифровых) используют двоичное кодирование любой информации. В основном это объясняется тем, что построить техническое устройство, безошибочно различающее 2 разных состояния сигнала, технически оказалось проще, чем то, которое бы безошибочно различало 5 или 10 различных состояний.
К недостаткам двоичного кодирования относят очень длинные записи двоичных кодов, что затрудняет работу с ними.
ДВОИЧНОЕ КОДИРОВАНИЕ СИМВОЛЬНОЙ (ТЕКСТОВОЙ) ИНФОРМАЦИИ
Основная операция, производимая над отдельными символами текста — сравнение символов.
При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.
Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.
Таблица перекодировки — таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно.
Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.
Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.
Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.
В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др.
Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы — это возможные события):
т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.
Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.
Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ — 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.
Одному и тому же двоичному коду ставится в соответствие различные символы.
Двоичный код | Десятичный код | КОИ8 | СР1251 | СР866 | Мас | ISO |
11000010 | 194 | б | В | — | — | Т |