Язык как знаковый способ представления информации

Язык как способ представления информации, двоичная форма представления информации, ее особенности и преимущества

Содержание:

ВВЕДЕНИЕ

Слово «информация» происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление. Понятие «информация» является базовым в курсе информатики, невозможно дать его определение через другие, более «простые» понятия.

В случае с понятием «информация» проблема его определения еще более сложная, так как оно является общенаучным понятием. Данное понятие используется в различных науках (информатике, кибернетике, биологии, физике и др.), при этом в каждой науке понятие «информация» связано с различными системами понятий.

Человек — существо социальное, для общения с другими людьми он должен обмениваться с ними информацией, причем обмен информацией, всегда производится на определенном языке — русском, английском и так далее. Участники дискуссии должны владеть тем языком, на котором ведется общение, тогда информация будет понятной всем участникам обмена информацией.

Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), то есть информация представляется с помощью естественных языков. В основе языка лежит алфавит, то есть набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов).

Последовательности символов алфавита в соответствии с правилами грамматики образуют основные объекты языка — слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом. Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически.

Наряду с естественными языками были разработаны формальные языки (системы счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии строгих правил грамматики и синтаксиса.

Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам. Некоторые языки используют в качестве знаков не буквы и цифры, а другие символы, например химические формулы, ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе) и другие.

Знаки могут иметь различную физическую природу. Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов)

ЯЗЫК КАК СПОСОБ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ.

ДВОИЧНАЯ ФОРМА ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ.

Понятие информация является одним из фундаментальных в современной науке вообще и базовым для изучаемой ними информатики. Информацию рассматривают в качестве важнейшей сущности мира, в котором мы живем.

Язык – это средство отражения и познания окружающего мира. Информационный процесс может осуществляться только при наличии языка.

Язык – универсальное средство передачи информации. В простейшем бытовом понимании с термином «информация» обычно ассоциируются некоторые сведения, данные, знания и тому подобное. Информация передается в виде сообщений, определяющих форму и представление передаваемой информации. При этом предполагается что имеется «источник информации» и «получатель информации». Информацию об окружающем нас реальном мире мы получаем в виде набора символов или сигналов. Но если эти символы или сигналы никому не понятны, то информация бесполезна. Необходим язык общения — знаковый способ представления информации.

Основа языка — алфавит — некоторый конечный упорядоченный набор символов или сигналов. Примеры алфавитов: латинский (26 символов), русский (33 символа), арабские цифры, азбука Морзе и так далее. В информатике и информационных технологиях термин «язык» имеет свое значение: совокупность символов, соглашений и правил, используемых для отображения и передачи информации, средство описания данных и алгоритмов решения задач.

В зависимости от задач, которые мы перед собой ставим, можно использовать разные способы представления информации.
Некоторый набор символов алфавита образует слово, а число этих символов есть его длина. От изменения длины слова, очевидно, будет меняться и информация, заключенная в нем. Чтобы разобраться в изменениях информации, необходима ее оценка (измерение).

Одно и та же информация может существовать в различных формах. Для представления информации удобно использовать знаковые системы. Знаковая система состоит из определенного набора знаков и из правил работы с ними.

Знак – это сущность, имеющая некоторый смысл и некоторый внешний вид. Физический носитель знака может быть различным: для передачи одного и того же знака может использоваться в устной речи – звук, в письменной речи – буква, в памяти компьютера – последовательность электрических импульсов.

Процесс перевода информации из одной формы представления в другую называют кодированием информации. С помощью двух цифр можно закодировать любое сообщение. Достоинство двоичного кодирования – простота реализации. Недостаток – длинные коды. Но в технике легче иметь дело с большим числом простых однотипных элементов, чем с большим числом сложных.

Двоичное кодирование информации

Теория кодирования – это раздел теории информации, связанный с задачами кодирования и декодирования сообщений, поступающих к потребителям и посылаемых из источников информации.

Теория кодирования близка к древнейшему искусству тайнописи – криптографии. Над разработкой различных шифров трудились многие известные ученые: философ Ф. Бэкон, математики Д.Кардано, Д. Валлис. Одновременно с развитием методов шифровки развивались приемы расшифровки, или криптоанализа.

В середине ХIХ в. ситуация изменилась. Изобретение телефона и искрового телеграфа поставило перед учеными и инженерами проблему создания новой теории кодирования. Первой ориентированной на технику системой кодирования оказалась азбука Морзе, в которой принято троичное кодирование (точка, тире, пауза).

Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Двоичный алфавит состоит из двух цифр 0 и 1.

Цифровые ЭВМ (персональные компьютеры относятся к классу цифровых) используют двоичное кодирование любой информации. В основном это объясняется тем, что построить техническое устройство, безошибочно различающее 2 разных состояния сигнала, технически оказалось проще, чем то, которое бы безошибочно различало 5 или 10 различных состояний.

К недостаткам двоичного кодирования относят очень длинные записи двоичных кодов, что затрудняет работу с ними.

Двоичная система используется в цифровой электронике, компьютерной технике. Двоичная система в современном представлении была полностью описана немецким философом и математиком Готтфридом Лейбницем в XVII веке в работе «Explication de l’Arithmetique Binaire» («Объяснение бинарной арифметики»). Компьютер обрабатывает информацию только в закодированном виде.

Кодирование и его теория своими корнями связаны с древнейшим искусством тайнописи или криптографии. Первой ориентированной на технику системой кодирования стала азбука Морзе. Это попытка двоичного кодирования, но здесь кроме двух символов — точка и тире — есть еще и третий символ — пробел (пауза). С той или иной степенью точности информацию можно разделить на небольшие элементарные части. Например, текст в книге состоит из букв, пробелов и других символов, рисунок из точек, музыка из отдельных звуков.

В двоичной системе счисления всего две цифры, называемые двоичными (binary digits). Сокращение этого наименования привело к появлению термина бит, ставшего названием разряда двоичного числа. Веса разрядов в двоичной системе изменяются по степеням двойки. Поскольку вес каждого разряда умножается либо на 0, либо на 1, то в результате значение числа определяется как сумма соответствующих значений степеней двойки. Если какой — либо разряд двоичного числа равен 1, то он называется значащим разрядом.

Создатели компьютера отдают предпочтение именно двоичной системе счисления, потому что в техническом устройстве наиболее просто реализовать два противоположных физических состояния. В компьютере «бит» является наименьшей возможной единицей информации. Объем информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации подсчитывается просто по количеству требуемых для такой записи двоичных символов.

Каждый символ — это элементарная часть информации. Информация будет закодированной, если любая ее элементарная часть представлена в виде числа или набора чисел. Перевод с одного языка на другой с помощью словаря, зашифровка сообщения, запись алгоритма на языке программирования меняют только форму представления, внешний вид информации.

Для того чтобы при кодировании информация не потерялась и не исказилась, нужно устанавливать соответствие между двумя знаковыми системами. Составляют таблицы соответствия между знаками или группами знаков. Такие таблицы называются кодовыми. Язык является знаковой системой, соответственно в нем имеется набор знаков и список правил для работы с ними. Правила описывают способы составления из элементарных, основных знаков более сложных конструкций.

Двоичная система счисления является основной системой представления информации в памяти компьютера.

Язык некоторых компьютеров первого поколения основывался только с 50 – х годов 20 – го века, начала применяться практически во всех вычислительных машинах двоичная система, это было обусловлено:

Экономичностью аппаратной реализацией всех схем ЭВМ для радиоэлектронных элементов (радиоламп, полупроводниковых элементов), которые в основном используются в вычислительных машинах;

Более простой реализацией алгоритмов выполнения арифметических и логорических операций;

Более надежный физической реализацией основных функций, так как они имеют всего два состояния (0 и 1), это состояние надежно и помехоустойчиво.

Бит — самое короткое слово двоичного алфавита, причем цифры 0 и 1 при этом равноправны. Количество информации в двоичном коде 10100111 равно 8 бит. Но 1 бит — это очень маленькое количество информации.

Объем информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации подсчитывается просто по количеству требуемых для такой записи двоичных символов.

Двоичное слово из восьми знаков содержит один байт информации, 1024 байта образуют килобайт, 1024 килобайта – мегабайт, а 1024 мегабайта – гигабайт.

Двоичная система используется в цифровых вычислительных устройствах, поскольку является простой и удовлетворяет следующим требованиям:

Чем меньше значений существует в системе, тем проще изготовить отдельные элементы;

Чем меньше количество состояний у элемента, тем выше помехоустойчивость и тем быстрее он может работать;

Простота создания таблиц сложения и умножения – основных арифметических операций над числами.

Система счисления в зависимости от способов изображения чисел делится на:

Примером непозиционной системы счисления может служить римская система, в которой для каждого числа используется специфическое сочетание символов, например ХIV, CXXVII и тому подобное.

Позиционная система счисления определяется ее основанием – числом используемых в ней чисел. В позиционных системах значение каждой цифры определяется ее местом в числе, любое число может быть представлено суммой произведения цифры. Среди позиционных систем счисления наибольшее распространение имеет двоичная система счисления с основанием 2. В ней используются только две цифры 0 и 1 (да – нет, ложь – истина, включено – выключено, есть сигнал – нет сигнала и тому подобное).

Переход от десятичной записи к двоичной осуществляется легко: десятичное число делится на два, затем на два делится частное, затем – новое частное и так до тех пор, пока не будет получено последнее частное (равное 1), причем каждый раз записывается остаток от деления. Выписав последнее частное (1) и вслед за ним в обратном порядке все остатки от деления исходного числа на два, мы получим двоичный эквивалент исходного числа. Чтобы записать двоичное число в десятичной системе, необходимо обратить процедуру: умножить первую цифру слева на 2, к полученному результату прибавить вторую цифру слева, полученную сумму прибавить к третьей цифре слева и так далее до тех пор, пока мы не прибавим последнюю (самую правую) цифру двоичного числа.

Читайте также:  Заработок без вложений способы

Десятичное число 6 в двоичной системе записывается как 0110 и расшифровывается так:

0∙2³ + 1∙2² + 1∙2¹ + 0∙2º

ля перевода необходимо разложить число по основанию системы счисления и посчитать результат.

Двоичное число 1011 можно прочесть как десятичное 11:

1∙2³ + 0∙2² + 1∙2¹ + 1∙2º

Существуют формальные правила перевода чисел из одной системы в другую, в частности, двоичного числа в десятичное и наоборот. Например, для перевода целого десятичного числа в двоичное нужно делить его пополам до тех пор, пока в остатке не образуется 0 и 1, а затем записать остатки справа налево.

Первый остаток – это младший нулевой разряд искомого числа. Последнее частное – старшая цифра искомого числа

Таким образом, 13 = 1101.

Количество цифр (бит) в числе определяет разрядность числа. Биты в числе нумеруются справа, налево начиная с нулевого разряда.

Общая формула для подсчета количества кодируемых значений в двоичной системе счисления имеет вид:

где N – количество кодируемых значений, m- число разрядов двоичной системы.

Числа, записанные в двоичной системе, требуют большего числа знаков, чем их аналоги в десятичной системе, в двоичной, и в десятичной системе суть состоит в позиционном принципе записи чисел, поэтому ясно, что современные суперкомпьютеры стали возможны благодаря тому, что четыре тысячи лет назад в Месопотамии было совершено важнейшее открытие в области обозначения чисел.

В последние годы в области прикладной математики, особенно в компьютерах, очень важное значение приобрела двоичная система счисления.

Источник

Язык как способ представления информации, двоичная форма представления информации, её особенности и преимущества

Введение

Слово «информация» происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление. Понятие «информация» является базовым в курсе информатики, невозможно дать его определение через другие, более «простые» понятия. В геометрии, например, невозможно выразить содержание базовых понятий «точка», «луч», «плоскость» через более простые понятия. Содержание основных, базовых понятий в любой науке должно быть пояснено на примерах или выявлено путем их сопоставления с содержанием других понятий.

В случае с понятием «информация» проблема его определения еще более сложная, так как оно является общенаучным понятием. Данное понятие используется в различных науках (информатике, кибернетике, биологии, физике и др.), при этом в каждой науке понятие «информация» связано с различными системами понятий.

Информация в физике. В физике мерой беспорядка, хаоса для термодинамической системы является энтропия системы, тогда как информация (антиэнтропия) является мерой упорядоченности и сложности системы. По мере увеличения сложности системы величина энтропии уменьшается, и величина информации увеличивается. Процесс увеличения информации характерен для открытых, обменивающихся веществом и энергией с окружающей средой, саморазвивающихся систем живой природы (белковых молекул, организмов, популяций животных и так далее).

Таким образом, в физике информация рассматривается как антиэнтропия или энтропия с обратным знаком.

Информация в биологии. В биологии, которая изучает живую природу, понятие «информация» связывается с целесообразным поведением живых организмов. Такое поведение строится на основе получения и использования организмом информации об окружающей среде.

Понятие «информация» в биологии используется также в связи с исследованиями механизмов наследственности. Генетическая информация передается по наследству и хранится во всех клетках живых организмов. Гены представляют собой сложные молекулярные структуры, содержащие информацию о строении живых организмов. Последнее обстоятельство позволило проводить научные эксперименты по клонированию, то есть созданию точных копий организмов из одной клетки.

Информация в кибернетике. В кибернетике (науке об управлении) понятие «информация» связано с процессами управления в сложных системах (живых организмах или технических устройствах). Жизнедеятельность любого организма или нормальное функционирование технического устройства зависит от процессов управления, благодаря которым поддерживаются в необходимых пределах значения их параметров. Процессы управления включают в себя получение, хранение, преобразование и передачу информации.

Социально значимые свойства информации. Человек — существо социальное, для общения с другими людьми он должен обмениваться с ними информацией, причем обмен информацией всегда производится на определенном языке — русском, английском и так далее. Участники дискуссии должны владеть тем языком, на котором ведется общение, тогда информация будет понятной всем участникам обмена информацией.

Информация должна быть полезной, тогда дискуссия приобретает практическую ценность. Бесполезная информация создает информационный шум, который затрудняет восприятие полезной информации. Примерами передачи и получения бесполезной информации могут служить некоторые конференции и чаты в Интернете.

Классификация информации

По способу передачи и восприятия:

3) тактильная (ощущения)

4) органолептическая (запах и вкус)

5) машинно-выдаваемая и воспринимаемая средствами ВТ

По отношению к окружающей среде:

По отношению к исходному результату:

Язык как знаковая система

Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), то есть информация представляется с помощью естественных языков. В основе языка лежит алфавит, то есть набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов).

Последовательности символов алфавита в соответствии с правилами грамматики образуют основные объекты языка — слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом. Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически.

Наряду с естественными языками были разработаны формальные языки (системы счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии строгих правил грамматики и синтаксиса.

Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам. Некоторые языки используют в качестве знаков не буквы и цифры, а другие символы, например химические формулы, ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе) и др.

Знаки могут иметь различную физическую природу. Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов).

Задачи данной работы:

1) Рассмотреть язык, как способ представления информации.

2) Рассмотреть двоичную форму представления информации.

3) Определить особенности и преимущества двоичной формы представления информации.

1. Язык как способ представления информации

Информация — очень емкое понятие, в которое вмещается весь мир: все разнообразие вещей и явлений, вся история, все тома научных исследований, творения поэтов и прозаиков. И все это отражается в двух формах — непрерывной и дискретной. Обратимся к их сущности. Объекты и явления характеризуются значениями физических величин. Например, массой тела, его температурой, расстоянием между двумя точками, длиной пути (пройденного движущимся телом), яркостью света и т.д.

Природа некоторых величин такова, что величина может принимать принципиально любые значения в каком-то диапазоне. Эти значения могут быть сколь угодно близки друг к другу, исчезающе малоразличимы, но все-таки, хотя бы в принципе, различаться, а количество значений, которое может принимать такая величина, бесконечно велико. Такие величины называются непрерывными величинами, а информация, которую они несут в себе, непрерывной информацией. Слово “непрерывность” отчетливо выделяет основное свойство таких величин — отсутствие разрывов, промежутков между значениями, которые может принимать величина.

Масса тела — непрерывная величина, принимающая любые значения от 0 до бесконечности. То же самое можно сказать о многих других физических величинах — расстоянии между точками, площади фигур, напряжении электрического тока. Кроме непрерывных существуют иные величины, например, количество людей в комнате, количество электронов в атоме и т.д. Такого рода величины могут принимать только целые значения, например, 0, 1, 2, и не могут иметь дробных значений. Величины, принимающие не всевозможные, а лишь вполне определенные значения, называют дискретными. Для дискретной величины характерно, что все ее значения можно пронумеровать целыми числами 0, 1, 2.

Примеры дискретных величин:

· геометрические фигуры (треугольник, квадрат, окружность);

Можно утверждать, что различие между двумя формами информации обусловлено принципиальным различием природы величин. В то же время непрерывная и дискретная информация часто используются совместно для представления сведений об объектах и явлениях.

Пример. Рассмотрим утверждение “Это окружность радиуса 8,25”. Здесь:

· ”окружность“- дискретная информация, выделяющая определенную геометрическую фигуру из всего разнообразия фигур;

· значение “8,25” — непрерывная информация о радиусе окружности, который может принимать бесчисленное множество значений.

Что объединяет непрерывные и дискретные величины? В качестве простого примера, иллюстрирующего наши рассуждения, рассмотрим пружинные весы. Масса тела, измеряемая на них, — величина непрерывная по своей природе. Представление о массе (информацию о массе) содержит в себе длина отрезка, на которую перемещается указатель весов под воздействием массы измеряемого тела. Длина отрезка — тоже непрерывная величина. Чтобы охарактеризовать массу, в весах традиционно используется шкала, отградуированная, например, в граммах.

Пусть, например, шкала конкретных весов имеет диапазон от 0 до 50 граммов. При этом масса будет характеризоваться одним из 51 значений: 0, 1, 2, 50, т.е. дискретным набором значений. Таким образом, информация о непрерывной величине, массе тела, приобрела дискретную форму. Любую непрерывную величину можно представить в дискретной форме. И механизм такого преобразования очевиден. Зададимся вопросом, можно ли по дискретному представлению восстановить непрерывную величину. И ответ будет таким: да, в какой-то степени можно, но сделать это не так просто, и восстанавливаемый образ может отличаться от подлинника.

Как представлять непрерывную информацию? Для представления непрерывной величины могут использоваться самые разнообразные физические процессы. В рассмотренном выше примере весы позволяют величину “масса тела” представить “длиной отрезка”, на который переместится указатель весов (стрелка). В свою очередь, механическое перемещение можно преобразовать, например, в “напряжение электрического тока”. Для этого можно использовать потенциометр, на который подается постоянное напряжение, например, 10 вольт, от источника питания. Движок потенциометра можно связать с указателем весов. В таком случае изменение массы тела от 0 до 50 граммов приведет к перемещению движка в пределах длины потенциометра (от 0 до L миллиметров) и, следовательно, к изменению напряжения на его выходе от 0 до 10 вольт.

Такое преобразование можно изобразить следующим образом: Масса Длина Напряжение 0 — 50 [г] 0 — L [мм] 0 — 10 [в]

Отметим, что физические процессы (перемещение, электрический ток и др.) могут существовать сами по себе или использоваться, например, для передачи энергии. Но в ряде случаев эти же процессы применяются в качестве носителей информации. Чтобы отличить одни процессы от других, введено понятие “сигнал”. Если физический процесс, т.е. какая-то присущая ему физическая величина, несет в себе информацию, то говорят, что такой процесс является сигналом. Именно в этом смысле пользуются понятиями “электрический сигнал”, “световой сигнал” и т.д. Таким образом, электрический сигнал — не просто электрический ток, а ток, величина которого несет в себе какую-то информацию.

Как представлять дискретную информацию? Как уже говорилось, дискретность — это случай, когда объект или явление имеет конечное (счетное) число разнообразий. Чтобы выделить конкретное из всего возможного, нужно каждому конкретному дать оригинальное имя (иначе, перечислить). Эти имена и будут нести в себе информацию об объектах, явлениях и т. п.В качестве имен часто используют целые числа 0, 1, 2. Так именуются (нумеруются) страницы книги, дома вдоль улицы, риски на шкалах измерительных приборов. С помощью чисел можно перенумеровать все “разнообразия” реального мира.

Читайте также:  Как посолить зеленые помидоры простым способом

Именно такая цифровая форма представления информации используется в ЭВМ. В обыденной жизни, тем не менее, цифровая форма представления информации не всегда удобна. Первенство принадлежит слову! Традиционно информация об объектах и явлениях окружающего мира представляется в форме слов и их последовательностей. Основной элемент в этой форме — слово. Слово — имя объекта, действия, свойства и т.п., с помощью которого выделяется именуемое понятие в устной речи или в письменной форме. Слова строятся из букв определенного алфавита (например, А, Б, Я). Кроме букв используются специальные символы — знаки препинания, математические символы +, -, знак интеграла, знак суммы и т.п.

Все разнообразие используемых символов образует алфавит, на основе которого строятся самые разные объекты: из цифр — числа; из букв — собственно слова, из цифр, букв и математических символов — формулы и т.д. И все эти объекты несут в себе информацию : числа — информацию о значениях; слова — информацию об именах и свойствах объектов; формулы — информацию о зависимостях между величинами и т.д. Эта информация (и это очевидно) имеет дискретную природу и представляется в виде последовательности символов. О такой информации говорят как об особом виде дискретной информации и называют этот вид символьной информацией. Наличие разных систем письменности, в том числе таких, как иероглифическое письмо, доказывает, что одна и та же информация может быть представлена на основе самых разных наборов символов и самых разных правил использования символов при построении слов, фраз, текстов.

Из этого утверждения можно сделать следующий вывод: Разные алфавиты обладают одинаковой “изобразительной возможностью”, т.е. с помощью одного алфавита можно представить всю информацию, которую удалось представить на основе другого алфавита. Можно, например, ограничиться алфавитом из десяти цифр — 0, 1, 9 и с использованием только этих символов записать текст любой книги или партитуру музыкального произведения. При этом сужение алфавита до десяти символов не привело бы к каким-либо потерям информации. Более того, можно использовать алфавит только из двух символов, например, символов 0 и 1. И его “изобразительная возможность” будет такой же.

Итак, символьная информация может представляться с использованием самых различных алфавитов (наборов символов) без искажения содержания и смысла информации: при необходимости можно изменять форму представления информации — вместо общепринятого алфавита использовать какой-либо другой, искусственный алфавит, например, двухбуквенный. Форма представления информации, отличная от естественной, общепринятой, называется кодом. Коды широко используются в нашей жизни: почтовые индексы, телеграфный код Морзе и др. Широко применяются коды и в ЭВМ и в аппаратуре передачи данных. Так, например, широко известно понятие “программирование в кодах”. Кроме рассмотренных существуют и другие формы представления дискретной информации. Например, чертежи и схемы содержат в себе графическую информацию.

Язык — множество символов и совокупность правил, определяющих способы составления из этих символов осмысленных сообщений. Семантика — система правил и соглашений, определяющая толкование и придание смысла конструкциям языка.

Кодирование информации — это процесс формирования определенного представления информации. При кодировании информация представляется в виде дискретных данных. Декодирование является обратным к кодированию процессом.

В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации.

Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Знаки или символы любой природы, из которых конструируются информационные сообщения, называют кодами. Полный набор кодов составляет алфавит кодирования. Простейшим алфавитом, достаточным для записи информации о чем-либо, является алфавит из двух символов, описывающих два его альтернативных состояния («да» — «нет», «+» — «-«, 0 или 1).

Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

Любое информационное сообщение можно представить, не меняя его содержания, символами того или иного алфавита или, говоря иначе, получить ту или иную форму представления. Например, музыкальная композиция может быть сыграна на инструменте (закодирована и передана с помощью звуков), записана с помощью нот на бумаге (кодами являются ноты) или намагничена на диске (коды — электромагнитные сигналы).

Способ кодирования зависит от цели, ради которой оно осуществляется. Это может быть сокращение записи, засекречивание (шифровка) информации, или, напротив, достижение взаимопонимания. Например, система дорожных знаков, флажковая азбука на флоте, специальные научные языки и символы — химические, математические, медицинские и др., предназначены для того, чтобы люди могли общаться и понимать друг друга. От того, как представлена информация, зависит способ ее обработки, хранения, передачи и т.д.

Компьютер с точки зрения пользователя работает с информацией самой различной формы представления: числовой, графической, звуковой, текстовой и пр. Но мы уже знаем (упоминалось выше), что он оперирует только цифровой (дискретной) информацией. Значит, должны существовать способы перевода информации из внешнего вида, удобного пользователю, во внутреннее представление, удобное компьютеру, и обратно.

Рисунок 1. – Способ кодирования информации.

2. Позиционные и непозиционные системы счисления

Разнообразные системы счисления, которые существовали раньше и которые используются в наше время, можно разделить на непозиционные и позиционные системы счисления. Знаки, используемые при записи чисел, называются цифрами.

В непозиционных системах счисления от положения цифры в записи числа не зависит величина, которую она обозначает. Примером непозиционной системы счисления является римская система, в которой в качестве цифр используются латинские буквы:

I V X L C D M

В числе цифры записываются слева направо в порядке убывания. Величина числа определяется как сумма или разность цифр в числе. Если меньшая цифра стоит слева от большей цифры, то она вычитается, если справа — прибавляется.

Например:

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от ее позиции. Количество используемых цифр называется основанием системы счисления. Место каждой цифры в числе называется позицией.

Система счисления Основание Алфавит
Десятичная
Двоичная
Троичная
Восьмеричная
Шестнадцатеричная 0123456789ABCDEF

Первая известная нам система, основанная на позиционном принципе — шестидесятеричная вавилонская. Цифры в ней были двух видов, одним из которых обозначались единицы, другим — десятки. Следы вавилонской системы сохранились до наших дней в способах измерения и записи величин углов и промежутков времени.

Однако наибольшую ценность для нас имеет индо-арабская десятичная система. Индийцы первыми использовали ноль для указания позиционной значимости величины в строке цифр. Эта система получила название десятичной системы счисления, так как в ней десять цифр.

Для того чтобы лучше понять различие позиционной и непозиционной систем счисления, рассмотрим пример сравнения двух чисел. В позиционной системе счисления сравнение двух чисел происходит следующим образом: в рассматриваемых числах слева направо сравниваются цифры, стоящие в одинаковых позициях. Большая цифра соответствует большему значению числа. Например, для чисел 123 и 234, 1 меньше 2, поэтому число 234 больше, чем число 123. В непозиционной системе счисления это правило не действует. Примером этого может служить сравнение двух чисел IX и VI. Несмотря на то, что I меньше, чем V, число IX больше, чем число VI.

Далее мы будем рассматривать только позиционные системы счисления.

Основание системы счисления, в которой записано число, обычно обозначается нижним индексом. Например, 5557 — число, записанное в семеричной системе счисления. Если число записано в десятичной системе, то основание, как правило, не указывается. Основание системы — это тоже число, и его мы будем указывать в обычной десятичной системе. Вообще, число x может быть представлено в системе с основанием p, как

x = an*pn+an-1*pn-1+ a1*p1+a0*p0,

где an-a0 — цифры в представлении данного числа.

10102 = 1*23+0*22+1*21+0*20 = 10.

Наибольший интерес при работе на ЭВМ представляют системы счисления с основаниями 2, 8 и 16. Вообще говоря, этих систем счисления обычно хватает для полноценной работы, как человека, так и вычислительной машины. Однако иногда в силу различных обстоятельств приходится обращаться к другим системам счисления, например, к троичной, семеричной или системе счисления по основанию 32.

Для того чтобы нормально оперировать с числами, записанными в таких нетрадиционных системах, важно понимать, что принципиально они ничем не отличаются от привычной нам десятичной системы счисления. Сложение, вычитание, умножение в них осуществляется по одной и той же схеме.

Почему же мы не пользуемся другими системами счисления? В основном потому, что в повседневной жизни мы привыкли пользоваться десятичной системой счисления, и нам не требуется никакая другая система счисления. В вычислительных же машинах используется двоичная система счисления, так как оперировать над числами, записанными в двоичном виде, довольно просто.

Часто в информатике используют шестнадцатеричную систему, так как запись чисел в ней значительно короче записи чисел в двоичной системе. Может возникнуть вопрос: почему бы не использовать для записи очень больших чисел систему счисления, например по основанию 50? Для такой системы счисления необходимы 10 обычных цифр плюс 40 знаков, которые соответствовали бы числам от 10 до 49 и вряд ли кому-нибудь понравится работать с этими сорока знаками. Поэтому в реальной жизни системы счисления по основанию, большему 16, практически не используются.

Люди предпочитают десятичную систему, вероятно, потому, что с древних времен считали по пальцам. Но, не всегда и не везде люди пользовались десятичной системой счисления. В Китае, например, долгое время применялась пятеричная система счисления.

Анализируя информацию, мы сталкиваемся с необходимостью оценки качества и определения количества получения информации. Определить качество информации чрезвычайно сложно, а часто и вообще невозможно. Какие-либо сведения, например исторические, десятилетиями считаются ненужными, и вдруг их ценность может резко возрасти. Вместе с этим определить количество информации не только нужно, но и можно. Это, прежде всего, необходимо для того, чтобы сравнить друг с другом массивы информации, определить, какие размеры должны иметь материальные объекты (бумага, магнитная лента и т. д.), хранящие эту информацию.

Для определения количества информации нужно найти способ представить любую ее форму (символьную, текстовую, графическую) в едином виде. Иначе говоря, надо суметь эти формы информации преобразовать так, чтобы она получила единый стандартный вид. Таким видом стала так называемая двоичная форма представления информации — запись любой информации в виде последовательности только двух символов. Эти символы могут на бумаге обозначаться любым способом: буквами А, Б; словами ДА, НЕТ. Однако ради простоты записи взяты цифры 1 и 0. В электронном аппарате, хранящем либо обрабатывающем информацию, рассматриваемые символы могут также обозначаться по-разному: один из них — наличием в рассматриваемой точке электрического тока либо магнитного поля, второй — отсутствием в этой точке электрического тока либо магнитного поля.

Методику представления информации в двоичной форме можно пояснить, проведя следующую игру. Нужно у собеседника получить интересующую нас информацию, задавая любые вопросы, но получая в ответ только одно из двух: ДА либо НЕТ. Известным способом получения во время этого диалога двоичной формы информации является перечисление всех возможных событий. Рассмотрим простейший пример получения информации. Вы задаете только один вопрос: «Идет ли дождь?». При этом условимся, что с одинаковой вероятностью ожидаете ответ «ДА» или «НЕТ». Легко увидеть, что любой из этих ответов несет самую малую порцию информации. Эта порция определяет единицу измерения информации, называемую битом. Благодаря введению понятия единицы информации появилась возможность определения размера любой информации числом битов. Образно говоря, если, например, объем грунта определяют в кубометрах, то объем информации — в битах.

Читайте также:  Какие способы оптимизации налогов

Условимся каждый положительный ответ представлять цифрой 1, а отрицательный — цифрой 0. Тогда запись всех ответов образует многозначную последовательность цифр, состоящую из нулей и единиц, например 0100. Рассмотренный процесс получения двоичной информации об объектах исследования называют кодированием информации. Кодирование информации перечислением всех возможных событий очень трудоемко. Поэтому на практике кодирование осуществляется более простым способом. Он основан на том, что один разряд последовательности двоичных цифр имеет уже вдвое больше различных значений (00, 01, 10, 11), чем одноразрядная последовательность (0 и 1). Трехразрядная последовательность имеет также вдвое больше значений (000, 001, 010,011, 100, 101, 110, 111), чем двухразрядная, и т. д. Добавление одного разряда увеличивает число значений вдвое.

Вообще говоря, п-разрядная последовательность имеет 2″ значений. Пользуясь этим, легко закодировать любое множество событий. Например, нам нужно закодировать 32 буквы русского алфавита, для этой цели достаточно взять пять разрядов, потому что пятиразрядная последовательность имеет 32 различных значения. В информационных документах широко используются не только русские, но и латинские буквы, цифры, математические знаки и другие специальные знаки, всего примерно 200—-250 символов. Поэтому для кодировки всех указанных символов используется восьмиразрядная последовательность цифр 0 и 1. Например, русские буквы представляются восьмиразрядными последовательностями следующим образом: А — 11000001, И — 1100101), Я — 11011101.

Следует отметить, что указанный способ кодирования используется тогда, когда к нему не предъявляются дополнительные требования: допустим, необходимо указать на возникшую ошибку, исправление ошибки, обеспечить секретность информации. В этих случаях применяют специальное кодирование, при использовании которого коды получаются длиннее, чем в указанном способе. Для представления графической информации в двоичной форме используется так называемый поточечный способ. На первом этапе вертикальными и горизонтальными линиями делят изображение. Чем больше при этом получилось квадратов, тем точнее будет передана информация о картинке. Как известно из физики, любой цвет может быть представлен в виде суммы различной яркости зеленого, синего и красного цветов. Поэтому информация о каждой клетке будет иметь довольно сложный вид: номер клетки — 101 10010, 01111010, яркость зеленого — 1010, яркость синего — 1101, яркость красного — ООП.

В ЭВМ используют двоичную систему потому, что она имеет ряд преимуществ перед другими:

1) для ее реализации используются технические элементы с двумя возможными состояниями (есть ток — нет тока, намагничен — ненамагничен);

2) представление информации посредством только двух состояний надежно и помехоустойчиво;

3) возможно применение аппарата булевой алгебры для выполнения логических преобразований информации;

4) двоичная арифметика проще десятичной (двоичные таблицы сложения и умножения предельно просты).

В двоичной системе счисления всего две цифры, называемые двоичными (binary digits). Сокращение этого наименования привело к появлению термина бит, ставшего названием разряда двоичного числа. Веса разрядов в двоичной системе изменяются по степеням двойки.

Поскольку вес каждого разряда умножается либо на 0, либо на 1, то в результате значение числа определяется как сумма соответствующих значений степеней двойки. Если какой-либо разряд двоичного числа равен 1, то он называется значащим разрядом. Запись числа в двоичном виде намного длиннее записи в десятичной системе счисления.

Арифметические действия, выполняемые в двоичной системе, подчиняются тем же правилам, что и в десятичной системе. Только в двоичной системе счисления перенос единиц в старший разряд возникает чаще, чем в десятичной.

Вот как выглядит таблица сложения в двоичной системе:

0 + 0 = 0 0 + 1 = 1
1 + 0 = 1 1 + 1 = 10 (перенос в старший разряд)

Таблица умножения для двоичных чисел еще проще:

0 * 0 = 0 1 * 0 = 0 0 * 1 = 0 1 * 1 = 1

Рассмотрим подробнее, как происходит процесс умножения двоичных чисел. Пусть надо умножить число 1101 на 101 (оба числа в двоичной системе счисления). Машина делает это следующим образом: она берет число 1101 и, если первый элемент второго множителя равен 1, то она заносит его в сумму. Затем сдвигает число 1101 влево на одну позицию, получая тем самым 11010, и если, второй элемент второго множителя равен единице, то тоже заносит его в сумму. Если элемент второго множителя равен нулю, то сумма не изменяется.

Двоичное деление основано на методе, знакомом вам по десятичному делению, т. е. сводится к выполнению операций умножения и вычитания. Выполнение основной процедуры — выбор числа, кратного делителю и предназначенного для уменьшения делимого, здесь проще, так как таким числом могут быть только либо 0, либо сам делитель.

Следует отметить, что большинство калькуляторов, реализованных на компьютере, позволяют осуществлять работу в системах счисления с основаниями 2, 8, 16 и, конечно, 10.

При наладке аппаратных средств компьютера или создании новой программы возникает необходимость «заглянуть внутрь» памяти машины, чтобы оценить ее текущее состояние. Но там все заполнено длинными последовательностями нулей и единиц двоичных чисел. Эти последовательности очень неудобны для восприятия человеком, привыкшим к более короткой записи десятичных чисел. Кроме того, естественные возможности человеческого мышления не позволяют оценить быстро и точно величину числа, представленного, например, комбинацией из 16 нулей и единиц.

Для облегчения восприятия двоичного числа решили разбивать его на группы разрядов, например, по три или четыре разряда. Эта идея оказалась очень удачной, так как последовательность из трех бит имеет 8 комбинаций, а последовательность из 4 бит — 16. Числа 8 и 16 являются степенями двойки, поэтому легко находить соответствие с двоичными числами. Развивая эту идею, пришли к выводу, что группы разрядов можно закодировать, сократив при этом длину последовательности знаков.

Для кодировки трех битов требуется восемь цифр, поэтому взяли цифры от 0 до 7 десятичной системы. Для кодировки же четырех битов необходимо шестнадцать знаков; для этого взяли 10 цифр десятичной системы и 6 букв латинского алфавита: A, B, C, D, E, F. Полученные системы, имеющие основания 8 и 16, назвали соответственно восьмеричной и шестнадцатеричной.

В восьмеричной (octal) системе счисления используются восемь различных цифр 0, 1, 2, 3, 4, 5, 6, 7. Основание системы — 8. При записи отрицательных чисел перед последовательностью цифр ставят знак минус. Сложение, вычитание, умножение и деление чисел, представленных в восьмеричной системе, выполняются весьма просто подобно тому, как это делают в общеизвестной десятичной системе счисления. В различных языках программирования запись восьмеричных чисел начинается с 0, например, запись 011 означает число 9.

В шестнадцатеричной (hexadecimal) системе счисления применяется десять различных цифр и шесть первых букв латинского алфавита. При записи отрицательных чисел слева от последовательности цифр ставят знак минус. Для того чтобы при написании компьютерных программ отличить числа, записанные в шестнадцатеричной системе, от других, перед числом ставят 0x. То есть 0x11 и 11 — это разные числа. В других случаях можно указать основание системы счисления нижним индексом.

Шестнадцатеричная система счисления широко используется при задании различных оттенков цвета при кодировании графической информации (модель RGB). Так, в редакторе гипертекста Netscape Composer можно задавать цвета для фона или текста как в десятичной, так и шестнадцатеричной системах счисления.

Рисунок 2. – Непозиционные системы счисления.

Рисунок 3. – Позиционные системы счисления.

Заключение

Информацию можно классифицировать разными способами, и разные науки это делают по-разному. Например, в философии различают информацию объективную и субъективную. Объективная информация отражает явления природы и человеческого общества. Субъективная информация создается людьми и отражает их взгляд на объективные явления.

В информатике отдельно рассматривается аналоговая информация и цифровая. Это важно, поскольку человек благодаря своим органам чувств, привык иметь дело с аналоговой информацией, а вычислительная техника, наоборот, в основном, работает с цифровой информацией.

Человек воспринимает информацию с помощью органов чувств. Свет, звук, тепло – это энергетические сигналы, а вкус и запах – это результат воздействия химических соединений, в основе которого тоже энергетическая природа. Человек испытывает энергетические воздействия непрерывно и может никогда не встретиться с одной и той же их комбинацией дважды. Нет двух одинаковых зеленых листьев на одном дереве и двух абсолютно одинаковых звуков – это информация аналоговая. Если же разным цветам дать номера, а разным звукам – ноты, то аналоговую информацию можно превратить в цифровую.

Кодирование информации. Кодирование информации – это процесс формирования определенного представления информации.

В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью компьютерных программ можно преобразовывать полученную информацию, например «наложить» друг на друга звуки от разных источников.

Аналогично на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичнойсистеме счисления, поскольку при этом устройства для их обработки получаются значительно более простыми.

Список использованной литературы

1) Блюменау Д.И. Информация и информационный сервис.- Л.:Наука, 1989 г.

2) Брябрин В.М. Программное обеспечение персональных компьютеров. М., Наука, 1987 г.

3) Воскресенский Г.М. Теория и практика информационного обеспечения управления в органах внутренних дел. Учебное пособие, М., Академия МВД СССР, 1985 г.

4) Глушков В.М. Основы безбумажной информатики. М., 1987 г.

5) Грибунов В.И., Кирдан В.С., Козубовский С.Ф. Справочник по ЭВМ.- Киев Наукова Думка 1989.

6) Дейтин Г. Введение в операционные системы. Перевод с английского. В 2-х томах, М., Мир, 1987 г.

7) Максимов Ю.Я., Осипов С.В., Симоненков О.С. Практическая работа на компьютерах семейства IBM PC в операционной среде MS-DOS 4.01. М., Центр МИФИ СП «Диалог», 1990 г.

8) Микрокомпьютеры для юристов. / Мак-Кланг Кр.Дж.,Геррери Дж.А., Мак-Кланг К.А. мл., пер. с анг. М., 1987 г.

9) Михнушев А.Г. Информатика в социальном управлении: От знакомства с компьютером к решению практических задач. Ил. учебное пособие. Киев, Политиздат Украины, 1990 г.

10) Операционная система MS-DOS (версия 6.0). Справочное руководство.

11) Основы применения вычислительной техники в органах внутренних дел. Под редакцией А.П.Полежаева, А.И.Смирнова, М., Академия МВД СССР, 1988 г.

12) Персональные компьютеры: под редакцией В.А. Комарницкого- М. Машиностроение 1989.

13) Правовая информатика и кибернетика: под редакцией Н.С.Полевого- М.Юридическая литература 1993.

14) Решетников В.Н., Сотников А.Н. Информатика — что это?.- М.: Радио и связь, 1989 г.

15) Фигурнов В.Э. IBM PC для пользователя. 6-е изд., перераб. и доп. М.:Финансы и статистика, КомпьютерПресс 1995.

16) Якубайтис Э.А. Информатика — Электроника — Сети. М.: Финансы и статистика 1989.

Источник

Оцените статью
Разные способы