Способ представления информации эвм

Содержание

2.3.3. Способы представления информации в эвм
Способы представления информации в ЭВМ
Информация
Виды информации
Работа с информацией
Материальная основа информации
Двоичный код
Числовая информация
Текстовая информация
Растровая графика
Векторная графика
Звуковая информация

2.3.3. Способы представления информации в эвм

Информация в ЭВМ записывается в форме цифрового двоичного кода, т. к. элементы из которых строится память, могут находиться в двух устойчивых состояниях 0 и 1. Двоичное кодирование используется для представления как числовой, так и текстовой, графической, звуковой информации. Форматы представления данных в памяти компьютера определяют диапазоны значений, которые эти данные могут принимать, скорость их обработки, объем памяти, который требуется для хранения этих данных.

В ЭВМ используются следующие формы представления данных:

числа с фиксированной точкой;

числа с плавающей точкой;

2.3.3.1. Числа с фиксированной точкой.

Целые числа точно представляются в памяти компьютера и позволяют выполнять операции без погрешностей. Аппаратурой компьютеров поддерживается несколько форматов представления целых данных и множество операций над ними.

Целые числа в памяти компьютера всегда хранятся в формате с фиксированной точкой, что, безусловно, ограничивает диапазон чисел, с которыми может работать компьютер и требует учета особенностей организации арифметических действий в ограниченном числе разрядов. Рассмотрим подробнее это представление.

Все числа, которые хранятся в памяти компьютера, занимают определенное число двоичных разрядов. Это количество определяется форматом числа. Обычно для представления целых чисел используют несколько форматов. В IBM-совместимых ПК поддерживается три формата: байт (8 разрядов), слово (16 разрядов), двойное слово (32 разряда). Целые числа вписываются в разрядную сетку, соответствующую формату. Для целых чисел разрядная сетка имеет вид:

где — разряды двоичной записи целого числа,S- разряд, отведенный для представления знака числа. Для положительных чисел знак кодируется цифрой 0, а для отрицательных – цифрой 1 (прямой код). Разделитель между целой и дробной частью зафиксирован после, дробной части нет.N- количество двоичных разрядов в разрядной сетке. Если количество разрядов в сетке оказывается больше, чем количество цифр в числе, то старшие разряды заполняются нулями. Например, числов формате байта (8 бит) запишется так:

Для упрощения операций с отрицательными числами используются специальные (обратный и дополнительный) коды (см. выше).

2.3.3.2. Числа с плавающей точкой

Для представления вещественных чисел используется форма чисел с плавающей точкой. Такое представление основано на записи числа в экспоненциальном виде: — нормальная форма. Нормальная форма представления чисел неоднозначна. Например, десятичное числоможно представитьДля однозначности используется нормализованная форма, в которой положение точки всегда задается перед первой значащей цифрой мантиссы. При использовании такой формы часть разрядов используется для хранения порядка числа р, а остальные — разряды для хранения мантиссы:

Порядок числа и его мантисса хранятся в двоичном коде. Точность вычислений зависит от длины мантиссы, а порядок числа определяет допустимый диапазон представления действительных чисел. В IBM-совместимых компьютерах используется три формата представления данных в форме с плавающей точкой (32 разряда, 64 разряда и 80 разрядов), позволяющие определить три диапазона для положительных вещественных чисел: от 1,5х10 -45 до 3,4х10 38 , от 5х10 -324 до 1,7х10 308 и от 1,9х10 -4951 до 1,1х10 4932 . Для представления положительных чисел в знаковый разряд записывается 0, а для отрицательных — 1. Порядок и мантисса записываются в разрядную сетку как целые числа.

Особенности представления вещественных чисел в памяти ПК определяет свойства машинных чисел: при переводе дробной части десятичного числа в формат с плавающей точкой происходит его округление до количества разрядов, определяемых длинной мантиссы. Ограниченная длина мантиссы приводит к погрешности при выполнении операций – лишние разряды отсекаются или происходит округление чисел.

Текстовые данные рассматриваются как последовательность отдельных символов, каждому из которых ставится в соответствие двоичный код некоторого неотрицательного целого числа. Существуют разные способы кодирования символов. Наиболее распространенной до последнего времени была кодировка ASCII(AmericanStandardCodeforInternationalInterchange). При использовании этой кодировки для представления символа используется 1 байт (8 разрядов). Таким образом, имеется возможность закодировать 256 различных символов.

Для отображения текстового документа с разбивкой его на строки, выравниванием и другими элементами форматирования, в него наряду с обычными символами включаются специальные (управляющие) символы.

В системе ASCIIзакреплены две таблицы кодирования базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная от 128 до 255. Первые 32 кода базовой таблицы, начиная с нулевого, содержат управляющие коды. Они не выводятся на экран, но с их помощью можно управлять выводом других данных. С 32 по 127 код размещены символы английского алфавита, цифры, знаки арифметических операций и т. п. Расширенная часть системы кодированияASCIIсодержит национальные системы кодирования, т. е. коды с 128 по 255 будут содержать русский алфавит, а также символы псевдографики.

ASCIIпозволяет закодировать только 256 символов, но в некоторых языках символов больше, поэтому разрабатываются другие коды. Наиболее перспективным являетсяUnicode. В этом коде каждый символ состоит из 16 битов (2 байта), что позволяет кодировать 65536 различных символов. Для каждого алфавита определены свои кодовые позиции. Например, 0100-017F– европейские латинские символы , 0400-04FF– кириллица и т. д. Около 29000 позиций пока не заняты, но зарезервированы для использования. Таким образом,Unicodeдопускает обмен данными на разных языках, каждому коду соответствует единственный символ, коды для разных языков не пересекаются.

На Unicodeпостроена ОСWindowsNT. УWindows95-98 16-битное наследство, поэтому вся внутренняя работа в этой ОС построена на использованииANS-строк (ANSII–AmericanNationalStandardInstitute), в которых символ записан в один байт.ANSI-текст (или текстASCII) — это текст без форматирования (с ним работает приложение «Блокнот» вWindows9x).

Если для представления информации в разных информационных системах используются разные кодировки, то данные, подготовленные в одной системе, не смогут быть использованы в другой.

2.3.3.4. Кодирование графической информации

Способ кодирования графических изображений, отображаемых на экране, называют матричным. При этом экран рассматривается как двумерный массив отдельных точек (пикселов). Такой метод кодирования графической информации называется растровым. Для каждой точки рассматриваются ее линейные координаты и яркость, которые задаются в виде целых неотрицательных чисел. Общепринятым на сегодняшний день является представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета. Таким образом, для кодирования яркости любой точки будет достаточно одного байта, т. е. восьмиразрядного двоичного числа.

Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три цвета: красный (Red, R), зеленый (Green,G), синий (Blue,B). На практике считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех цветов. Такая система кодирования называется системойRGB- по первым буквам основных цветов.

Если для кодирования яркости каждой из основных составляющих использовать по 256 значений (8 двоичных разрядов), то на кодирование одной точки придется затратить 24 разряда, при этом система кодирования обеспечивает однозначное определение 16,5 миллионов различных цветов. Режим представления цветной графики с использованием 24 разрядов называется полноцветным (TrueColor).

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, т. е. цвет, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов: голубой (Cyan, C), пурпурный (Magenta,M), желтый (Yellow,Y). Принцип декомпозиции произвольного цвета на составляющие компоненты можно применить не только для основных цветов, но и для дополнительных, т. е. любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющих. Такой метод кодирования принят в полиграфии, но там используется еще и четвертая краска – черная (Black, К). Поэтому данная система кодирования обозначается четырьмя буквами -CMYK. Для представления цветной графики в этой системе надо иметь 32 двоичных разряда. Такой режим тоже называется полноцветным (TrueColor).

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом HighColor.

2.3.3.5. Кодирование звуковой информации

Приемы и методы работы со звуковой информацией пришли в вычислительную технику наиболее поздно. Поэтому эти методы работы еще не стандартизированы. Многие фирмы разработали свои корпоративные стандарты. Можно выделить два основных направления.

Метод частотных модуляций FM(FrequencyModulation) основан на том, что практически любой звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, а, следовательно, может быть описан числовыми параметрами, т. е. кодом. В природе звуковые сигналы имеют непрерывный спектр, т. е. являются аналоговыми. Чтобы закодировать звук, его надо дискретизировать. Этот процесс состоит в измерении и запоминании характеристик звуковой волны (амплитуды и периода) в виде двоичного кода. Он выполняется специальными устройствами, которые называют аналого-цифровыми преобразователями (АЦП), несколько десятков тысяч раз в секунду. Обратное преобразование звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). При таких преобразованиях неизбежны потри информации, связанные с методом кодирования, поэтому качество звукозаписи получается не вполне удовлетворительным. Но это достаточно компактный метод, он начал использоваться, когда ресурсов вычислительной техники было недостаточно.

Метод таблично-волнового синтеза (Wave-Table) состоит в следующем. Где-то в заранее подготовленных таблицах хранятся образцы звуков для различных музыкальных инструментов. В технике такие образцы называют сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, параметры среды, в которой происходит звучание и др. Т .к в качестве образца использовались реальные звуки, то качество звука, полученного в результате синтеза получается достаточно высоким и приближается к качеству звучания реальных музыкальных инструментов.

Источник

Способы представления информации в ЭВМ

Окружающий мир заполнен информацией. Ежесекундно через органы чувств человек получает сотни сигналов и сообщений. Столь значимую составляющую жизни невозможно оставить без внимания, появилась даже специальная область знаний, специализирующаяся на информационных процессах и явлениях, – информатика. Ее основное оружие – умные электронно-вычислительные машины, способные быстро и точно анализировать данные и манипулировать ими. Способы представления информации в ЭВМ отличаются от тех, к которым мы привыкли, и обеспечивают максимальную эффективность вычислительного процесса.

Информация

Информация – понятие глобальное, дать ее всеохватное определение затруднительно. До сих пор не существует единого общенаучного термина, каждая область знаний оперирует собственным представлением об информации. Для простоты можно определить ее как данные о состоянии окружающего мира во всех его проявлениях.

Информация имеет смысл лишь тогда, когда ее кто-нибудь воспринимает или использует. В отличие от энергии или массы, которые, как известно, не пропадают, а лишь трансформируются, информация вполне может исчезнуть.

Основная задача информатики – научиться собирать, хранить и передавать данные. Реализация этого – дело непростое. Информация бывает разная, и каждый ее вид требует к себе особого подхода.

Виды информации

На сегодняшний день люди научились работать с огромным разнообразием данных, отличающихся природой происхождения и структурой.

Самые востребованные виды информации:

Графическая информация – это самый первый вид данных, которым человечество научилось манипулировать. Она доступна для восприятия и не требует особенных преобразований. Наскальные рисунки – древнейшее хранилище информации об окружающем мире. На смену им пришли живопись, фотография и технические чертежи.
Числовая информация позволяет описать количественные характеристики объектов. Важность данных этого типа взлетела до небес при развитии торговли и денежного обмена. Чтобы успешно хранить и передавать числовую информацию, пришлось придумать специальные системы символов. Каждая культура считала деньги по-своему, так образовались разные системы счисления.
Текстовая информация – это закодированная особыми символами человеческая речь. С изобретением письменности стало возможным передавать любые концепции на сколь угодно большое расстояние, а также передавать знания следующим поколениям. Для удобства манипуляций с текстовой информацией человечеству пришлось изобрести бумагу и книгопечатание.
Звуковая информация долго не поддавалась человеку. Лишь в конце XIX века появились первые звукозаписывающие устройства, позволяющие воспринимать и сохранять данные.
Видеоинформация – живая графика – покорилась человеку с изобретением кинематографического аппарата.

Все эти данные могут быть записаны, обработаны электронно-вычислительными машинами и переданы от человека к человеку. Они могут храниться без потерь на протяжении долгого времени. Существуют и другие разновидности информации, с которыми человечество еще не научилось работать, например, тактильная или вкусовая.

Деление данных на виды имеет для информатики большое значение. Формы представления информации в ЭВМ базируются на ее особенностях, а каждый вид данных имеет специфическую структуру. Так, символьная и графическая информация обрабатываются машиной по-разному.

Работа с информацией

Главные остановочные пункты в жизненном цикле информации следующие:

восприятие и сбор;
хранение;
передача;
воспроизведение или отображение.

Во время длительного хранения или передачи данные могут искажаться или теряться. Значительные ошибки нарушают или полностью изменяют суть информации, следовательно, их нужно любой ценой избежать.

Для облегчения манипуляций с данными была придумана кодировка. Суть процесса кодирования в том, что информация по строго определенным правилам переводится в другую форму, над ней осуществляется некая операция, а затем происходит обратное преобразование.

Одна из первых удачных попыток кодирования – световые сигналы. Мигание источников света – удобный способ передачи информации на большие расстояния. С развитием техники люди придумали еще множество способов шифровать данные: электрические сигналы, радиоволны.

Кодирование обеспечивает большую сохранность и защищенность данных, позволяет увеличить скорость передачи информации и облегчить ее обработку.

Таким образом, информационный цикл приобретает следующий вид:

сбор;
кодирование;
хранение;
передача;
декодирование;
воспроизведение.

В процессе жизненного цикла данные могут неоднократно подвергаться кодированию и декодированию с использованием разных кодовых систем. Это необходимо для приведения информации в более удобное состояние для осуществления конкретной операции.

Материальная основа информации

Производить какие-либо реальные манипуляции можно только над материальными объектами, имеющими определенные характеристики, которые можно зафиксировать и измерить. Представление информации в ЭВМ базируется на электрических сигналах.

Работающие с данными узлы машины представлены огромным количеством крошечных элементов, которые в любой момент времени пребывают в одном из двух состояний: включенном или выключенном. Конкретная технология реализации может отличаться для разных ЭВМ и даже для разных блоков одной машины. Выключенное состояние обозначается нулем – отсутствие сигнала, включенное – единицей.

Количество информации, получаемое от одного структурного элемента, – один бит. Слово «бит» образовано от выражения binary digit (двоичная цифра). 1 бит – минимальная единица информации. Вся информация в компьютерах представлена последовательностью битов – нулей и единиц. Поразительно, какое огромное многообразие данных может быть зашифровано таким простым способом!

Представление информации в ЭВМ в виде отдельных точечных значений называется дискретным. По сравнению с аналоговым, оно проще реализуется и позволяет легче оперировать большими объемами данных.

Двоичный код

Последовательность битов, представляющая некоторые данные, называется двоичным кодом. С его помощью может быть закодирована любая информация: числовая, символьная, графическая.

Правила, по которым данные преобразуются в машинный код, специфичны для каждого типа. Отдельные значения в них могут совпадать, поэтому декодирование всегда производится в зависимости от контекста.

Двоичное представление информации в ЭВМ имеет ряд преимуществ:

удобство реализации: двухпозиционные элементы гораздо проще и надежнее трех- и более позиционных;
помехоустойчивость: сигнал, в котором присутствуют только два возможных состояния гораздо проще для восприятия;
простота вычислений: двоичная арифметика максимально проста.

Математическая основа представления информации в ЭВМ – система счисления с основанием 2. Она намного проще привычной нам десятичной системы, оперирует всего двумя цифрами – нулем и единицей – и определяет правила всех математических операций, производимых над двоичным кодом.

Числовая информация

Существует три способа представления числовой информации в ЭВМ:

число с фиксированной точкой;
число с плавающей точкой;
двоично-десятичное представление.

У чисел с фиксированной точкой, как следует из названия, место точки (запятой), отделяющей дробную часть строго определено и зафиксировано.

Если точка находится после последней значащей цифры – число является целым.
Расположение точки перед первой значащей цифрой соответствует правильной дроби (меньше единицы по модулю).

Для определения знака выделен самый первый разряд. У положительных чисел в нем расположен 0, у отрицательных – 1.

Главное преимущество такой формы представления – отсутствие погрешностей округления при вычислениях. Главный недостаток – ограниченный диапазон значений, зависящий от разрядной сетки конкретной ЭВМ.

Числа с плавающей точкой представлены сочетанием значений мантиссы и порядка. Такая форма записи называется полулогарифмической.

Точность вычислений для такого представления зависит от длины мантиссы: при округлении могут отсекаться лишние разряды.

И числа с фиксированной точкой, и мантисса, и порядок чисел с плавающей точкой представлены в двоичной системе.

Двоично-десятичное представление чисел обеспечивается специальными процессорами в составе ЭВМ. Число обрабатывается как десятичное, но каждая его цифра представляется двоичной тетрадой. Это позволяет сократить время обработки больших массивов десятичных чисел.

Текстовая информация

Для представления текстовой информации в ЭВМ используются специальные таблицы, в которых каждому символу ставится в соответствие уникальный двоичный код.

В наиболее популярной кодировке ASCII (Американский стандарт кода для международного обмена) на один символ выделено 8 бит – 1 байт. Для кодовой единицы такого размера существует 256 уникальных комбинаций, следовательно, можно закодировать 256 разных текстовых символов. Помимо букв разных алфавитов, в таблице учитываются математические операторы, знаки препинания и прочие специальные элементы.

Конечно, 256 комбинаций – слишком мало для нашего мультикультурного мира. Некоторые языки сами по себе содержат больше букв. В таблицах Unicode увеличили размер базовой единицы кода, выделив под нее 2 байта (16 бит). Это позволило увеличить предел кодирования до 65536 элементов.

Растровая графика

Представление графической информации в ЭВМ называют матричным. Оно основано на разбиении изображения на ряды точек (пикселей). Для каждого пикселя информация о положении, цвете и яркости сохраняется отдельно.

В черно-белых изображениях для точки достаточно указать «степень серости» – одну из 256 градаций серого цвета. Для этого выделяется 1 байт (8 бит).

Цветные иллюстрации требуют больше данных. Чтобы закодировать информацию о цвете точки, его представляют в виде композиции трех базовых цветов: красного, зеленого и синего. Это модель Red-Green-Blue – RGB. Кодирование одной точки цветного изображения требует 24 разрядов – по одному байту (8 бит) для каждой составляющей.

Векторная графика

Изображение может быть описано и по-другому. Для этого оно разбивается на элементарные фигуры – отрезки, дуги, круги. Каждая часть может быть описана с помощью математических формул. Так, круг представляется совокупностью координаты центра и радиуса окружности. Такой способ описания графики называется векторным.

Звуковая информация

Способы представления в ЭВМ информации о звуках значительно сложнее. Они активно развиваются, но еще далеки от стандартизации. Существует два основных направления обработки звуковых сигналов:

Частотные модуляции (FM) – это попытка разложить звук на последовательность простых правильных гармонических сигналов, параметры которых можно описать. Основная сложность в том, что звук по своей природе непрерывен, а преобразование аналогового сигнала в дискретный всегда сопровождается потерями данных.
Таблично-волновой синтез предполагает использование сэмплов – образцов звуков. При этом кодируется тип музыкального инструмента, высота тона, интенсивность и длительность сигнала. Качество полученного звука получается выше, чем в предыдущем способе, так как используются реальные образцы.

Мир заполнен информацией самых разных видов. Чтобы с ней работать, человек придумал кодирование – перевод сложных данных в простую форму для удобства хранения, передачи и обработки. В ЭВМ представление информации осуществляется в виде бинарного кода – последовательности отдельных битов. Любые данные могут быть зашифрованы таким методом. Все операции над числами компьютер производит по правилам двоичной системы счисления.

Источник