Способы представления информации в вычислительных машинах
Определим основные понятия, связанные с представлением информации в ВМ.
Функциональные схемы ВМ и вычислительных устройств состоят из блоков, каждый из которых является преобразователем информации. Преобразователь информации – это некоторый блок, имеющий входы, на которые поступает входная информация, и некоторые выходы, на которых представлена выходная информация. Информация на входах и выходах блоков представлена сигналами.
Сигнал – это носитель информации в виде изменяющейся во времени физической величины, обеспечивающей передачу данных. Сигнал называется дискретным, если параметр сигнала может принимать лишь конечное число значений.
В настоящее время подавляющее большинство преобразователей информации представляют собой электронные схемы, содержащие соединенные определенным образом между собой электронные ключи – вентили. Эти электронные схемы реализуются с использованием технологий современной микроэлектроники в виде ИС. ИС может содержать от нескольких единиц до нескольких миллионов вентилей. Для работы ИС к ней подводится напряжение питания. При этом сигналы в ИС представлены уровнем напряжения. Для представления сигналов приняты всего два непересекающихся диапазона уровней напряжения. При напряжении питания 5 В: диапазон 0 – 0,4В, соответствующий логическому значению сигнала «0», и диапазон 5 – 2,4В, соответствующий значению сигнала «1». Промежуточные значения напряжения соответствуют неопределенному логическому значению сигнала. При исправной аппаратуре эти значения возникают кратковременно только при переключениях значений сигналов. В дисциплинах по организации и архитектуре информационных систем рассматриваются только логические значения сигналов. Такие дискретные сигналы представляют логические и двоичные переменные.
Переменные, имеющие всего два значения, используют как логические переменные («0» соответствует значению «ложь», а «1» — «истина»). Переменную со значениями («0» и «1») используют и как двоичную переменную для представления отдельных разрядов чисел в двоичной системе счисления. Двоичная система счисления – это позиционная система счисления с основанием 2.
Информацию, представленную в закодированном виде и используемую в устройствах ВМ, называют данными. Данные разбиваются на составляющие, называемые элементами данных. Элемент данных – это составная часть данных, воспринимаемая при разработке и использовании программ как неделимый объект. Элементы данных имеют различные типы. Указывая, к какому типу данных относится объект программы, программист определяет множество значений, которые данные могут принимать, и совокупность допустимых над ними операций. Примеры типов данных: целые и вещественные числа, логические (булевы) переменные. Для представления различных типов данных с использованием двоичных переменных применяют кодирование.
Код – это система условных знаков (символов) и правил их интерпретации, используемая для представления информации в виде данных.
Информационный обмен между устройствами в ВС, ВК и сетях осуществляется чаще всего передачей сообщений.
Сообщение – информация о ходе или состоянии вычислительного процесса, выдаваемая компонентами информационных систем. Сообщение содержит символы для представления информации.
Символ – это элемент допустимого информационной системой набора знаков, который может быть закодирован, введен в систему, отображен на дисплее. Пример символов – цифры в той или иной системе счисления, буквы из некоторого алфавита и пр. При информационных обменах каждый символ представлен (закодирован) упорядоченной совокупностью двоичных сигналов.
Поскольку любая алфавитная (буквенно-цифровая) информация может быть закодирована в двоичной форме, то подобным образом с использованием двоичных сигналов можно закодировать условия и реализовать решение для любых алгоритмически разрешимых задач.
Информация в ВМ представлена в виде кодов определенной фиксированной длины (машинных слов). Представленную таким образом информацию называют данными. Этот термин используется для закодированных чисел (аргументов и результатов вычислений), программ, текстов, графических образов, звуков и др. Входные данные, поступающие из памяти и различных устройств ввода, под управлением команд программы в ВМ преобразуются в выходные данные, направляемые в память и (или) устройства вывода. При этом в процессы, связанные с получением, передачей, хранением и обработкой информации (данных), вовлекаются аппаратные и программные средства, называемые вычислительными ресурсами.
1.4 Эволюция вычислительной техники
При рассмотрении истории развития вычислительной техники принято выделять несколько поколений вычислительных машин (в разных источниках от 3 до 6). В основу деления на поколения положим технологический подход – поколения меняются со сменой технологий. Отметим, что временные рамки поколений указаны довольно условно.
Нулевое поколение (до 1945 года)
Технология – механические (шестеренки – зубчатые колеса) и электромеханические (реле) вычислительные устройства.
3000 лет до н. э. – абак (Древний Вавилон).
1492 год. Леонардо да Винчи – рисунок тринадцатиразрядного десятичного суммирующего устройства на основе зубчатых колес.
1623 год. Вильгельм Шиккард – эскиз устройства для сложения и вычитания шестиразрядных чисел на основе механических часов.
1642 год. Блез Паскаль – «Паскалин» – первое реально осуществленное устройство (суммирование и вычитание 5-разрядных десятичных чисел).
1673 год. Готфрид Вильгельм Лейбниц – «пошаговый вычислитель» (четыре арифметические операции над 12-разрядными десятичными числами).
1836 год. Чарльз Бэббидж – проект «Аналитической машины». Есть процессор («мельница»), память («склад»), ввод программ и данных с перфокарт.
1937 год. Алан Тьюринг предлагает концепцию теоретической вычислительной машины (машина Тьюринга).
1943 год – группа ученых Гарвардского университета во главе с Говардом Айкеном разрабатывает вычислитель Mark I – первый программно управляемый вычислитель на электромеханических реле. Длина устройства – 18 м, вес – 5 т. Вычислитель обрабатывал 23-разрядные числа, при этом сложение занимало 0,3 с, умножение – 4 с, а деление – 10 с.
Первое поколение (1945–1955)
Технология – электронно-вакуумные лампы. Программирование – машинные коды, Ассемблер. Первые ЭВМ:
· АВС (Atanasoff-Berry Computer), 1942, Джон Атанасов и Клиффорд Берри (США).
· COLOSSUS, 1943, Макс Ньюмен, Томми Флауэрс, Алан Тьюринг (Великобритания).
· ENIAC (Electronic Numerical Integrator and Computer), 1946, Джон Мочли, Преспер Эккерт, Джон фон Нейман (США, 30 тонн, 140 кВт, 18000 электронных ламп, 20 десятиразрядных регистров). 1951 год – первая советская ЭВМ – МЭСМ (Малая Электронная
Счетная Машина), Сергей Алексеевич Лебедев.
1953 год – БЭСМ (Большая Электронная Счетная Машина, 10000 опер./с), С. А. Лебедев.
Второе поколение (1955–1965)
Технология – полупроводниковые транзисторы (Джон Бардин, Уолтер Браттейн, Уильям Шокли – нобелевская премия за создание транзистора, 1956).
С появлением транзисторов на несколько порядков возросли по сравнению с электронно-вакуумными лампами быстродействие и надежность, существенно уменьшились энергопотребление и габариты ВМ.
Программирование – языки высокого уровня Фортран (1956), Алгол (1958), Кобол (1959).
Первые ЭВМ – TX-0 (Transistorized eXperimental computer), TRADIC (TRAnsistor Digital Computer).
· IBM 7090, IBM 7094, IBM 1401 (большие ЭВМ, стоимость – несколько миллионов долларов).
· PDP-1 (120 тысяч долларов), PDP-8 (16 тысяч долларов) – малые ЭВМ, компания DEC.
Третье поколение (1965–1980)
Технология – интегральные микросхемы (Роберт Нойс, 1958). Компьютеры на интегральных микросхемах были меньшего размера,
работали быстрее и стоили дешевле, чем их предшественники на транзисторах.
Программирование – языки структурного программирования С, Pascal. Самые популярные ЭВМ:
· Семейство больших компьютеров IBM-360.
· Малая ЭВМ PDP-11.
· Первые суперкомпьютеры: CDC-6600 (1964), CDC-7600 (1969), Cray-1 (Сеймур Крей).
Разработчик первых суперкомпьютеров Сеймур Крей разработал также алгоритм покупки автомобиля: «Вы идете в магазин, ближайший к вашему дому, показываете на машину, ближайшую к двери, и говорите: «Я беру эту». Этот алгоритм позволяет тратить минимум времени на не очень важные дела (покупку автомобиля) и оставляет большую часть времени на важные (разработку суперкомпьютеров)»
Четвертое поколение (c 1980 года)
Технология – большие и сверхбольшие интегральные микросхемы (БИС и СБИС).
Программирование – объектно-ориентированные языки (С++, Object Pascal), визуальное программирование (Visual C++, Delphi).
1981 год – первый персональный компьютер – IBM PC (процессор Intel 8088, операционная система MS-DOS, руководитель разработки Филипп Эстридж).
Источник
Способы представления информации в ЭВМ
Окружающий мир заполнен информацией. Ежесекундно через органы чувств человек получает сотни сигналов и сообщений. Столь значимую составляющую жизни невозможно оставить без внимания, появилась даже специальная область знаний, специализирующаяся на информационных процессах и явлениях, – информатика. Ее основное оружие – умные электронно-вычислительные машины, способные быстро и точно анализировать данные и манипулировать ими. Способы представления информации в ЭВМ отличаются от тех, к которым мы привыкли, и обеспечивают максимальную эффективность вычислительного процесса.
Информация
Информация – понятие глобальное, дать ее всеохватное определение затруднительно. До сих пор не существует единого общенаучного термина, каждая область знаний оперирует собственным представлением об информации. Для простоты можно определить ее как данные о состоянии окружающего мира во всех его проявлениях.
Информация имеет смысл лишь тогда, когда ее кто-нибудь воспринимает или использует. В отличие от энергии или массы, которые, как известно, не пропадают, а лишь трансформируются, информация вполне может исчезнуть.
Основная задача информатики – научиться собирать, хранить и передавать данные. Реализация этого – дело непростое. Информация бывает разная, и каждый ее вид требует к себе особого подхода.
Виды информации
На сегодняшний день люди научились работать с огромным разнообразием данных, отличающихся природой происхождения и структурой.
Самые востребованные виды информации:
- Графическая информация – это самый первый вид данных, которым человечество научилось манипулировать. Она доступна для восприятия и не требует особенных преобразований. Наскальные рисунки – древнейшее хранилище информации об окружающем мире. На смену им пришли живопись, фотография и технические чертежи.
- Числовая информация позволяет описать количественные характеристики объектов. Важность данных этого типа взлетела до небес при развитии торговли и денежного обмена. Чтобы успешно хранить и передавать числовую информацию, пришлось придумать специальные системы символов. Каждая культура считала деньги по-своему, так образовались разные системы счисления.
- Текстовая информация – это закодированная особыми символами человеческая речь. С изобретением письменности стало возможным передавать любые концепции на сколь угодно большое расстояние, а также передавать знания следующим поколениям. Для удобства манипуляций с текстовой информацией человечеству пришлось изобрести бумагу и книгопечатание.
- Звуковая информация долго не поддавалась человеку. Лишь в конце XIX века появились первые звукозаписывающие устройства, позволяющие воспринимать и сохранять данные.
- Видеоинформация – живая графика – покорилась человеку с изобретением кинематографического аппарата.
Все эти данные могут быть записаны, обработаны электронно-вычислительными машинами и переданы от человека к человеку. Они могут храниться без потерь на протяжении долгого времени. Существуют и другие разновидности информации, с которыми человечество еще не научилось работать, например, тактильная или вкусовая.
Деление данных на виды имеет для информатики большое значение. Формы представления информации в ЭВМ базируются на ее особенностях, а каждый вид данных имеет специфическую структуру. Так, символьная и графическая информация обрабатываются машиной по-разному.
Работа с информацией
Главные остановочные пункты в жизненном цикле информации следующие:
- восприятие и сбор;
- хранение;
- передача;
- воспроизведение или отображение.
Во время длительного хранения или передачи данные могут искажаться или теряться. Значительные ошибки нарушают или полностью изменяют суть информации, следовательно, их нужно любой ценой избежать.
Для облегчения манипуляций с данными была придумана кодировка. Суть процесса кодирования в том, что информация по строго определенным правилам переводится в другую форму, над ней осуществляется некая операция, а затем происходит обратное преобразование.
Одна из первых удачных попыток кодирования – световые сигналы. Мигание источников света – удобный способ передачи информации на большие расстояния. С развитием техники люди придумали еще множество способов шифровать данные: электрические сигналы, радиоволны.
Кодирование обеспечивает большую сохранность и защищенность данных, позволяет увеличить скорость передачи информации и облегчить ее обработку.
Таким образом, информационный цикл приобретает следующий вид:
- сбор;
- кодирование;
- хранение;
- передача;
- декодирование;
- воспроизведение.
В процессе жизненного цикла данные могут неоднократно подвергаться кодированию и декодированию с использованием разных кодовых систем. Это необходимо для приведения информации в более удобное состояние для осуществления конкретной операции.
Материальная основа информации
Производить какие-либо реальные манипуляции можно только над материальными объектами, имеющими определенные характеристики, которые можно зафиксировать и измерить. Представление информации в ЭВМ базируется на электрических сигналах.
Работающие с данными узлы машины представлены огромным количеством крошечных элементов, которые в любой момент времени пребывают в одном из двух состояний: включенном или выключенном. Конкретная технология реализации может отличаться для разных ЭВМ и даже для разных блоков одной машины. Выключенное состояние обозначается нулем – отсутствие сигнала, включенное – единицей.
Количество информации, получаемое от одного структурного элемента, – один бит. Слово «бит» образовано от выражения binary digit (двоичная цифра). 1 бит – минимальная единица информации. Вся информация в компьютерах представлена последовательностью битов – нулей и единиц. Поразительно, какое огромное многообразие данных может быть зашифровано таким простым способом!
Представление информации в ЭВМ в виде отдельных точечных значений называется дискретным. По сравнению с аналоговым, оно проще реализуется и позволяет легче оперировать большими объемами данных.
Двоичный код
Последовательность битов, представляющая некоторые данные, называется двоичным кодом. С его помощью может быть закодирована любая информация: числовая, символьная, графическая.
Правила, по которым данные преобразуются в машинный код, специфичны для каждого типа. Отдельные значения в них могут совпадать, поэтому декодирование всегда производится в зависимости от контекста.
Двоичное представление информации в ЭВМ имеет ряд преимуществ:
- удобство реализации: двухпозиционные элементы гораздо проще и надежнее трех- и более позиционных;
- помехоустойчивость: сигнал, в котором присутствуют только два возможных состояния гораздо проще для восприятия;
- простота вычислений: двоичная арифметика максимально проста.
Математическая основа представления информации в ЭВМ – система счисления с основанием 2. Она намного проще привычной нам десятичной системы, оперирует всего двумя цифрами – нулем и единицей – и определяет правила всех математических операций, производимых над двоичным кодом.
Числовая информация
Существует три способа представления числовой информации в ЭВМ:
- число с фиксированной точкой;
- число с плавающей точкой;
- двоично-десятичное представление.
У чисел с фиксированной точкой, как следует из названия, место точки (запятой), отделяющей дробную часть строго определено и зафиксировано.
- Если точка находится после последней значащей цифры – число является целым.
- Расположение точки перед первой значащей цифрой соответствует правильной дроби (меньше единицы по модулю).
Для определения знака выделен самый первый разряд. У положительных чисел в нем расположен 0, у отрицательных – 1.
Главное преимущество такой формы представления – отсутствие погрешностей округления при вычислениях. Главный недостаток – ограниченный диапазон значений, зависящий от разрядной сетки конкретной ЭВМ.
Числа с плавающей точкой представлены сочетанием значений мантиссы и порядка. Такая форма записи называется полулогарифмической.
Точность вычислений для такого представления зависит от длины мантиссы: при округлении могут отсекаться лишние разряды.
И числа с фиксированной точкой, и мантисса, и порядок чисел с плавающей точкой представлены в двоичной системе.
Двоично-десятичное представление чисел обеспечивается специальными процессорами в составе ЭВМ. Число обрабатывается как десятичное, но каждая его цифра представляется двоичной тетрадой. Это позволяет сократить время обработки больших массивов десятичных чисел.
Текстовая информация
Для представления текстовой информации в ЭВМ используются специальные таблицы, в которых каждому символу ставится в соответствие уникальный двоичный код.
В наиболее популярной кодировке ASCII (Американский стандарт кода для международного обмена) на один символ выделено 8 бит – 1 байт. Для кодовой единицы такого размера существует 256 уникальных комбинаций, следовательно, можно закодировать 256 разных текстовых символов. Помимо букв разных алфавитов, в таблице учитываются математические операторы, знаки препинания и прочие специальные элементы.
Конечно, 256 комбинаций – слишком мало для нашего мультикультурного мира. Некоторые языки сами по себе содержат больше букв. В таблицах Unicode увеличили размер базовой единицы кода, выделив под нее 2 байта (16 бит). Это позволило увеличить предел кодирования до 65536 элементов.
Растровая графика
Представление графической информации в ЭВМ называют матричным. Оно основано на разбиении изображения на ряды точек (пикселей). Для каждого пикселя информация о положении, цвете и яркости сохраняется отдельно.
В черно-белых изображениях для точки достаточно указать «степень серости» – одну из 256 градаций серого цвета. Для этого выделяется 1 байт (8 бит).
Цветные иллюстрации требуют больше данных. Чтобы закодировать информацию о цвете точки, его представляют в виде композиции трех базовых цветов: красного, зеленого и синего. Это модель Red-Green-Blue – RGB. Кодирование одной точки цветного изображения требует 24 разрядов – по одному байту (8 бит) для каждой составляющей.
Векторная графика
Изображение может быть описано и по-другому. Для этого оно разбивается на элементарные фигуры – отрезки, дуги, круги. Каждая часть может быть описана с помощью математических формул. Так, круг представляется совокупностью координаты центра и радиуса окружности. Такой способ описания графики называется векторным.
Звуковая информация
Способы представления в ЭВМ информации о звуках значительно сложнее. Они активно развиваются, но еще далеки от стандартизации. Существует два основных направления обработки звуковых сигналов:
- Частотные модуляции (FM) – это попытка разложить звук на последовательность простых правильных гармонических сигналов, параметры которых можно описать. Основная сложность в том, что звук по своей природе непрерывен, а преобразование аналогового сигнала в дискретный всегда сопровождается потерями данных.
- Таблично-волновой синтез предполагает использование сэмплов – образцов звуков. При этом кодируется тип музыкального инструмента, высота тона, интенсивность и длительность сигнала. Качество полученного звука получается выше, чем в предыдущем способе, так как используются реальные образцы.
Мир заполнен информацией самых разных видов. Чтобы с ней работать, человек придумал кодирование – перевод сложных данных в простую форму для удобства хранения, передачи и обработки. В ЭВМ представление информации осуществляется в виде бинарного кода – последовательности отдельных битов. Любые данные могут быть зашифрованы таким методом. Все операции над числами компьютер производит по правилам двоичной системы счисления.
Источник