Аналоговый и дискретный способ кодирования
Лекция 7
Тема: «Дискретное представление информации»
План
1. Кодирование и декодирование информации в компьютере
2. Аналоговый и дискретный способы кодирования
3. Кодирование изображений
3.1. Кодирование растровых изображений
3.2. Кодирование векторных изображений
3.3. Графические форматы файлов
4. Двоичное кодирование звука
5. Представление видеоинформации
Кодирование и декодирование информации в компьютере
Вся информация, которую обрабатывает компьютер, должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.
Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.
Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.
С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:
0 – отсутствие электрического сигнала;
1 – наличие электрического сигнала.
Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.
Вам приходится постоянно сталкиваться с устройством, которое может находится только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.
Способы кодирования и декодирования информации в компьютере, в первую очередь, зависят от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.
Аналоговый и дискретный способ кодирования
Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных). Зрительные образы могут быть сохранены в виде изображений (рисунков, фотографий и так далее), а звуковые — зафиксированы на пластинках, магнитных лентах, лазерных дисках и так далее.
Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме.
При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно.
При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.
Приведем пример аналогового и дискретного представления информации. Положение тела на наклонной плоскости и на лестнице задается значениями координат X и У. При движении тела по наклонной плоскости его координаты могут принимать бесконечное множество непрерывно изменяющихся значений из определенного диапазона, а при движении по лестнице — только определенный набор значений, причем меняющихся скачкообразно.
Примером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного — изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета. Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).
Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.
Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.
Источник
Представление числа дискретным способом
Компьютеры часто используются для обработки текстовой информации.
В каждом компьютере используется некоторая система кодирования символьных данных, сопоставляющая каждому символу — цифре, букве, специальному знаку — определенный двоичный код.
Количество разных символов, которые может различать компьютер, зависит от числа двоичных разрядов, отводимых для кодирования любого символа.
Традиционно для кодирования одного символа используется количество информации, равное 1 байту, то есть I= 1 байт = 8 битов.
Для кодирования одного символа требуется 1 байт информации. Если рассматривать символы как возможные события, то можно вычислить, какое количество различных символов можно закодировать:
Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр.
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертаниям, а компьютер — по их кодам.
При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает один байт.
В процессе вывода символа на экран компьютера производится обратный процесс — декодирование, то есть преобразование кода символа в его изображение.
Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице (например, ASCII (англ. AmericanStandardCodeforInformationInterchange) — американский стандартный код для обмена информацией.ASCII представляет собой кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов). Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и так далее).
Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Коды с 128 по 255 являются национальными, то есть в национальных кодировках одному и тому же коду соответствуют различные символы.
В настоящее время существуют пять различных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Маc, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
Широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не 256 символов, а N = 216 = 65536 различных символов. Эту кодировку поддерживают последние версии платформы MicrosoftWindows&Office (начиная с 1997 года).
Аналоговый и дискретный способы представления изображений и звука
Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных).
Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.
Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.
Дискретизация — это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.
Двоичное кодирование графической информации
Пространственная дискретизация. В процессе кодирования изображения производится его пространственная дискретизация. Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее).
Формирование растрового изображения. Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые в свою очередь содержат определенное количество точек (пикселей).
Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается. Чем больше разрешающая способность, то есть чем больше количество строк растра и точек в строке, тем выше качество изображения. В современных персональных компьютерах обычно используются три основные разрешающие способности экрана: 800 х 600, 1024 х 768 и 1280 х 1024 точки.
Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки, хранящимся в видеопамяти. Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемым для кодирования цвета точки. Наиболее распространенными значениями глубины цвета являются 8, 16, 24 или 32 бита.
Качество двоичного кодирования изображения определяется разрешающей способностью экрана и глубиной цвета
Глубина цвета и количество отображаемых цветов
Глубина цвета (I)
Количество отображаемых цветов (N)
232 = 4 294 967 296
Цветное изображение на экране монитора формируется за счет смешивания трех базовых цветов: красного, зеленого и синего. Такая цветовая модель называется RGB-моделью по первым буквам английских названий цветов (Red, Green, Blue).
Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности. Например, при глубине цвета в 24 бита на каждый из цветов выделяется по 8 бит, то есть для каждого из цветов возможны N = 28 = 256 уровней интенсивности, заданные двоичными кодами (от минимальной — 00000000 до максимальной — 11111111).
Графический режим. Графический режим вывода изображения на экран монитора определяется величиной разрешающей способности и глубиной цвета. Для того чтобы на экране монитора формировалось изображение, информация о каждой его точке (код цвета точки) должна храниться в видеопамяти компьютера. Рассчитаем необходимый объем видеопамяти для одного из графических режимов, например, с разрешением 800 х 600 точек и глубиной цвета 24 бита на точку.
Всего точек на экране: 800 • 600 = 480 000.
Необходимый объем видеопамяти:
24 бит • 480 000 = 11 520 000 бит = 1 440 000 байт = 1406,25 Кбайт = 1,37 Мбайт.
Аналогично рассчитывается необходимый объем видеопамяти для других графических режимов.
В Windows предусмотрена возможность выбора графического режима и настройки параметров видеосистемы компьютера, включающей монитор и видеоадаптер.
Единицы измерения объема информации в компьютере
Количество информации, хранящейся в ЭВМ, измеряется ее «длиной” (или «объемом”), которая выражается в битах (от английского binary digit — двоичная цифра).
Каждый разряд (цифру) двоичного числа называют битом.
Бит — минимальная единица измерения информации.
В каждом бите может храниться 0 или 1.
Чаще всего в компьютере для кодирования символа отводится фиксированное число двоичных разрядов, равное 8 и называемое байтом.
В этом случае всего можно закодировать до 28=256 различных символов.
Информационным объемом сообщения называется количество битов в этом сообщении.
Единицы измерения информационного объема сообщения
1 Кбайт = 210 байт = 1024 байт ≈ 1000 (1 тыс.) байт;
1 Мбайт = 210 Кбайт = 1024 Кбайт ≈ 1000000 (1 млн.) байт;
1 Гбайт = 210 Мбайт = 1024 Мбайт ≈ 1000000000 (1 млрд.) байт;
При работе с текстовой информацией для кодирования одного символа используется количество информации, равное 1 байту, то есть I= 1 байт = 8 битов.
Пример: Некоторое время назад для хранения информации использовались односторонние 5-дюймовые дискеты, на которых можно было записать 360 Кбайт информации. Определим, документ из скольких знаков можно сохранить на такой дискете.
360 Кбайт = 360 * 1024 = 368640 Байт
Из-за особенностей записи информации на дисковых магнитных носителях расчет можно производить приблизительно, т.е. считать, что килобайт содержит примерно 1000 байт, что значительно облегчает расчет:
Источник
Представление числа дискретным способом
Код ОГЭ: 1.1.3 Дискретная форма представления информации. Единицы измерения количества информации
Информация может быть представлена в аналоговой или дискретной форме. Величина в аналоговой форме может принимать бесконечное множество значений. Примерами аналогового представления информации могут служить звук скрипки, картина художника, показатели температуры воздуха, уровня воды в реке.
Величина в дискретной форме может принимать только конечное множество значений. Примеры дискретного представления информации: цифровые показания часов или спидометра, текст в книге, изображение на экране монитора.
Величину в аналоговой форме представления информации можно преобразовать в величину в дискретной форме. Этот процесс называется дискретизацией.
Представление информации в компьютере дискретно . В процессах хранения, обработки и передачи информации в компьютере используется двоичная знаковая система. Ее алфавит состоит всего из двух знаков <0, 1>. Для удобства использования такого алфавита договорились называть любой из его знаков бит (от англ. bit — binary digit — двоичный знак). Поскольку один бит может принимать только одно из двух значений, то им выражают одно из двух взаимоисключающих понятий: да/нет, истина/ложь, включено/выключено.
Способ представления информации с помощью кода из двух знаков оказался наиболее значимым для развития техники. Двоичные числа удобно хранить, обрабатывать и передавать с помощью электронных устройств. Основным носителем информации в них являются элементы, которые могут находиться в одном из двух состояний: включено/выключено, высокий/низкий уровень напряжения или тока, наличие/отсутствие намагниченности материалов. Условно одно состояние обозначают через 1, а другое через 0. Каждый такой элемент способен хранить один двоичный разряд, или бит информации.
Любое информационное сообщение представляется последовательностью нулей и единиц (цифрового кода). Этот метод представления информации называется двоичным кодированием. Таким образом, двоичный код является универсальным средством кодирования информации. Благодаря двоичному кодированию все действия по обработке сообщений компьютером сводятся к совокупности простых действий над 0 и 1.
Единицы измерения количества информации
Основной единицей хранения и обработки цифровой информации принят байт.
Соответственно, с помощью одного байта можно получить 256 (= 2 8 ) двоичных значений (от 00000000 до 11111111). В современных персональных компьютерах байт является наименьшей совокупностью битов, которую компьютер обрабатывает одномоментно.
На практике применяют более емкие, чем байт, единицы измерения объема сообщений и емкости носителей — килобайты, мегабайты, гигабайты, терабайты. Множителем при переходе к более емкой единице измерения выступает число 1024 (= 2 10 ).
Системы счисления
Система счисления — совокупность обозначений, приемов и правил для записи чисел цифровыми знаками. В зависимости от способов изображения чисел цифрами системы счисления делятся на непозиционные и позиционные.
Непозиционные системы счисления — такие, в которых количественное значение каждой цифры не зависит от занимаемой ею позиции в изображении числа.
Примером может служить египетская система счисления — в ней иероглифы (цифры), составляющие число, можно записывать сверху вниз, справа налево или вперемежку. Значение числа равно сумме значений цифр в его записи.
Переходной от непозиционных систем к позиционным служит римская система счисления. В ней позиция некоторых цифр уже меняет значение числа: например, в числе IX единицу нужно отнять от десяти, а в числе XI единицу нужно прибавить к десяти. Однако количественное значение самих цифр Х и I от их позиции не зависит.
В римской системе цифры записываются слева направо в порядке убывания, и тогда их значения складываются. Если слева записана меньшая цифра, а справа — большая, то их значения вычитаются. Нежелательно записывать более трех одинаковых цифр подряд.
Например, для представления числа 348 в римской системе счисления надо выписать сначала число сотен, затем десятков и единиц: 300 — ССС, 40 — ХL, 8 — VIII. Затем соединить эти записи: CCCXLVIII. Аналогично для числа 1977: 1 тысяча — М, 900 — СМ, 70 — LXХ, 7 — VII. Результат: MCMLXXVII.
В непозиционных системах очень трудно производить многие действия над числами, особенно умножение и деление, слишком громоздка запись для больших чисел. Поэтому широкое распространение получили позиционные системы счисления.
Позиционные системы счисления — такие, в которых количественное значение каждой цифры зависит от ее позиции в числе.
Количество знаков (цифр), используемых для изображения числа, называется основанием системы счисления (или мощностью алфавита). Систему с основанием 10 называют десятичной, с основанием 2 — двоичной, с основанием 16 — шестнадцатеричной, в общем случае: с основанием k — k-ичной.
Место цифры в числе называется разрядом, а количество цифр в числе — его разрядностью. Разряды целого числа нумеруются справа налево начиная с 0. Дробные разряды нумеруют слева направо начиная с -1.
Примером позиционной системы счисления является используемая нами арабская десятичная система счисления. Иногда ее называют индо-арабской, поскольку она была придумана в Индии, а стала известна в Европе из арабских трактатов. Алфавит этой системы составляют 10 цифр — от 0 до 9. Каждая цифра в числе при перемещении справа налево в следующий разряд увеличивает свое значение в 10 раз. Чтобы определить значение числа, надо сложить произведения каждой его цифры на 10 в степени, равной разряду этого числа.
348 = 3 • 10 2 + 4 • 10 1 + 8 • 10 0
–348,17 = –(3 • 10 2 + 4 • 10 1 + 8 • 10 0 + 1 • 10 –1 + 7 • 10 –2 )
Системы счисления могут иметь различные основания. Чтобы различать, в какой системе счисления записано число, принято указывать ее основание в виде нижнего индекса справа от числа. Сам индекс всегда представляется в десятичной системе. Для самой десятичной системы индекс указывают только тогда, когда используется какая–либо другая система:
316 — число в десятичной системе счисления,
3168 — число в восьмеричной системе счисления.
Свойства записи чисел в позиционной системе счисления:
- Для записи чисел в позиционной системе счисления с основанием k требуется k знаков (алфавит системы состоит из k цифр или букв).
- Основание системы счисления, записанное в ней, всегда имеет вид 10 (читается «один ноль»).
- С помощью n разрядов в позиционной системе счисления с основанием k могут быть записаны k n чисел (от 0 до k n–1 ).
Если основание системы k больше 10, то цифры старше 10 при записи обозначают прописными буквами латинского алфавита: A, B, …, Z. При этом цифре 10 соответствует знак A, цифре 11 — знак B и т. д.
Информация в компьютере представлена в цифровой двоичной форме. В целях экономичного отображения двоичную информацию можно представлять в шестнадцатеричном виде. В программировании часто используется восьмеричная запись чисел.
В общем виде число в позиционной системе счисления может быть представлено как последовательность символов алфавита (цифр), обозначенных через а1, а2, а3 и т. д. Для числа А с количеством целых разрядов n и количеством дробных разрядов m запись имеет вид:
Такая запись называется свернутой записью числа. Эту форму записи мы используем в повседневной жизни, поэтому ее называют также естественной.
Представление числа в виде многочлена называют развернутой записью числа:
Развернутая запись числа задает правило для вычисления числа по его цифрам в k–ичной системе счисления. Для уменьшения количества вычислений пользуются схемой Горнера, которая получается путем поочередного выноса основания системы k за скобки:
Конспект урока по информатике «Дискретная форма представления информации».
Источник