Кодировка букв русского алфавита
В настоящее время наиболее широко используются пять (!) различных таблиц кодировки для формального представления русских букв:
- I. ISO 8859-5 — международный стандарт;
- II. Кодовая страница 866 (Microsoft CP866) — используется в MS-DOS;
- III. Кодовая страница 1251 (Microsoft CP1251) для Microsoft Windows;
- IV. На базе ГОСТ КОИ-8, koi8 -r — применяется в мире Unix;
- V. Unicode — используется в Microsoft Windows, Unix и клонах Unix.
Основная кодировка ГОСТ (государственный стандарт СССР) от 1987 года создана на основе рекомендаций ISO и в дальнейшем стала основой для представления знаков русских букв в Unicode. В ней и в кодировках II, III и V все буквы кроме ё и Ё расположены в алфавитном порядке. На практике эту кодировку можно встретить только на старых IBM PC совместимых компьютерах ЕС-1840 и в некоторых принтерах. Internet браузеры обычно поддерживают ее наряду с кодировками II-IV.
Кодировка CP866, разработанная на основе альтернативной кодировки ГОСТ, создана специально для ОС MS-DOS, в которой часто используются символы псевдографики. В этой кодировке эти символы имеют те же коды, что и в стандартном IBM PC совместимом компьютере.
Альтернативная кодировка ГОСТ, которая имеет два варианта, совпадает с CP866 по позициям для букв русского алфавита и знакам псевдографики. Основная кодировка ГОСТ совпадает с ISO 8859-5 только по всем знакам русских букв, кроме заглавной буквы Ё.
Использование CP1251 обусловлено почти исключительно влиянием на компьютерные технологии разработок фирмы Microsoft. В ней наиболее полно по сравнению с I, II, IV представлены такие символы как ,
, №, различные виды кавычек и тире и т. п.
Кодировка koi8 -r основана на стандартах по обмену информацией, используемых на компьютерах под управлением ОС Unix, CP/M и некоторых других с середины 1970-х. В 1993 она стандартизирована в Internet документом RFC1489.
Кодировка Unicode опирается на каталог символов UCS (Universal Character Set ) стандарта ISO 10646. UCS может содержать до 2 31 различных знаков. Коды UCS -2 — 2-байтные, UCS -4 — 4-байтные. Используются также коды переменной длины UTF-8 (Unicode Transfer Format) — 1 -6-байтные, наиболее совместимые с ASCII, и UTF-16 — 2 или 4-байтные. Unicode в прикладных программах реализуется лишь частично, и в полном объеме пока нигде не поддерживается. В Linux используется UTF-8.
Достаточно широко используется кодирование на основе ASCII:
В кодировке VI нет видимого символа для Ъ.
Далее следует таблица , в которой представлены все перечисленные способы кодирования букв русского алфавита. В этой таблице в колонке 1 находятся символы букв, в колонке 2 часть названия букв в Unicode 3.2 (названия строчных кириллических букв начинается словами CYRILLIC SMALL LETTER , а заглавных — CYRILLIC CAPITAL LETTER , т. о., полное название буквы Д — CYRILLIC CAPITAL LETTER DE), в колонках с I по V коды десятичные и шестнадцатеричные соответствующих таблиц кодировки , а в колонке VI — символ ASCII для КОИ-7.
Кроме перечисленных можно встретить еще используемую до введения кодировок ГОСТ болгарскую кодировку, называемую также MIC , Interprog или «старый вариант ВЦ АН СССР». На компьютерах под управлением Macintosh OS используется также своя собственная таблица кодировки для русских букв, по своему набору знаков почти совпадающая с CP1251.
Источник
Кодировка букв русского алфавита
В настоящее время наиболее широко используются пять (!) различных таблиц кодировки для формального представления русских букв:
- I. ISO 8859-5 — международный стандарт;
- II. Кодовая страница 866 (Microsoft CP866) — используется в MS-DOS;
- III. Кодовая страница 1251 (Microsoft CP1251) для Microsoft Windows;
- IV. На базе ГОСТ КОИ-8, koi8 -r — применяется в мире Unix;
- V. Unicode — используется в Microsoft Windows, Unix и клонах Unix.
Основная кодировка ГОСТ (государственный стандарт СССР) от 1987 года создана на основе рекомендаций ISO и в дальнейшем стала основой для представления знаков русских букв в Unicode. В ней и в кодировках II, III и V все буквы кроме ё и Ё расположены в алфавитном порядке. На практике эту кодировку можно встретить только на старых IBM PC совместимых компьютерах ЕС-1840 и в некоторых принтерах. Internet браузеры обычно поддерживают ее наряду с кодировками II-IV.
Кодировка CP866, разработанная на основе альтернативной кодировки ГОСТ, создана специально для ОС MS-DOS, в которой часто используются символы псевдографики. В этой кодировке эти символы имеют те же коды, что и в стандартном IBM PC совместимом компьютере.
Альтернативная кодировка ГОСТ, которая имеет два варианта, совпадает с CP866 по позициям для букв русского алфавита и знакам псевдографики. Основная кодировка ГОСТ совпадает с ISO 8859-5 только по всем знакам русских букв, кроме заглавной буквы Ё.
Использование CP1251 обусловлено почти исключительно влиянием на компьютерные технологии разработок фирмы Microsoft. В ней наиболее полно по сравнению с I, II, IV представлены такие символы как ,
, №, различные виды кавычек и тире и т. п.
Кодировка koi8 -r основана на стандартах по обмену информацией, используемых на компьютерах под управлением ОС Unix, CP/M и некоторых других с середины 1970-х. В 1993 она стандартизирована в Internet документом RFC1489.
Кодировка Unicode опирается на каталог символов UCS (Universal Character Set ) стандарта ISO 10646. UCS может содержать до 2 31 различных знаков. Коды UCS -2 — 2-байтные, UCS -4 — 4-байтные. Используются также коды переменной длины UTF-8 (Unicode Transfer Format) — 1 -6-байтные, наиболее совместимые с ASCII, и UTF-16 — 2 или 4-байтные. Unicode в прикладных программах реализуется лишь частично, и в полном объеме пока нигде не поддерживается. В Linux используется UTF-8.
Достаточно широко используется кодирование на основе ASCII:
В кодировке VI нет видимого символа для Ъ.
Далее следует таблица , в которой представлены все перечисленные способы кодирования букв русского алфавита. В этой таблице в колонке 1 находятся символы букв, в колонке 2 часть названия букв в Unicode 3.2 (названия строчных кириллических букв начинается словами CYRILLIC SMALL LETTER , а заглавных — CYRILLIC CAPITAL LETTER , т. о., полное название буквы Д — CYRILLIC CAPITAL LETTER DE), в колонках с I по V коды десятичные и шестнадцатеричные соответствующих таблиц кодировки , а в колонке VI — символ ASCII для КОИ-7.
Кроме перечисленных можно встретить еще используемую до введения кодировок ГОСТ болгарскую кодировку, называемую также MIC , Interprog или «старый вариант ВЦ АН СССР». На компьютерах под управлением Macintosh OS используется также своя собственная таблица кодировки для русских букв, по своему набору знаков почти совпадающая с CP1251.
Источник
§7. Кодирование информации — Ответы рабочая тетрадь Босов 5 класс
79. Заполните таблицу.
80. Запишите цифрами числа, встречающиеся в тексте.
Миллиард – очень большое число. За тридцать лет с первого января тысяча девятьсот семидесятого года по тридцать первое декабря тысяча девятьсот девяносто девятого года прошло десять тысяч девятьсот пятьдесят семь суток, что составляет двести шестьдесят две тысячи девятьсот шестьдесят восемь часов или девятьсот сорок шесть миллионов шестьсот восемьдесят четыре тысячи восемьсот секунд. Значит, за тридцать лет не пройдёт и миллиарда секунд.
1000000000, 30, 1, 1970, 31, 1999, 10957, 262968, 946684800, 30, 1000000000.
81. Представьте в виде арифмитических выражений следующие утверждения.
а) Если к трём прибавить четыре, потом умножить полученное число на четыре и разделить на разность восьми и шести, то в результате получится четырнадцать.
((4 + 3) * 4) / (8 — 6) = 14
б) Разность двадцати семи сотых и девяти сотых равна восемнадцати сотым.
82. Заполните таблицу, расположенную слева, и запишите содержащуюся в ней информацию в виде арифметичских выражений в таблице справа.
83. Дана кодовая таблица флажковой азбуки.
Старший помощник Лом сдает экзамен капитану Врунгелю. Помогите ему прочитать следующие слова и попытайтесь объяснить их значения.
84. Что прочитал Лом на флагах встречной шхуны?
85. Старший помощник Лом оказался старательным учеником. Чтобы порадовать капитана Врунгеля, он выучил морскую семафорную азбуку, в которой каждая буква кодируется определнным положением рук с флажками.
Расшифруйте подаваемые Ломом сигналы.
86. Дана кодовая таблица азбуки Морзе.
Расшифруйте следующие записи.
87. Зашифруйте с помощью азбуки Морзе.
88. Поставьте каждой букве в соответствие ее порядковый номер в алфавите (заполните пустые клетки).
Зная, что каждому числу соответствует буква алфавита с таким же порядковым номером, расшифруйте следующие сообщения.
а) 12-21-12-21-26-12-1 12-21-12-21-26-16-15-12-21 19-26-10-13-1 12-1-17-32-26-16-15.
Кукушка кукушонку сшила капюшон.
б) 20-12-7-20 20-12-1-25 20-12-1-15-10 15-1 17-13-1-20-12-10 20-1-15-6.
Ткёт ткач ткани на платки Тане.
89. Известно, что некто расположил все буквы алфавита по кругу и заменил каждую букву исходного сообщения на следующую после нее. Декодируйте полученные шифровки:
а) об оёу й тфеб оёу. — На нет и суда нет.
б) лпоёч — еёмф гёоёч. — Конец — делу венец.
90. Декодируйте текст.
21 * 12-16-4-16 * 19-10-13-30-15-29-6 * 14-29-26-24-29, 20-16-20 * 17-16-2-6-5-10-20 * 16-5-15-16-4-16. 12-20-16 * 19-10-13-7-15 * 9-15-1-15-10-33-14-10, 20-16-20 * 17-16-2-6-5-10-20 * 20-29-19-33-25-10.
Декодированный текст: У кого сильные мышцы, тот победит одного. Кто силен знаниями, тот победит тысячи.
Правило кодирования установите по ключу.
Ключ: 12-16-5 — расшифровывается как система условных знаков для представления информации. (Код)
91. Декодируйте текст.
21-19-22-6-16-17 * 4 * 22-26-7-16-11-11 — 14-7-5-13-17 * 4 * 3-17-33.
Ответ: Трудно в учении — легко в бою.
Правило кодирования установите по ключу.
Ключ: 11-16-21-7-19-16-7-21 — расшифровывается как самый современный информационный канал. (Интернет)
92. Чтобы узнать зашифрованное слово, возьмите только первые слоги из данных слов:
а) колос, мебель, таракан — Комета
б) молоко, нерест, таракан — Монета
в) кора, лото, боксер — Колобок
г) баран, рана, банщик — Барабан
д) монета, лошадь, корова — Молоко
93. Чтобы узнать зашифрованное слово, возьмите только вторые слоги из данных слов:
а) соловей, потолок — Лото
б) змея, рама — Яма
в) пуговица, молоток, лава — Голова
г) укор, бузина, тина — Корзина
д) поворот, пороша, канава — Ворона
94. Чтобы узнать зашифрованное слово, возьмите только последние слоги из данных слов:
а) мебель, ружьё — Бельё
б) соломка, пора, мель — Карамель
в) лиса, письмо, перелёт — Самолёт
г) пуловер, пальто, полёт — Вертолёт
д) молоко, реле, лассо — Колесо
95. Кодирование текста осуществляется перестановкой букв в каждом слове по одному и тому же правилу. Восстановите зашифрованную информацию и сформулируйте правило кодирования.
96. Известно, что некто для шифрования сообщений после каждой гласной буквы вставляет букву «А», а после согласной — букву «Т». Декодируйте зашифрованную информацию.
97. Придумайте собственным способ кодирования букв русского алфавита: графический (с помощью особых картинок или знаков), числовой (с помощью чисел) или символьный (с помощью тех же букв).
А-1 Б-8 В-15 Г-22 Д-28 Е-2 Ё-9 Ж-16 З-23 И-29 Й-3 К-10 Л-17 М-24 Н-30 О-4 П-11 Р-18 С-25 Т-31 У-5 Ф-12 Х-19 Ц-26 Ч-32 Ш-6 Щ-13 Ъ-20 Ы-27 Ь-33 Э-7 Ю-14 Я-21
С помощью собственного кода закодируйте слово «УСПЕХ».
98. Впишите подходящие по смыслу слова.
Чтобы рубить дрова, нужен топор (14 2 3 2 7)
а чтобы полить огород — лейка (10 4 5 1 6)
Рыбаки сделали во льду прорубь (3 7 2 7 8 9 11)
и стали ловить рыбу.
Самый колючий зверь в лесу — это ёж (12 13)
Разгадайте код и прочитайте с его помощью пословицу:
1, 2, 3, 4, 5, 1, 6 — Копейка
7, 8, 9, 10, 11 — рубль
9, 4, 7, 4, 13, 12, 14 — бережёт.
99. На координатной плоскости отметьте и пронумеруйте точки, координаты которых приведены ниже. Соедините точки в заданной последовательности. Помните, первое число — координата по оси ОХ, второе — по оси OY. После проверки правильности выполнения задания можно раскрасить полученную картинку цветными карандашами.
100. Разгадайте кроссворд «Кодирование информации».
По горизонтали. 3. Французский математик, в честь которого названа прямоугольная система координат. — Декарт 6. Способ кодирования информации с помощью чисел. — Числовой 8. Способ кодирования информации с помощью символов того же алфавита, что и исходный текст. — Символьный 9. Представление информации с помощью некоторого кода. — Кодирование 10. Игра, в которой фигуры перемещаются по клеткам с координатами. — Шахматы
По вертикали. 1. Один из удобных способов представления графической информации с помощью чисел. — Метод координат 2. Способ кодирования информации с помощью рисунков или значков. — Графический 4. Французский педагог, придумавший специальный способ представления информации для слепых. — Брайль 5. Система условных знаков для представления информации. — Код 7. Графическая форма представления информации (множественное число). — Схемы
101. Если «жало» — это «двор», а «хна» — это «зев», то чему равна «ель»? А также — «мель» и «щель»? (Для ответа на вопросы посмотрите внимательно на клавиатуру.)
Необходимо на клавиатуре сместить на 1 клавишу влево, чтобы получить необходимый результат.
Ель — кот
Мель — скот
Щель — шкот
Источник