Семантическая мера информации: в чем измеряется, что это такое
Содержание:
Семантическая мера информации измеряется в тезаурусе и экономических показателях. Вообще, семантика — это наука, изучающая смысл информации. Поэтому в качестве семантической меры информации применяется тезаурусная мера, так как она связывает смысловую нагрузку информации со способностью пользователя информации правильно ее принять и осмыслить.
Одна и та же информация из разных источников разными людьми может восприниматься по-разному, в меру их понимания. Чтобы как-то определить способность воспринимать ту или иную информацию, ввели такое понятие, как «тезаурус пользователя».
Тезаурус пользователя — это совокупность всех данных, которые уже есть в наличии у пользователя, чтобы воспринять новую информацию и пополнить свой «тезаурус». На практике это выглядит так:
Допустим, вы слышите сообщение на китайском языке. Если вы совершенно не понимаете китайский язык, то такое сообщение для вас будет абсолютно пустым и бессмысленным. Но для человека, который понимает китайский язык, такое сообщение будет понятным, и, скорее всего, он почерпнет из него для себя какую-то полезную информацию.
Семантическая мера информации измеряется в тезаурусе
Мера количества воспринимаемой пользователем информации напрямую будет зависеть от содержания информации и тезауруса пользователя. Фактически мера количества информации показывает, какой объем информации пользователь смог воспринять и тем самым пополнить свой тезаурус.
Такое соотношение можно выразить формулой:
- Ic — это мера количества воспринимаемой информации,
- Sp — это тезаурус пользователя.
Мера количества семантической информации может равняться нулю «Ic = 0» в двух случаях:
- когда тезаурус пользователя примерно равен нулю «Sp = 0», то есть в этом случае пользователь просто не понимает входящую информацию, поэтому она для него будет бесполезной;
- когда тезаурус пользователя стремится к бесконечности «Sp → ∞» — в этом случае пользователь уже знаком с поступающей информацией, она ему не несет абсолютно никакой ценности и, соответственно, тоже не нужна.
Семантическая мера информации будет оптимальной только в том случае, когда поступающая информация будет понятна пользователю, но при этом будет нести в себе какие-то новые данные, то есть данные, которые отсутствуют в его тезаурусе.
Из этого можно сделать простой вывод, что семантическая мера информации измеряется очень относительно и индивидуально к каждому пользователю.
Для измерения относительности семантической меры информации ввели специальный коэффициент, который вычисляется по формуле:
С=Ic : V, где:
- Iс — это количество воспринимаемой семантической информации,
- V — это объем семантической информации.
Какие еще есть меры информации в информатике
Что такое семантическая мера информации — мы разобрались. Это смысловой критерий, заложенный в информацию, который показывает значимость самой информации в зависимости от способности пользователей воспринимать ее. Но, помимо семантической меры информации, в информатике есть еще как минимум две меры:
- Синтаксическая — это обезличенный показатель, который не выражает никакого смыслового отношения к пользователю. По сути, эта мера показывает лишь количество символов в информации. Типичный пример — это бит, байт, килобайт и т. д. в современных компьютерах. Например, когда мы произносим слово «байт», мы знаем, что он равен такому-то количеству битов (в зависимости от кодировки), и все. Мы не знаем, какую информацию несет в себе «байт».
- Прагматическая — это очень относительная величина, которая показывает полезность информации для конкретного пользователя. То есть эта величина показывает, смог ли пользователь достичь своей цели благодаря конкретной информации или нет. Другими словами, прагматическая мера информации — это показатель качества данных для конкретного пользователя.
Заключение
Сегодня мы познакомились с таким понятием, как «семантическая мера информации», и узнали, в чем она измеряется. Главное, что нужно запомнить: семантическая мера информации — это относительный показатель смысла предоставленной информации для конкретного пользователя.
Источник
5.5. Семантический ( содержательный ) подход к измерению информации
При таком подходе определение бита оказывается достаточно сложным для понимания учащимися даже в старших классах. Поэтому учителю потребуется опреде лённое время для его изложения. Приведём методику изучения этого материала, описанную в [1]. Вначале необ ходимо рассмотреть цепочку понятий: информация – со общение – информативность сообщения – единица из мерения информации – информационный объём сообще ния. Каждое из этих понятий достаточно сложно для ус воения, поэтому учителю следует подробно остановиться на них. Информация – это знания людей (новые знания). Сообщение – это информационный поток, который в про
цессе передачи информации поступает к принимающему его субъекту. Сообщение – это и речь, и воспринимаемые нами зрительные образы, и текст книги и т.д. Информа тивность сообщения следует рассмотреть на примерах. При этом для учащихся вводится такое определение:
«Информативным сообщением называется такое сообщение, которое пополняет знания человека, т.е. не сёт для него информацию» .
Одно и то же сообщение для разных людей, с точки зрения его информативности, может быть разным. Если сведения «старые», т.е. человеку они известны, или со держание информации непонятно человеку, то для него такое сообщение неинформативно. Поэтому можно ввести следующее определение:
«Информативно такое сообщение, которое содер жит новые и понятные человеку сведения».
Учителю необходимо помнить и разъяснять учащим ся, что нельзя отождествлять понятие «информация» и «информативность сообщения». Пример – информативен ли текст учебника по матанализу для первоклассника? Ко нечно, первоклассник ничего не поймёт в этом учебнике, поэтому ответ будет отрицательным. Если сообщение не информативно для человека, то количество информации в нём, с точки зрения этого человека, равно нулю. Количест во информации в информативном сообщении больше ну ля.
Затем следует перейти к введению единицы инфор мации. В рамках содержательного (семантического) под хода единицей информации является мера пополнения знаний человека, или мера уменьшения степени его не знания. Тогда можно принять следующее определение единицы информации: « Сообщение, уменьшающее неоп
ределённость знаний в 2 раза, несёт 1 бит информа ции ». Или в другой формулировке: « Сообщение о том,
что произошло одно событие из двух равновероятных, несёт 1 бит информации ».
Такое определение бита является сложным для уча щихся из за неясного им понятия «неопределённость зна ний». Поэтому необходимо раскрыть его смысл на следующих примерах:
1) Подбрасывание монеты. Неопределённость знания о результатах бросания монеты, т.е. выпадение «орла» или «решки», равна 2.
2) Для бросания игрового кубика с шестью гранями эта не определённость уже равна 6.
3) Неопределённость для вытягивания экзаменационных билетов будет равна 25, если на столе лежало 25 биле тов.
Если учитель имеет достаточно времени, то полезно обсудить с учащимися следующие понятия: вероятность события , достоверное событие , невозможное событие .
Это обязательно следует делать в профильных классах с углублённым изучением информатики.
5.6. Кибернетический ( алфавитный ) подход к измерению информации
Кибернетический подход к измерению информации во многом является альтернативным содержательному и базируется на измерении количества информации в тексте (символьном сообщении), составленном из символов не которого алфавита. Необходимо сразу заметить, что со смысловым содержанием текста такая мера информации не связана. Алфавитный подход обычно применяют для измерения информации, обрабатываемой в компьютерах
и передаваемой в компьютерных сетях . При этом учителю следует напомнить учащимся о компьютерном подходе к измерению информации (если он изучался) и показать их различия.
Основным понятием при кибернетическом подходе является понятие алфавита. Алфавит определяется как
конечное множество символов, используемых для пред ставления информации .
Количество информации, которое несёт в тексте ка ждый символ алфавита, вычисляется по формуле Хартли:
где i – информационный вес символа алфавита;
N – мощность алфавита (число символов в алфавите).
На основании формулы Хартли можно рассчитать ко личество информации в любом тексте. Если текст содер жит К штук символов алфавита, то количество информации I определяется произведением числа символов на инфор мационный вес символа:
Минимальная мощность алфавита, пригодного для передачи информации, равна 2. (В этом месте объяснения учителю следует ещё раз напомнить учащимся азбуку Морзе.) Такой алфавит мощностью 2 называется двоич ным. Тогда информационный вес символа в двоичном ал фавите легко найти: 2 i = 2, то из этого уравнения получаем, что i = 1 бит. Отсюда следует определение:
« Один символ двоичного алфавита несёт 1 бит инфор мации» .
Такой способ измерения количества информации еще называют объёмным , так как он напрямую связан с количеством (объёмом) символов в тексте.
Если для передачи сообщения используется не дво ичный, а другой алфавит, то информационный вес его символов будет другим (обычно больше) и количество ин формации также иным.
После этого рассмотрения следует перейти к изуче нию других единиц измерения информации, напомнив при этом, что для многих единиц измерения существуют кратные единицы, которые часто оказываются более удобными для употребления. Например, кроме метра есть ещё километр, кроме грамма – килограмм и т.п. Если бит – это основная единица измерения информации, то ещё широко используется байт, который вводится как инфор мационный вес символа из алфавита мощностью 256. То гда по формуле Хартли число 256 есть два в восьмой сте пени: 256 = 2 8 . Тогда отсюда имеем: i = 8 бит. Эти восемь бит принято называть байтом. Таким образом, 1 байт = 8 бит.
Более крупными единицами являются килобайт, ме габайт, гигабайт, терабайт. Говоря об этих единицах, сле дует обратить внимание учеников, что приставку «кило» не следует воспринимать как увеличение в 1000 раз. В ин форматике это не так. Килобайт больше байта в 1024 раза, поскольку 2 10 = 1024. В этом состоит принципиальное от личие десятичных приставок в информатике от обычных десятичных приставок, о чём учителю всегда следует на поминать учащимся. Тем не менее, часто при приближен ных вычислениях используют коэффициент 1000.
Задание для студентов: рассчитайте информационный вес символов русского и английского алфавитов.
Источник
Подходы к понятию информации и измерению информации.
Термин информация имеет множество определений. «Информация» происходит от латинского слова «informatio», что означает разъяснение, изложение, осведомление. Информация всегда представляется в виде сообщения. Сообщение – это форма представления каких-либо сведений в виде речи, текста, изображения, цифровых данных, графиков, таблиц и т.д. В широком смысле информация – это сведения, совокупность каких-либо данных, знаний. Наряду с понятие информация в информатике часто употребляется понятие данные. Данные – это результаты наблюдений над объектами и явлениями, которые по каким-то причинам не используются, а только хранятся. Как только данные начинают использовать в каких-либо практических целях, они превращаются в информацию.
1. По отношению к окружающей среде:
2. По способам восприятия:
3. По форме представления для персонального компьютера:
· полнота – наличие достаточных сведений;
· актуальность – степень соответствия информации текущему моменту времени;
· достоверность – насколько информация соответствует истинному положению дел;
· ценность – насколько информация важна для решения задачи;
· точность – степень близости к действительному состоянию объекта, процесса, явления;
· понятность – выражение информации на языке, понятном тем, кому она предназначена.
Важным вопросом является измерение количества информации. Как понять, сколько информации мы получили в том или ином сообщении? Разные люди, получившие одно и то же сообщение, по-разному оценивают его информационную ёмкость, то есть количество информации, содержащееся в нем. Это происходит оттого, что знания людей о событиях, явлениях, о которых идет речь в сообщении, до получения сообщения были различными. Поэтому те, кто знал об этом мало, сочтут, что получили много информации, те же, кто знал больше, могут сказать, что информации не получили вовсе. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя.
В таком случае, количество информации в одном и том же сообщении должно определяться отдельно для каждого получателя, то есть иметь субъективный характер. При этом нельзя объективно оценить количество информации, содержащейся даже в простом сообщении. Поэтому, когда информация рассматривается как новизна сообщения для получателя (бытовой подход), не ставится вопрос об измерении количества информации.
Информация — это содержание сообщения, сигнала, памяти, а также сведения, содержащиеся в сообщении, сигнале или памяти.
Информация — сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределённости, неполноты знаний.
Информация — это понимание (смысл, представление, интерпретация), возникающее в аппарате мышления человека после получения им данных, взаимоувязанное с предшествующими знаниями и понятиями.
Информация, первоначально — сведения, передаваемые людьми, устным, письменным или другим способом (с помощью условных сигналов, технических средств и т.д.); с середины 20 века общенаучное понятие, включающее обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом; обмен сигналами в животном и растительном мире; передачу признаков от клетки к клетке, от организма к организму.
Информация — содержание сообщения или сигнала, сведения, рассматриваемые в процессе их передачи или восприятия; одна из исходных общенаучных категорий, отражающая структуру материи и способы её познания, несводимая к другим, более простым понятиям.
Существует три основные интерпретации понятия «информация».
Научная интерпретация. Информация — исходная общенаучная категория, отражающая структуру материи и способы ее познания, несводимая к другим, более простым понятиям.
Абстрактная интерпретация. Информация — некоторая последовательность символов, которые несут как вместе, так в отдельности некоторую смысловую нагрузку для исполнителя.
Конкретная интерпретация. В данной плоскости рассматриваются конкретные исполнители с учетом специфики их систем команд и семантики языка. Так, например, для машины информация — нули и единицы; для человека — звуки, образы, и т.п.
· в житейском аспекте под информацией понимают сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком или специальными устройствами;
· в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов;
· в теории информации (по К.Шеннону) важны не любые сведения, а лишь те, которые снимают полностью или уменьшают существующую неопределенность;
· в кибернетике, по определению Н. Винера, информация — эта та часть знаний, которая используется для ориентирования, активного действия, управления, т.е. в целях сохранения, совершенствования, развития системы;
· в семантической теории (смысл сообщения) — это сведения, обладающие новизной, и так далее.
Такое разнообразие подходов не случайность, а следствие того, что выявилась необходимость осознанной организации процессов движения и обработки того, что имеет общее название — информация.
Можно выделить следующие подходы к определению информации:
Традиционный (обыденный) — используется в информатике:
Информация – это сведения, знания, сообщения о положении дел, которые человек воспринимает из окружающего мира с помощью органов чувств (зрения, слуха, вкуса, обоняния, осязания).
Вероятностный — используется в теории об информации: Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределённости и неполноты знаний.
Для человека: Информация – это знания, которые он получает из различных источников с помощью органов чувств.
Вся информация, которую обрабатывает компьютер, представлена двоичным кодом с помощью двух цифр – 0 и 1. Эти два символа 0 и 1 принято называть битами (от англ. binary digit – двоичный знак). Бит – наименьшая единица измерения объема информации.
1 байт = 2 3 бит = 8 бит
1Кбит = 2 10 бит = 1024 бит
1 Кб = 2 10 байт = 1024 байт
1 Мб = 2 10 Кб = 1024 Кб
1 Гб = 2 10 Мб = 1024 Мб
1 Тб = 2 10 Гб = 1024 Гб
» jsaction=»rcuQ6b:WYd;»>
Вопрос: «Как измерить информацию?» очень непростой. Ответ на него зависит от того, что понимать под информацией. Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными.
В информатике используются различные подходы к измерению информации:
1. Содержательный подход к измерению информации.
Сообщение, уменьшающее неопределенность знаний человека в два раза, несет для него 1 бит информации.
Количество информации, заключенное в сообщении, определяется по формуле Хартли:
2. Алфавитный (технический) подход к измерению информации — основан на подсчете числа символов в сообщении.
Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, заключенное в сообщении вычисляется по формуле:
Ic – информационный объем сообщения
К – количество символов
N – мощность алфавита (количество символов)
i — информационный объем 1 символа
Мы живем в реальном мире, окруженные разнообразными материальными объектами. Наличие информации об объектах реального мира порождает другой мир, неотделимый от сознания конкретных людей, где существует только информация. Этому миру мы даем разнообразные названия. Одно из таких названий — информационная картина мира.
Познание реального мира происходит через информационную картину мира. Человек формирует собственное представление о реальном мире, получая и осмысливая информацию о каждом реальном объекте, процессе или явлении. При этом у каждого человека существует своя информационная картина мира, которая зависит от множества факторов как субъективного, так и объективного порядка. Конечно, большую роль здесь играет уровень образованности человека. Информационные картины мира у школьника, студента и преподавателя будут существенно различаться. Чем объемнее и разнообразнее информация, которую может воспринять человек, тем более красочной получается эта картина. Так, например, информационная картина мира у ребенка совсем не такая, как у его родителей.
Один из способов познания реального мира — это моделирование, которое прежде всего связано с отбором необходимой информации и построением информационной модели. Однако любая информационная модель отражает реальный объект только в ограниченном аспекте — в соответствии с поставленной человеком целью. Отсюда и возникает определенная «ущербность» восприятия мира, если человек изучает его только с одной стороны, определяемой одной целью. Всестороннее познание окружающего мира возможно только тогда, когда существуют разные информационные модели, соответствующие разным целям.
Предположим, мы создали несколько информационных моделей для одного объекта реального мира (рис. 1). Их количество определяется количеством заданных целей. Например, информационные модели нашей планеты у школьника, астронома, метеоролога и геодезиста будут существенно различаться, так как у них разные цели, а значит, и информация, отобранная ими и положенная в основу информационной модели, будет разной.
При разработке модель постоянно сопоставляется с объектом-прототипом для оценки ее соответствия оригиналу.
Что же произойдет, если мы будем иметь дело только с информационными моделями, отстранившись от реального мира? В этом случае отпадает необходимость в понятии адекватности, так как, устранив объект, мы тем самым разорвем виртуальную связь, устанавливающую объектно-модельное отношение. А это значит, что мы полностью погрузимся в виртуальный, несуществующий мир, где циркулирует только информация. Сравнивать модель будет не с чем, а значит, отпадет необходимость в самом моделировании.
Таким образом, модель превращается в некий самостоятельный объект, который представляет собой совокупность информации.
Вспомнив понятие объекта, которое определяется как некоторая часть окружающего мира, рассматриваемая как единое целое, можно высказать предположение, что информационную модель, которая не имеет связи с объектом-оригиналом, тоже можно считать объектом, но не материальным, а информационным. Таким образом, информационный объект получается из информационной модели путем «отчуждения» информации от объекта-оригинала.
Информационный объект — это совокупность логически связанной информации. Тогда информационный мир будет представлять собой множество разнообразных информационных объектов (рис. 2).
Информационный объект, «отчужденный» от объекта-оригинала, можно хранить на различных материальных носителях. Простейший материальный носитель информации — это бумага. Есть также магнитные, электронные, лазерные и другие носители информации.
С информационными объектами, зафиксированными на материальном носителе, можно производить те же действия, что и с информацией при работе на компьютере: вводить их, хранить, обрабатывать, передавать. Однако технология работы с информационными объектами будет несколько иная, нежели с информационными моделями. Создавая информационную модель, мы определяли цель моделирования и в соответствии с ней выделяли существенные признаки, делая акцент на исследовании. В случае с информационным объектом мы имеем дело с более простой технологией, так как никакого исследования проводить не надо. Здесь вполне достаточно традиционных этапов переработки информации: ввода, хранения, обработки, передачи.
При работе с информационными объектами большую роль играет компьютер. Используя возможности, которые предоставляют пользователю офисные технологии, можно создавать разнообразные профессиональные компьютерные документы, которые будут являться разновидностями информационных объектов. Все, что создается в компьютерных средах, будет являться информационным объектом.
Литературное произведение, газетная статья, приказ — примеры информационных объектов в виде текстовых документов.
Рисунки, чертежи, схемы — это информационные объекты в видеографических документов.
Ведомость начисления заработной платы, таблица стоимости произведенных покупок в оптовом магазине, смета на выполнение работ и прочие виды документов в табличной форме, где производятся автоматические вычисления по формулам, связывающим ячейки таблицы, — это примеры информационных объектов в виде электронных таблиц.
Результат выборки из базы данных — это тоже информационный объект.
Довольно часто мы имеем дело с составными документами, в которых информация представлена в разных формах. Такие документы могут содержать и текст, и рисунки, и таблицы, и формулы, и многое другое. Школьные учебники, журналы, газеты — это хорошо знакомые всем примеры составных документов, являющихся информационными объектами сложной структуры. Для создания составных документов используются программные среды, в которых предусмотрена возможность представления информации в разных формах.
Другими примерами сложных информационных объектов могут служить создаваемые на компьютере презентации и гипертекстовые документы. Презентацию составляет совокупность компьютерных слайдов, которые обеспечивают не только представление информации, но и ее показ по заранее созданному сценарию. Гипертекстом может быть назван документ, в котором имеются гиперссылки на другие части этого же документа или другие документы.
Источник