- Семантическая мера информации: в чем измеряется, что это такое
- Содержание:
- Семантическая мера информации измеряется в тезаурусе
- Какие еще есть меры информации в информатике
- Заключение
- Семантический подход к измерению информации
- Мой секрет
- Семантический способ измерения информации: сущность, основные понятия и свойства. Семантическая мера информации. Синтаксическая мера информации
- УРОВНИ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ
- Электронная библиотека
Семантическая мера информации: в чем измеряется, что это такое
Содержание:
Семантическая мера информации измеряется в тезаурусе и экономических показателях. Вообще, семантика — это наука, изучающая смысл информации. Поэтому в качестве семантической меры информации применяется тезаурусная мера, так как она связывает смысловую нагрузку информации со способностью пользователя информации правильно ее принять и осмыслить.
Одна и та же информация из разных источников разными людьми может восприниматься по-разному, в меру их понимания. Чтобы как-то определить способность воспринимать ту или иную информацию, ввели такое понятие, как «тезаурус пользователя».
Тезаурус пользователя — это совокупность всех данных, которые уже есть в наличии у пользователя, чтобы воспринять новую информацию и пополнить свой «тезаурус». На практике это выглядит так:
Допустим, вы слышите сообщение на китайском языке. Если вы совершенно не понимаете китайский язык, то такое сообщение для вас будет абсолютно пустым и бессмысленным. Но для человека, который понимает китайский язык, такое сообщение будет понятным, и, скорее всего, он почерпнет из него для себя какую-то полезную информацию.
Семантическая мера информации измеряется в тезаурусе
Мера количества воспринимаемой пользователем информации напрямую будет зависеть от содержания информации и тезауруса пользователя. Фактически мера количества информации показывает, какой объем информации пользователь смог воспринять и тем самым пополнить свой тезаурус.
Такое соотношение можно выразить формулой:
- Ic — это мера количества воспринимаемой информации,
- Sp — это тезаурус пользователя.
Мера количества семантической информации может равняться нулю «Ic = 0» в двух случаях:
- когда тезаурус пользователя примерно равен нулю «Sp = 0», то есть в этом случае пользователь просто не понимает входящую информацию, поэтому она для него будет бесполезной;
- когда тезаурус пользователя стремится к бесконечности «Sp → ∞» — в этом случае пользователь уже знаком с поступающей информацией, она ему не несет абсолютно никакой ценности и, соответственно, тоже не нужна.
Семантическая мера информации будет оптимальной только в том случае, когда поступающая информация будет понятна пользователю, но при этом будет нести в себе какие-то новые данные, то есть данные, которые отсутствуют в его тезаурусе.
Из этого можно сделать простой вывод, что семантическая мера информации измеряется очень относительно и индивидуально к каждому пользователю.
Для измерения относительности семантической меры информации ввели специальный коэффициент, который вычисляется по формуле:
С=Ic : V, где:
- Iс — это количество воспринимаемой семантической информации,
- V — это объем семантической информации.
Какие еще есть меры информации в информатике
Что такое семантическая мера информации — мы разобрались. Это смысловой критерий, заложенный в информацию, который показывает значимость самой информации в зависимости от способности пользователей воспринимать ее. Но, помимо семантической меры информации, в информатике есть еще как минимум две меры:
- Синтаксическая — это обезличенный показатель, который не выражает никакого смыслового отношения к пользователю. По сути, эта мера показывает лишь количество символов в информации. Типичный пример — это бит, байт, килобайт и т. д. в современных компьютерах. Например, когда мы произносим слово «байт», мы знаем, что он равен такому-то количеству битов (в зависимости от кодировки), и все. Мы не знаем, какую информацию несет в себе «байт».
- Прагматическая — это очень относительная величина, которая показывает полезность информации для конкретного пользователя. То есть эта величина показывает, смог ли пользователь достичь своей цели благодаря конкретной информации или нет. Другими словами, прагматическая мера информации — это показатель качества данных для конкретного пользователя.
Заключение
Сегодня мы познакомились с таким понятием, как «семантическая мера информации», и узнали, в чем она измеряется. Главное, что нужно запомнить: семантическая мера информации — это относительный показатель смысла предоставленной информации для конкретного пользователя.
Источник
Семантический подход к измерению информации
Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.
В рамках этого подхода рассмотрим такие меры, как целесообразность, полезность(учитывают прагматику информации) и истинностьинформации (учитывает семантику информации).
Количество I получаемой вместе с сообщением информации с позиций ее целесообразности определяется по формуле:
где p1, p2 – вероятности достижения цели после и до получения сообщения, соответственно.
Пример 1. Пусть вероятность p2 сдачи экзамена по информатике до получения сообщения (подсказки от соседа) оценивается студентом со значением 0,2. После того, как ему удалось получить подсказку, вероятность сдачи увеличилась: p1 = 0,8. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.
В соответствии с приведенной формулой имеем: I = log2(0,8/0,2) = log24 = 2.
Пример 2. Пусть положение студента до получения подсказки оценивается аналогично предыдущему примеру. После получения подсказки, вопреки ожиданиям, вероятность сдачи еще уменьшилась, поскольку подсказка содержала неверную информацию: p1 = 0,1. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.
В соответствии с приведенной формулой имеем: I = log2(0,1/0,2) = log20,5 = -1.
Таким образом, полученная информация является дезинформацией, поскольку имеет отрицательный знак при измерении.
Количество усваиваемой потребителем информации Iусв тесно связано с теми знаниями, которые имеет потребитель к моменту получения информации – с тезаурусом (ТЗ) потребителя. Этим определяется полезность информации. В самом деле, для усвоения тех знаний, которые получаются в ВУЗе, требуется среднее образование — иначе студент ничего не поймет. С другой стороны, любая учебная дисциплина ориентируется на знания, которые учащийся должен приобрести в предыдущих курсах. Этим объясняется последовательность учебных дисциплин по годам обучения.
Зависимость усваиваемой потребителем информации от его тезауруса выражается графически следующей кривой:
Как видно из графика, при тезаурусе, равном нулю и максимальному значению в точке max, информация не усваивается: в первом случае, потребителю непонятна принимаемая информация, во втором – она ему уже известна. Максимально усваивается информация (т.е. она наиболее полезна) в точке opt, когда потребитель обладает достаточным (но не максимально возможным) тезаурусом для понимания получаемой информации. При значении тезауруса i-го потребителя ТЗi количество усваиваемой им информации определяется как Iусв = f(ТЗi). Сам тезаурус ТЗi может быть практически определен как результат интеллектуального тестирования, которое проводится, например, в некоторых западных странах. При таком тестировании человеку выставляется некоторый балл, который и может расцениваться как его ТЗi.
Источник
Мой секрет
Семантический способ измерения информации: сущность, основные понятия и свойства. Семантическая мера информации. Синтаксическая мера информации
УРОВНИ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ
При реализации информационных процессов всегда происходит перенос информации в пространстве и времени от источника информации к приемнику (получателю). При этом для передачи информации используют различные знаки или символы, например естественного или искусственного (формального) языка, позволяющие выразить ее в некоторой форме, называемой сообщением.
Сообщение — форма представления информации в виде совокупности знаков (символов), используемая для передачи.
Сообщение как совокупность знаков с точки зрения семиотики (от греч. semeion — знак, признак) — науки, занимающейся исследованием свойств знаков и знаковых систем, — может изучаться на трех уровнях :
1) синтаксическом, где рассматриваются внутренние свойства сообщений, т. е. отношения между знаками, отражающие структуру данной знаковой системы. Внешние свойства изучают на семантическом и прагматическом уровнях;
2) семантическом, где анализируются отношения между знаками и обозначаемыми ими предметами, действиями, качествами, т. е. смысловое содержание сообщения, его отношение к источнику информации;
3) прагматическом, где рассматриваются отношения между сообщением и получателем, т. е. потребительское содержание сообщения, его отношение к получателю.
Таким образом, учитывая определенную взаимосвязь проблем передачи информации с уровнями изучения знаковых систем, их разделяют на три уровня: синтаксический, семантический и прагматический.
Проблемы синтаксического уровня касаются создания теоретических основ построения информационных систем, основные показатели функционирования которых были бы близки к предельно возможным, а также совершенствования существующих систем с целью повышения эффективности их использования. Это чисто технические проблемы совершенствования методов передачи сообщений и их материальных носителей — сигналов. На этом уровне рассматривают проблемы доставки получателю сообщений как совокупности знаков, учитывая при этом тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т. п., полностью абстрагируясь от смыслового содержания сообщений и их целевого предназначения. На этом уровне информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как смысловая сторона при этом не имеет значения.
Современная теория информации исследует в основном проблемы именно этого уровня. Она опирается на понятие «количество информации», являющееся мерой частоты употребления знаков, которая никак не отражает ни смысла, ни важности передаваемых сообщений. В связи с этим иногда говорят, что современная теория информации находится на синтаксическом уровне.
Проблемы семантического уровня связаны с формализацией и учетом смысла передаваемой информации, определения степени соответствия образа объекта и самого объекта. На данном уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи, формируются понятия и представления, выявляется смысл, содержание информации, осуществляется ее обобщение.
Проблемы этого уровня чрезвычайно сложны, так как смысловое содержание информации больше зависит от получателя, чем от семантики сообщения, представленного на каком-либо языке.
На прагматическом уровне интересуют последствия от получения и использования данной информации потребителем. Проблемы этого уровня связаны с определением ценности и полезности использования информации при выработке потребителем решения для достижения своей цели. Основная сложность здесь состоит в том, что ценность, полезность информации может быть совершенно различной для различных получателей и, кроме того, она зависит от ряда факторов, таких, например, как своевременность ее доставки и использования. Высокие требования в отношении скорости доставки информации часто диктуются тем, что управляющие воздействия должны осуществляться в реальном масштабе времени, т. е. со скоростью изменения состояния управляемых объектов или процессов. Задержки в доставке или использовании информации могут иметь катастрофические последствия.
Синтаксическая мера информации.
Данная мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. Объем данных Vд в этом случае в сообщении измеряется количеством символов (разрядов) в сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных.
К примеру, в двоичной системе счисления единица измерения — бит (bit-binary digit — двоичный разряд). Бит – это ответ на один двоичный вопрос (“да” или “нет”; “0” или “1”), передаваемый по каналам связи с помощью сигнала. Таким образом, содержащееся в сообщении количество информации в битах определяется количеством двоичных слов естественного языка, количеством знаков в каждом слове, количеством двоичных сигналов, необходимых для выражения каждого знака.
В современных ЭВМ наряду с минимальной единицей измерения данных “бит” широко используется укрупненная единица измерения “байт”, равная 8 бит. В десятичной системе счисления единица измерения “бит” (десятичный разряд).
Количество информации I на синтаксическом уровне невозможно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы, т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы.
Коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е.
Источник
Электронная библиотека
Как уже отмечалось, если принять во внимание только свойство информации, связанное с ее смысловым содержанием, то при определении понятия информации можно ограничиться смысловым, или семантическим, уровнем рассмотрения этого понятия.
На семантическом уровне информация рассматривается по ее содержанию, отражающему состояние отдельного объекта или системы в целом. При этом не учитывается ее полезность для получателя информации. На данном уровне изучаются отношения между знаками, их предметными и смысловыми значениями, что позволяет осуществить выбор смысловых единиц измерения информации. Поскольку смысловое содержание информации передается с помощью сообщения, т. е. в виде совокупности знаков (символов), передаваемых с помощью сигналов от источника информации к приемнику, то широкое распространение для измерения смыслового содержания информации получил подход, основанный на использовании тезаурусной меры. При этом под тезаурусом понимается совокупность априорной информации (сведений), которой располагает приемник информации.
Данный подход предполагает, что для понимания (осмысливания) и использования полученной информации приемник (получатель) должен обладать априорной информацией (тезаурусом), т. е. определенным запасом знаков, наполненных смыслом слов, понятий, названий явлений и объектов, между которыми установлены связи на смысловом уровне. Таким образом, если принять знания о данном объекте или явлении за тезаурус, то количество информации, содержащееся в новом сообщении о данном предмете, можно оценить по изменению индивидуального тезауруса под воздействием данного сообщения. В зависимости от соотношений между смысловым содержанием сообщения и тезаурусом пользователя изменяется количество семантической информации, при этом характер такой зависимости не поддается строгому математическому описанию и сводится к рассмотрению трех основных условий, при которых тезаурус пользователя:
1) стремится к нулю, т. е. пользователь не воспринимает поступившее сообщение;
2) стремится к бесконечности, т. е. пользователь досконально знает все об объекте или явлении, и поступившее сообщение его не интересует;
3) согласован со смысловым содержанием сообщения, т. е. поступившее сообщение понятно пользователю и несет новые сведения.
Два первых предельных случая соответствуют состоянию, при котором количество семантической информации, получаемое пользователем, минимально. Третий случай связан с получением максимального количества семантической информации. Таким образом, количество семантической информации, получаемой пользователем, является величиной относительной, поскольку одно и то же сообщение может иметь смысловое содержание для компетентного и быть бессмысленным для некомпетентного пользователя.
Поэтому возникает сложность получения объективной оценки количества информации на семантическом уровне ее рассмотрения и для получения такой оценки используют различные единицы измерения количества информации: абсолютные или относительные. В качестве абсолютных единиц измерения могут использоваться символы, реквизиты, записи и т. д., а в качестве относительной – коэффициент содержательности, который определяется как отношение семантической информации к ее объему. Например, для определения на семантическом уровне количества информации, полученной студентами на занятиях, в качестве единицы измерения может быть принят исходный балл (символ), характеризующий степень усвояемости ими нового учебного материала, на основе которого можно косвенно определить количество информации, полученное каждым студентом. Это количество информации будет выражено через соответствующий оценочный балл в принятом диапазоне оценок.
При семантическом подходе к оценке количества информации и выборе единицы измерения существенным является вид получаемой информации (сообщения).
Так, данный подход к оценке количества экономической информации позволяет выявить составную единицу экономической информации, состоящую из совокупности других единиц информации, связанных между собой по смыслу. Элементарной составляющей единицей экономической информации является реквизит, т. е. информационная совокупность, которая не поддается дальнейшему делению на единицы информации на смысловом уровне. Деление реквизитов на символы приводит к потере их смыслового содержания. Каждый реквизит характеризуется именем, значением и типом. При этом под именем реквизита понимается его условное обозначение, под значением – величина, характеризующая свойства объекта или явления в определенных обстоятельствах, под типом – множество значений реквизита, объединенных определенными признаками и совокупностью допустимых преобразований.
Реквизиты принято делить на реквизиты-основания и реквизиты-признаки.
Реквизиты-основания характеризуют количественную сторону экономического объекта, процесса или явления, которые могут быть получены в результате совершения отдельных операций – вычислений, измерений, подсчета натуральных единиц и т. д. В экономических документах к ним можно отнести, например, цену товара, его количество, сумму и т. п. Реквизиты-основания чаще всего выражаются в цифрах, над которыми могут выполняться математические операции.
Реквизиты-признаки отражают качественные свойства экономического объекта, процесса или явления. С помощью реквизитов-признаков сообщения приобретают индивидуальный характер. В экономических документах к ним можно отнести, например, номер документа, имя отправителя, дату составления документа, вид операции и т. п. Реквизиты-признаки позволяют осуществлять логическую обработку единиц количества информации на семантическом уровне: поиск, выборку, группировку, сортировку и т. д.
Отдельный реквизит-основание вместе с относящимися к нему реквизитами-признаками образует следующую в иерархическом отношении составную единицу экономической информации – показатель. Показатель имеет наименование, в состав которого входят термины, обозначающие измеряемый объект: себестоимость, затраты, мощность, прибыль и т. д. Кроме того, показатель содержит формальную характеристику и дополнительные признаки. К формальной характеристике относится способ его получения (объем, сумма, прирост, процент, среднее значение и т. д.), а к дополнительным – пространственно-временные (где находится измеряемый объект, время, к которому относится данный показатель) и метрологические (единицы измерения).
Таким образом, с помощью совокупности реквизитов и соответствующих им показателей можно оценить количество экономической информации, получаемой от исследуемого объекта (источника информации).
Кроме подхода, основанного на использовании тезаурусной меры, при определении количества информации на семантическом уровне находят применение и другие подходы. Например, один из подходов, связанных с семантической оценкой количества информации, заключается в том, что в качестве основного критерия семантической ценности информации, содержащейся в сообщении, принимается количество ссылок на него в других сообщениях. Количество получаемой информации определяется на основе статистической обработки ссылок в различных выборках.
Подводя итог сказанному, можно утверждать, что существовала и существует проблема формирования единого системного подхода к определению информации на семантическом уровне. Это подтверждается и тем, что в свое время для создания строгой научной теории информации К. Шеннон вынужден был отбросить важное свойство информации, связанное со смысловым ее содержанием.
Срочно?
Закажи у профессионала, через форму заявки
8 (800) 100-77-13 с 7.00 до 22.00
Источник