Средства мультимедиа и эффективность восприятия информации
Развитие рыночных отношений сопровождается повышением интереса у специалистов по компьютерам к тонкостям их программно-технической реализации. Это можно объяснить тем, что впервые наши компьютерщики задумались над обычным для рынка вопросом: кому нужна их продукция, кто ее купит и зачем, какую пользу он из этой покупки извлечет?
Стандартные, всем известные, придуманные кем-то применения компьютеров повторять не имеет смысла — с Западом трудно состязаться в качестве создаваемых программно-технических изделий, особенно, в шлифовке их товарных, потребительских свойств.
А чтобы придумать что-то новое, какое-то необычное применение компьютеров, которые сразу привлекут внимание покупателей, надо знать глубинные, еще не использованные другими возможности ЭВМ. Частично эти возможности связаны с использованием систем мультимедиа, с технологией создания мультимедийных систем.
В данном учебном пособии рассматриваются виды информации, обработка которых стала возможной на ЭВМ, состав работ и используемого для этого программного обеспечения при работе с текстом, звуком, графикой и анимацией, элементы контент-инжениринга и графического дизайна. Даны краткие сведения, необходимые для понимания физических основ работы с разными видами информации, особенностей используемых при этом технических средств.
Понятие “технология” объединяет в себе последовательность действий для достижения поставленной цели, инструментарий и способы его использования.
Мультимедиа-технологии накладывают ограничение на инструментарий — это технологии использования текста, графики, звука, анимации для создания дружественной к пользователю среды общения, для воздействия на психику пользователя.
Главная задача, которую ставили перед собой создатели мультимедийных устройств — это привлечение к работе на ЭВМ пользователей, не являющихся специалистами по вычислительным системам. Появились мультимедиа-системы в четвертом поколении ЭВМ, вместе с персональными компьютерами. И в первую очередь они стали использоваться в компьютерных играх, а затем — и в более серьезных, профессиональных приложениях. Но везде ставилась задача облегчения взаимодействия пользователя с ЭВМ.
Поэтому нельзя считать, что мультимедиа-система — это особым образом организованная ЭВМ (например, имеющая звуковую карту). Мультимедиа-система — это человеко-машинная система, в которой пользователь является составной частью системы.
С помощью такой системы достигаются следующие цели:
— заинтересовать человека в выполнении какой-либо работы;
— облегчить человеку выполнение работы;
— дать новые возможности для выполнения обычной для человека работы.
Расширение рынка ЭВМ во многом обязано созданию систем мультимедиа, тому, что на их основе стала развиваться дружественная для пользователя среда общения. Выражаясь точнее, не общение человека с ЭВМ (общаться могут только существа одушевленные), а общение двух людей: пользователя — и человека, создавшего программу для машины. Программист при этом может быть уверен, что он был совершенно беспристрастен, создавая свою программу, — свои психологические черты он закладывает в программу, не подозревая об этом. Именно в таком смысле и будет в дальнейшем использоваться термин “человеко-машинное общение”.
В данном курсе рассматриваются:
— технические средства систем мультимедиа;
— программное обеспечение, создаваемое для людей, далеких от программирования;
— алгоритмы обработки различных видов информации;
— психология человеко-машинного общения.
Психологическое воздействие мультимедиа-системы на человека — это главный элемент, для которого будут осваиваться программы и проводиться знакомство с техническими средствами. Так, при создании информационной системы необходимо добиваться трех результатов:
— она должна привлекать внимание;
— должна удерживать внимание;
— должна вызывать у человека желание повторно обратиться к этой системе.
Только в этом случае считается, что мультимедиа-система сделана удачно. Например, для привлечения внимания можно применить музыкальное сопровождение, которое создает настроение. Удержать внимание можно только с помощью смысла, основными носителями которого являются текст, графика, звук, анимация. Вызвать желание повторно обратиться к информационной системе можно, сделав ее необходимой, содержащей новую, достоверную и полезную информацию.
Мультимедийные информационные системы могут представлять собой компьютерные презентации, электронные книги, справочники, сборники документов, архивы, оформленные в виде гипертекстовых структур (например, help-файлов), Web-сайты, баннеры (как часть информационной системы). При обращении к такой информационной системе пользователь сначала попадает на ее титульный лист — именно он должен привлечь внимание. Немаловажное значение для этого имеет компоновка титульного листа. Она должна быть выполнена с учетом информативности различных зон экрана.
В наиболее информативной зоне должен располагаться заголовок — на нем первом останавливается внимание пользователя. Заголовок должен быть компактный, информативный, понятный, интригующий. В нем нельзя применять аббревиатуры. Например, “Информационная система АФИ” для заголовка не годится, так как такой заголовок не несет полезной информации, непонятен и не содержит интриги. Гораздо лучше выглядит придуманный студентами заголовок “Информационная система Финансист”, выполненный другим цветом на фоне эпиграфа: “Информация — это то, что пытаются скрыть от журналистов. Все остальное — это реклама”.
Другой пример из студенческой практики: первоначально Web-сайту было дано название: “Кактус”. Компактно, но не информативно. После преобразования в “Клуб потребителей кактусов” заголовок стал не таким компактным, но зато интригующим.
Еще один пример — тоже студенческий заголовок Web-сайта: “Все о замороженных овощах” — компактный, информативный, понятный, но не интригующий. Интрига была введена на титульном листе в оглавление сайта — там содержался раздел “Ледяная посуда”. Увидев такой раздел, хочется заглянуть внутрь сайта, чтобы узнать, о чем идет речь. Интересная информация является типичным интригующим фактором, и просто “затягивает” пользователя в информационную систему.
Может показаться, что в этих примерах не содержится мультимедиа, так как не используется “многосредность” — звук, графика, анимация. Все держится на тексте, на том, как его расположить, какими словами выразить мысль. Если рассматривать мультимедиа-системы как человеко-машинные, основное назначение которых — воздействие на психику пользователя, то рассмотренные примеры напрямую относятся к мультимедиа-технологиям, так как текст (так же, как и звук, и графика, и анимация) способствует созданию психологического настроя пользователя, формированию его настроения.
Человеко-машинная система — это система общения двух людей. Тот, кто создает программу — свободен в передаче своих чувств? Может ли он, находясь в плохом настроении, создать хорошее настроение у других людей? Написать веселую программу? Практика показывает, что в полном объеме это не удается. Человек, создающий программу, хочет он того, или нет, передает через эту программу другим людям свое настроение, свой внутренний мир. Отсюда правило: если необходимо сделать дружественную для пользователя среду общения, надо ее создавать только в хорошем настроении.
Общение людей происходит с помощью ритуалов. При создании человеко-машинной системы необходимо выдерживать привычные для пользователя методы, ритуалы общения. Сленг, способ общения должны также соответствовать образу пользователя. Заложенная в программу психология общения играет главную роль в том, какое отношение получит создатель к своему программному продукту.
Психологическое воздействие на человека может производиться по разным каналам. С помощью различных видов информации. В лекции, например, студенты воспринимают около 70% информации, читая книгу — тоже около 70%. Но если их соединить, то из каждого источника извлекается по 70%, но разной информации — общий объем извлеченной из двух источников информации будет больше 70%.
Эффективность усвоения информации может быть повышена за счет фона, на котором эта информация передается. Можно, например, “собрать” внимание аудитории за счет тревожной музыки, на фоне которой сообщить: “До экзамена осталось 47 дней!”. В результате такого воздействия аудитория отвлечется от весеннего настроения и станет работоспособной на некоторый промежуток времени, т.е. будет привлечено внимание к теме занятия.
С помощью звука, графики, анимации можно не только создавать фон, но и передавать информацию, так как семантика (смысл) не имеет четко выраженного носителя. Смысл может передаваться такими способами, которые трудно объяснить. Например, во фразе: “Глокая куздра штеко кудланула бокра и кудрячит бокренка” нет ни одного слова, имеющего ядро смысла. И в то же время трудно выразимый словами смысл в этой фразе содержится — бокренка жалко, а куздра — нехорошая. Здесь смысл передается грамматическими конструкциями, может быть даже звучанием непонятных слов.
Обработка смысла на ЭВМ — еще один аспект мультимедиа-технологий.
Сам термин “мультимедиа” обозначает “многосредность”, т.е. использование большого количества видов информации.
Мультимедиа-система — это человеко-машинная система. Она состоит из двух частей: человека (оператора, пользователя) и машины (т.е. информационно-программно-технического комплекса). Эти две части неразрывны. Причем, человек является более тонко организованной и более сложной частью системы. Его способность выполнять работу в сильной степени зависит от самочувствия, настроения, заинтересованности, которые часто меняются и непредсказуемы заранее. Человек — это наименее надежная часть системы, оказывающая очень сильное влияние на ее эффективность.
Системы мультимедиа, оказывая психологическое воздействие на человека, создают условия для его продуктивной работы — это нашло отражение в специальной организации программирования: создание дружественной для пользователя среды общения.
Таким образом, мультимедиа — это компьютерная информационная технология, позволяющая объединить в компьютерной системе текст, звук, графические изображения и анимацию, с помощью которых оказывается воздействие на психическое состояние человека, на его способность воспринимать информацию, на его работоспособность.
Отличительными особенностями систем мультимедиа являются:
1) интеграция в одном программном продукте разнообразных видов информации;
2) наличие в составе ЭВМ специфических устройств для ввода, вывода и обработки различных видов информации. К числу таких устройств относятся: звуковая карта, графические ускорители, микропроцессоры с дополнительной системой команд ММХ и т.д.;
3) работа мультимедиа-систем в реальном масштабе времени, что связано с использованием динамических видов информации;
4) создание нового уровня интерактивного общения человека с ЭВМ, благодаря которому улучшается усвоение человеком информации.
В связи с появлением мультимедиа-систем, появились новые для человека источники информации: электронные книги, музейные и туристические путеводители, обучающие системы, консультирующие и диагностические системы, рекламные ролики, видеоклипы, презентации различных видов. Эти источники информации могут иметь различное исполнение. Например, электронные книги могут быть выполнены в виде мультимедиа-книг (т.е. электронных книг, использующих текст, аудио, статическую графику и видео, записанные на одном носителе и организованные линейно, для последовательного воспроизведения), полимедиа-книг (отличающихся от мультимедиа-книг тем, что используют комбинацию нескольких различных носителей информации для представления ее пользователю), гипермедиа-книг (имеющих нелинейную организацию содержащейся информации, при которой читателю дается возможность, оставив основной материал, обратиться к уточнениям, пояснениям, комментариям и т.д.), и телемедиа-книг (использующих возможности телекоммуникаций для поддержки распределенной интерактивной системы, например, для дистанционного обучения).
Специальным построением программного обеспечения в системах мультимедиа достигается эффект, который получил название “виртуальная реальность”. Этот эффект направлен на замену имеющейся у человека модели мира несуществующей (виртуальной) моделью, в которой живут и действуют несуществующие или невоспринимаемые в реальном мире персонажи. Иногда для создания виртуальной реальности используются специальные технические средства, например, стереоочки — для восприятия трехмерного изображения, получения “глубинного” зрения; специальная подвеска для воздействия на вестибулярный аппарат человека, стереонаушники и др.
В США разрабатывается проект NII (National Information Infrastructure), в котором большое внимание уделяется, с одной стороны, созданию технических средств, в том числе мультимедиа, и с другой стороны, слиянию компьютерных фирм с фирмами, производящими информацию. Это слияние сейчас наиболее четко видно в Internet: сайты крупных компьютерных фирм сливаются с масс-медиа. Голливуд переводит в электронный вид свое хранилище фильмов и организует вывод в прокат по Интернету одновременно до 10000 фильмов (для демонстрации на ЭВМ пользователя). Для этого созданы высокоскоростные базовые сети передачи данных vBNS и Abilene. Фирмы nCube и Oracle ведут разработку фильмохранилища, которое будет содержать до 100000 фильмов Голливудского качества, характеризуемого следующими параметрами: 24 кадра в секунду, 1 кадр содержит 1 млн. пиксел, каждый кадр фильма может содержать до 20 млн. цветов (это значит, что цвет каждого пиксела кодируется не менее, чем 24 битами), продолжительность фильма — 1,5 часа.
Электронные вычислительные машины создавались для вычислений. Поэтому основной информацией является числовая. Другие виды можно представить в виде графа (рис. 1).
Рис. 1. Виды информации, обрабатываемой на ЭВМ
Системы мультимедиа начинались со звука, который воспринимается независимо от изображения, не наносит ущерба восприятию выводимой на экран информации, а при хорошем качестве — даже дополняет ее и повышает восприимчивость пользователя, оказывает сильное психологическое воздействие на оператора, создает настроение. Звуковое сопровождение может служить дополнительным способом передачи информации об основном и фоновом процессах, например, воспроизведение речи дает представление об индивидуальности говорящего, помогает разобраться в произношении слов; сопровождение фонового процесса звуковыми эффектами способствует возникновению образного представления об особенностях их протекания, информирует пользователя о наступлении ожидаемого события, может привлекать к себе внимание и др. (например, о появлении сообщения в электронной почте может информировать звук падающей газеты или защелкивание крышки почтового ящика; перекачка информации может сопровождаться журчанием ручейка).
Аудио и графическая-динамическая информации существуют только с учетом фактора времени. Если масштаб времени изменить, то информация искажается. Правильно воспринять ее можно, только если она находится в динамике. Для обработки ее приходится использовать специальные программные средства.
Статическая видео-информация представляет собой графики, чертежи, таблицы, диаграммы, которые относятся к так называемым штриховым рисункам. Кроме штриховых есть полутоновые рисунки, в которых форма предметов передается с помощью яркости или цвета.
Статическая видеоинформация может быть плоской или объемной, монохромной или цветной. Кодируется она в ЭВМ по-разному. Для вывода ее на экран, она должна находиться в двоичном виде в видеопамяти. Для монохромной информации видеопамять имеет плоскую структуру — плоскость, на которой находятся точки, разбитые по строкам и колонкам. Количество точек в строке и количество строк на экране характеризуют разрешающую способность экрана, которая может перенастраиваться с помощью программных средств. Каждая точка видеопамяти может иметь значение 0 или 1.
При выводе цветной информации видеопамять делится на большое количество видеоплоскостей, на каждой из которых хранится один бит, характеризующий цвет данного пиксела. Если цвет кодируется 24-разрядным числом, в видеопамяти используется 24 видеоплос-кости. При этом, для кодирования каждого из основных цветов — красного, зеленого и синего отводится по 8 плоскостей. Все видеоплоскости одинаковы по количеству строк и точек в строке, произведение которых определяет разрешающую способность экрана. Если обозначить количество видеоплоскостей символом k, количество точек на плоскости — n, количество строк — m, разрешающую способность экрана — P, а объем видеопамяти, требуемый для размещения копии экрана, — v (в битах), то
v=n х m х k=P х k. (2)
Из выражения (2) видно, что при фиксированном объеме видеопамяти v для увеличения разрешающей способности экрана необходимо уменьшить количество выводимых на экран цветов.
Динамическая видеоинформация — это фильмы (слайд-фильмы, мультфильмы, видеофильмы). Этот вид информации отличается многокадровостью.
В основе динамической видеоинформации лежит последовательное экспонирование на экране отдельных кадров вывода в соответствии со сценарием. Поэтому процесс обработки динамической видеоинформации часто называется редактированием сценариев.
Динамическая видеоинформация используется либо для последовательной демонстрации кадров вывода (слайдов), либо для демонстрации движущихся изображений (что часто называется анимацией).
При демонстрации слайд-фильмов каждый кадр должен находиться на экране столько времени, сколько необходимо для восприятия его человеком (примерно от 30 сек. до 1,5 мин. и более).
Анимационные фильмы демонстрируются так, чтобы отдельные кадры вывода зрительный аппарат человека зафиксировать не мог. Для этого они должны достаточно быстро сменять друг друга. Поскольку время демонстрации на экране каждого кадра вывода мало, каждый отдельный кадр сознанием человека не воспринимается. При частоте смены кадров 16 кадров в секунду незаметно даже мелькание при смене кадров. Стандарт кино — 24 кадра в секунду, телевидения (в Европе) — 25 кадров в секунду, в США — 30 кадров в секунду.
Все информационные системы предназначены для передачи смысла (семантики). Наука о передаче смысла называется “семиотика”. В ней считается, что основными переносчиками смысла являются знаковые системы.
Смысл очень тесно связан с общением людей — любое общение влечет за собой передачу и обработку смысла. Восприятие смысла связано с проблемой понимания. Смысл остается недоступен, если не понятно, о чем идет речь. Для того, чтобы определить понятие “смысл”, обратим внимание на разницу между знанием и пониманием. Можно знать наизусть произведение А.С. Пушкина “Евгений Онегин”. Но понимаете Вы его или нет — станет ясно при ответе на вопрос: “Какого числа и в каком месяце состоялась дуэль Ленского с Онегиным?” Прямого указания в тексте на это нет. Но из текста следует, что они поссорились на именинах Татьяны Лариной. А по христианскому календарю Татьянин день приходится на 24 января. Следовательно, дуэль состоялась 25 января.
Из этого примера следует, что для понимания текста недостаточно только знание его, необходимо привлечение дополнительной информации, смежной с той, которая содержится в основном тексте. Для того, чтобы сказать, что Вы понимаете какой-то текст, необходимо привлекать дополнительную информацию. Смысл текста станет понятен, если Вы подготовлены к его восприятию, если у Вас есть какая-то модель, в которую вписываются затронутые в тексте события.
Когда люди общаются, если у них модель мира одинакова, и если они на одном языке говорят, то у них есть все необходимое для взаимопонимания. Но если у них язык общения разный, они не могут сопрячь свои модели мира. И если один из них воспитывался на Земле, а другой — на Фаэтоне, они не смогут понять друг друга, так как у них не только язык, но и модели мира будут разными.
Для того, чтобы компьютер обрабатывал смысловую информацию, его надо научить этому. Но мы сами не всегда четко понимаем, как это делается человеком.
Знаковые системы, с помощью которых переносится смысл — это текст, числа, речь, рисунок. Но при передаче смысла с помощью текста (речи) мы сталкиваемся с тем, что один и тот же текст может нести разный смысл. Это связано с имеющимися у людей моделями мира: если модель одна — то смысл 1, если другая — то смысл 2. Кроме того, смысл может меняться при наложении на текст интонации, за счет эмоций, мимики, при незначительных изменениях текста (например, “способный человек”, “очень способный человек”, “на все способный человек”). Для людей — не проблема уловить оттенки смысла. Но объяснить, как это делается, можно далеко не всегда.
Для передачи и обработки смысла на ЭВМ, он должен быть оцифрован, т.е. представлен в виде цифр. Один из способов оцифровки смысла излагается в работах А.П. Журавлева.
Основываясь на работах английского лингвиста Осгуда, исследовавшего тезаурус английского языка, А.П. Журавлев пришел к выводу, что оцифровку смысла можно производить методом шкалирования. Суть этого метода заключается в том, что два противоположных по смыслу понятия ставятся по разным сторонам шкалы, например, пятиэлементной (рис. 2):
Рис. 2. Структура пятиэлементной шкалы
По такой шкале можно оцифровывать различные понятия, выраженные словами, например, хорошая или плохая экзаменационная оценка “неудовлетворительно”? В какое место этой шкалы попадут Мишка Квакин, Женя, Тимур из рассказа А. Гайдара “Тимур и его команда”?
Практический выход у этого метода виден на примере диалоговой системы резервирования билетов в транспортном агентстве, когда на вопрос системы: “Каким видом транспорта Вы намерены воспользоваться?”, клиент отвечает: “Самым быстрым”. Если все доступные виды транспорта были оцифрованы по шкале “быстрый-медленный”, то решить эту задачу диалоговой системе нетрудно.
Смысл несет не только написание слова, но и его звучание. Причем, слова могут передавать смысл, даже если они не обозначают никакого понятия. Если есть понятие, то его определение (дефиниция) помогает восприятию смысла: “отец” и “папа” обозначают одно и то же: мужчина по отношению к своим детям. Но по смыслу это неэквивалентные слова: в деловой бумаге Вы напишете “Мой отец”, а в письме домой — “Здравствуй, папа”. Несмотря на общность дефиниции, эти слова имеют различные оттенки смысла. Поэтому Журавлев и Осгуд считают, что смысл передается с помощью двух компонент: ядра смысла (которое заключено в дефиниции) и смысловых ореолов (которые могут быть оценены по системе шкал).
Смысл передается даже словами, не имеющими смыслового ядра, например, слово “фитюлька”: ядра смысла у этого слова нет, но ясно, что это что-то маленькое, слабенькое, беззащитное, например, девочка. Здесь слова “маленькое”, “слабенькое”, “беззащитное” являются типичными смысловыми ореолами.
В трудных случаях, когда не удается построить дефиницию по принципу “род-видовые отличия”, определить понятие можно смысловыми ореолами (т.е. через перечисление характерных для понятия признаков), а сами ореолы могут быть оцифрованы по соответствующим шкалам.
Но оцифровка — это только одна проблема передачи и обработки смысла. Для обработки смысла используются такие операции, как “узнавание”, “классификация”, “прогнозирование” и др. Каждая такая операция может быть реализована на ЭВМ с помощью различных математических методов.
Эмоции — это еще один вид информации, широко используемый в животном мире для характеристики отношения к происходящим событиям. Эмоции передаются не только (и не столько) словами, но и мимикой, и интонациями.
Попытки обрабатывать эмоции, выражать свое эмоциональное отношение при работе на ЭВМ, делались давно. Для этого были изобретены смайлики (символы, определяющие отношение к высказанному тексту). Смайлики представляют собой комбинацию символов, смысл которых легко понять, если мысленно повернуть их на 90 градусов — символы располагаются в строку, а смотреть их надо, расположив по вертикали. Например, улыбка передается с помощью смайлика — :-), а недовольство — :-(, сильное недовольство — :-(((. Смайлики ставятся в тексте в конце предложения, к которому надо сформировать какое-то необычное отношение.
Другие способы — более сложные. Они формируются чаще всего интуитивно, и успех при передаче эмоций зависит от внутреннего мира человека, от его настроения, эмоционального состояния. Например, с эмоциями связано стремление создать интригующее заглавие информационной системы, так как интрига создает эмоциональный настрой, вызывающий возникновение интереса у пользователя.
Цвет — тоже разновидность информации. Известно, что цвета делятся на теплые и холодные, возбуждающие и тормозящие. При правильном подборе цвета, с его помощью можно влиять на настроение работающего на ЭВМ.
Цвет часто используется, как код (“синий — экран смерти” в Windows 2000, красный — цвет аварийного сообщения, . ). В программных продуктах разные цвета могут использоваться в разных окнах, появляющихся на экране. Пользователь быстро привыкает к цветовым кодам (не осознавая этого), и цвет позволяет ему быстрее перестраиваться.
При цветовом кодировании часто встречаются две ошибки: одна из них — слишком большое количество цветов, используемых в программе. Неподготовленный человек не может воспринимать более 7 цветовых кодов. Большее количество цветов может воспринимать только специально подготовленный к этому человек (т.е. прошедший специальное обучение). Вторая ошибка встречается в случае, если программист не знает, что цвет является кодом, и применяет один и тот же цвет для отображения прямо противоположных событий. Тогда ассоциация с цветом, как с кодом, разрушается, и возникает негативное отношение к программе.
Источник