- Тема 11. Информационные системы для автоматизации различных сфер управления и бизнеса.
- 2. Системы анализа финансового состояния.
- 3. Системы маркетингового анализа.
- Тема 2. Информационные системы и технологии обработки информации
- 2.1. Состав и структура информационной системы
- 2.1.1. Классификация информационных систем
- 2.1.2. Основные компоненты ИС [4]
- 2.2. Информационные компоненты в системах управления
- 2.2.1. Информационная модель управления в системах материальных преобразований
- 2.2.2. Информация в системах обработки и генерации знания
- 2.2.3. Характер информационных составляющих в системах управления
- 2.3. Информационные технологии
- 2.4. О реализации процесса поиска информации
- Вопросы для самопроверки
Тема 11. Информационные системы для автоматизации различных сфер управления и бизнеса.
Задачи, связанные с обработкой данных, широко распространены в любой деятельности. На их основе ведут, например, учет товаров в супермаркетах и на складах, начисляют зарплату в бухгалтериях и т.д.
Системы электронной обработки данных (СЭОД) служат для решения задач, имеющих высокое содержание операций по обработке данных. К таким операциям относят сбор данных, манипулирование ими, хранение данных и подготовку документов.
Эти системы применяются на уровне операционной (исполнительской) деятельности персонала невысокой квалификации в целях:
¾ автоматизации некоторых рутинных постоянно повторяющихся операций управленческого труда;
¾ создания периодических контрольных отчетов о состоянии дел в фирме;
¾ получения ответов на всевозможные текущие запросы и оформления их в виде бумажных документов или отчетов.
Примеры рутинных операций:
¾ операция проверки на соответствие нормативу уровня запасов указанных товаров на складе. При уменьшении уровня запаса выдастся заказ поставщику с указанием потребного количества товара и сроков поставки;
¾ операция продажи товаров фирмой, в результате которой формируется выходной документ для покупателя в виде чека или квитанции.
Пример контрольного отчета : ежедневный отчет о поступлениях и выдачах наличных средств банком, формируемый в целях контроля баланса наличных средств.
Пример запроса : запрос к базе данных по кадрам, который позволит получить данные о требованиях, предъявляемых к кандидатам на занятие определенной должности.
Существует несколько характеристик, связанных с обработкой данных, отличающих СЭОД от всех других компьютерных информационных систем. В их числе:
1. выполнение необходимых фирме задач по обработке данных . Каждой фирме предписано законом иметь и хранить данные о своей деятельности, которые можно использовать как средство обеспечения и поддержания контроля на фирме. Кроме того, эти данные желают видеть держатели акций, финансовые организации и владельцы;
2. решение только хорошо структурированных задач , по которым известен алгоритм, ведущий прямо к вычислению решения задачи;
3. выполнение стандартных процедур обработки . Существующие стандарты определяют типовые процедуры обработки данных и предписывают их соблюдение организациями всех видов;
4. работа в автоматическом режиме . Система предназначена для полной автоматизации рутинных бухгалтерских расчетов с минимальным участием человека;
5. использование детализированных данных . Записи данных о деятельности фирмы имеют детальный (подробный) характер, допускающий проведение ревизий. В процессе ревизии деятельность фирмы проверяется хронологически от начала периода к его концу и от конца к началу;
6. акцент на хронологию событий ;
7. минимальная помощь в решении проблем .
Существует два класса СЭОД: системы операционной обработки данных и системы оперативной аналитической обработки данных.
Системы операционной обработки данных рассчитаны на быстрое обслуживание относительно простых запросов большого числа пользователей. Системы операционной обработки работают с данными, которые требуют защиты от несанкционированного доступа, от аппаратных и программных сбоев. Время ожидания выполнения типичных запросов в них не должно превышать нескольких секунд. Сфера применения таких систем — системы платежей, резервирования мест в поездах, самолетах, гостиницах, банковские и биржевые системы.
Логическая единица функционирования систем операционной обработки данных – транзакция.
Транзакция — это некоторое законченное с точки зрения пользователя действие над базой данных.
В современной литературе для обозначения систем операционной обработки часто используют термин OLTP (On-Line Transaction Processing — оперативная обработка транзакций или выполнение транзакций в режиме реального времени).
Системы оперативной аналитической обработки данных ориентированы на выполнение более сложных запросов, требующих
¾ статистической обработки исторических (накопленных за некоторый промежуток времени) данных;
¾ моделирования процессов предметной области;
¾ прогнозирования развития тех или иных явлений.
Эти системы также часто включают средства обработки информации на основе методов искусственного интеллекта, средства графического представления данных. Эти системы оперируют большими объемами исторических данных, позволяя выделить из них содержательную информацию, т.е. получить знания из данных.
Системы оперативной аналитической обработки данных в современной литературе называют OLAP-системами (On-Line Analysis Processing).
Оперативность обработки больших объемов данных в таких системах достигается за счет применения мощной, в том числе многопроцессорной, вычислительной техники, сложных методов анализа, а также специальных хранилищ данных, накапливающих информацию из различных источников за большой период времени и обеспечивающих быстрый доступ к ней.
Критерием эффективности для систем операционной обработки данных служит число транзакций, которое они способны выполнить в единицу времени. Для аналитических систем важнее скорость выполнения сложных запросов и прозрачность структуры хранения информации для пользователей.
2. Системы анализа финансового состояния.
Грамотно управлять сегодня невозможно без умения анализировать. Вот почему в настоящее время развитие и углубление экономического анализа и, в первую очередь, финансового составляет саму сущность перестройки хозяйствования. Предприятие, на котором серьезно поставлена аналитическая работа, способно раньше распознать надвигающийся кризис, оперативно отреагировать на него и с большей вероятностью избежать «неприятностей» или уменьшить степень риска.
Проведение глубокого финансового анализа предприятия сегодня невозможно без использования специализированных программных средств, в которых по исходным данным (в основном по данным бухгалтерской отчетности), используя заложенные в них алгоритмы расчета тех или иных финансовых показателей, предоставляют пользователю готовый результат в удобных для восприятия формах.
Основные функции систем.
1. Ввод исходных данных
Минимально-необходимой информацией для проведения анализа финансового состояния предприятия является стандартная бухгалтерская отчетность — баланс и отчет о прибылях и убытках, поэтому рассматриваемые системы используют эту базисную информацию в своей работе. Помимо стандартных бухгалтерских форм некоторые системы могут использовать произвольные исходные данные, характеризующие финансовую деятельность предприятия. Во всех системах кроме ручного ввода исходных данных реализуется автоматический импорт информации в формате *.dbf и/или *.txt.
2. Возможность организации анализа различных данных
В рассматриваемых системах реализована возможность приведения исходной финансовой отчетности предприятия за различные периоды к единому виду, позволяющая тем самым обеспечить сопоставимость данных, относящихся к различным периодам времени, что необходимо для их последующего анализа в динамике.
3. Расчет основных финансовых показателей ликвидности, безубыточности и рентабельности, проведение горизонтального (динамического) и вертикального (структурного) анализа
4. Сравнение финансовых показателей с нормативными
5. Реализация методик оценки финансового состояния предприятия
Системы обеспечивают использование широкого перечня регламентированных методик анализа, рекомендованных государственными органами и авторитетными негосударственными финансовыми институтами. Это методики оценки стоимости чистых активов, оценки структуры баланса, оценки кредитоспособности заемщика, финансово-экономического состояния хозяйствующих субъектов, оценки наличия признаков фиктивного или преднамеренного банкротства, анализа Государственных унитарных предприятий (ГУП) и др.
Разработчики рассматриваемых систем позаботились о развитых средствах представления информации. Отчеты в системах могут быть простыми текстовыми или графическими построенными при помощи внутреннего генератора отчетов.
Генератор отчетов – программа, позволяющая подготовить необходимые пользователю отчетные формы произвольной структуры, включающие таблицы, графики, текстовую информацию и иллюстрации. Генератор отчетов позволяет передавать отчеты в Word. Кроме того, программа имеет возможность формирования HTML-документов, полностью готовых к представлению в Internet.
7. Расширенные возможности систем
¾ настройка методик (особенностью настройки методик или создания новых методик является то, что пользователь получает те же возможности создания собственных модулей, что и разработчики; но чтобы их использовать требуются навыки программирования на алгоритмическом языке, встроенном в систему) ;
¾ возможность составления прогнозов;
¾ возможность импорта-экспорта данных;
¾ ранжирование предприятия, т.е. определение рейтинга предприятия по отношению к другим анализируемым предприятиям сопоставимой группы ;
¾ обработка отчетности других стран (созданы версии программ полностью адаптированные к особенностям бухгалтерского учета и отчетности Украины, Беларуси, Республики Молдова, Казахстана, Узбекистана ряда других стран СНГ);
¾ формирование экспертных заключений ( экспертные заключения — это набор таблиц с комментариями или без них; большинство экспертных заключений сопровождается также диаграммами и графиками, позволяющими благодаря наглядности быстро выявлять проблемные показатели).
Примеры информационных систем комплексного анализа финансового состояния предприятия
¾ система Audit Expert фирмы «Про-Инвест-ИТ»;
¾ программа «ИНЭК-АФСП» фирмы «ИНЭК»;
¾ программа «АЛЬТ-ФИНАНСЫ», программа «ИНЭК-Аналитик» фирмы «Альт»;
¾ «АБФИ-Предприятие» фирмы «Вестона»;
3. Системы маркетингового анализа.
Необходимо отметить, что менеджеры часто бывают вынуждены принимать управленческие решения в условиях неопределенности и риска, причем не только из-за несовершенства хозяйственного механизма и законодательной базы, но и из-за недостатка информации и отсутствия систем информационной поддержки управленческих решений.
Основными рисками в маркетинговой деятельности можно считать:
Источник
Тема 2. Информационные системы и технологии обработки информации
Широко используемое понятие «информационные системы», тем не менее, практически не имеет единого концептуального определения. Наиболее часто это понятие трактуется согласно определению, данному в [Криницкий1982], как «…комплекс, состоящий из информационного фонда и процедур: управляющей, обновления, информационного поиска и завершающей обработки, — позволяющего накапливать, хранить, корректировать и выдавать информацию».
Процедуры обработки информации могут быть автоматизированными или нет. В настоящее время наиболее эффективным является вариант, основанный на использовании вычислительных машин. С другой стороны, практически любая целенаправленная деятельность человека в той или иной мере связана с обработкой информации. Таким образом, автоматизированная информационная система (АИС), как специализированная подсистема эффективной обработки данных, является обязательной составной частью практически любой системы управления, будь то управление производством, научные исследования или проектные работы, экономические или социальные системы. И, как следует из существа самого понятия «информация», именно сфера управления является главной областью применения АИС.
Приведенное выше определение информационной системы «вытекает» и связано с устоявшейся и уже привычной, но, тем не менее, особой формой целенаправленной деятельности человека — обработкой информации, как сведений о чем-то, материально представленных на традиционных или машиночитаемых носителях, и обеспечивающих эффективность решения задач его основной деятельности. Причем понятие «системности» здесь отражает существо функциональности: состав и структура ИС определяется, исходя из требований к уровню эффективности обслуживания информационных потребностей конечных пользователей, прежде всего в части нахождения в накопленных массивах тех записей (документов), которые содержат сведения, нужные для организации эффективного управления процессами в сфере основной деятельности.
2.1. Состав и структура информационной системы
Для определения состава и взаимосвязей компонентов системы приведем предварительно определения следующих основных понятий.
Система (от греч. systema – целое, составленное из частей соединение) – совокупность элементов, взаимодействующих друг с другом и образующих определенную целостность.
Элемент системы – часть системы, имеющая определенное функциональное назначение. Сложные элементы систем, в свою очередь состоящие из более простых взаимосвязанных элементов, часто называют подсистемами [1] .
Организация системы – внутренняя упорядоченность, согласованность взаимодействия элементов системы (проявляющаяся, в частности, в ограничении разнообразия состояний элементов системы)
Структура системы – состав, порядок и принципы взаимодействия элементов системы, определяющие основные свойства системы.
Архитектура системы – совокупность свойств системы, существенных для организации взаимодействия ее составляющих.
Целостность системы – принципиальная несводимость свойств системы к сумме свойств отдельных ее элементов ( эмерджентность ) и, в то же время, зависимость свойств каждого элемента от его места и функции внутри системы.
С точки зрения формы существования системы выделяют абстрактные и материальные системы.
Абстрактные системы – это системы, которые имеют в качестве операционных объектов преимущественно идеализированные, например, знания, теории, гипотезы.
Материальные системы подразделяются на технические, эргатические и эргатехнические (смешанного типа). Именно эргатехнические системы — материальные системы «человек-машина», состоящие из эргатического элемента (человека-оператора) и технического элемента (машины), будут составлять основной предмет изучения.
Информационная система (ИС) – материальная система, организующая, хранящая и преобразующая информацию. Это система, основным предметом и продуктом труда в которой является информация.
Автоматизированная система обработки данных (СОД) — комплекс взаимосвязанных методов и средств преобразования данных, необходимых пользователю. Здесь данные понимаются как информация, представленная в формализованном виде, пригодном для автоматической обработки при возможном участии человека.
Системы обработки знаний (СОЗ) — автоматизированные СОД, имеющие специальное программное обеспечение для анализа семантики информации и ее гибкой логической структуризации.
В основу построения эффективных автоматизированных СОД (как систем наиболее эффективного типа) положены следующие принципы:
— принцип интеграции – обрабатываемые данные, однажды введенные в систему, многократно используются для решения возможно большего числа задач, чем максимально устраняется дублирование данных и операций их преобразования;
— принцип системности – обработка данных в различных «разрезах» с целью получения информации, необходимой для принятия решений на всех уровнях и во всех функциональных подсистемах управления;
— принцип комплексности – механизация и автоматизация процедур преобразования данных на всех стадиях технологического процесса.
2.1.1. Классификация информационных систем
Понятие системы тесно связано с эффективностью обработки информации, что, в свою очередь, базируется на специализированности компонентов и процессов. Такая специализированность (ориентация на определенный класс задач) обусловлена обычно свойствами обрабатываемых объектов. Информация, как основной объект обработки, может быть классифицирована следующим образом:
— по характеру, определяемому свойствами объектов предметной области – четкие или лингвистические [2] переменные;
— по принадлежности к подсистеме управления — информация по целевой подсистеме, по сопровождению системы, по связи с внешней средой, по обеспечивающей, управляемой и управляющей подсистемам;
— по форме представления – числовая или вербальная (словесная);
— по изменчивости во времени — условно-постоянная и условно-переменная;
— по способу передачи (используемому носителю) — письменная или электронная, спутниковая или телефонная и т.д.;
— по режиму передачи — в нерегламентные сроки, по запросу или принудительно;
— по назначению — экономическая, техническая, социальная, организационная и т.д.;
— по стадиям жизненного цикла объекта – этап научно-исследовательской или опытно-конструкторской работы, организационно-технологическая подготовка производства, эксплуатация и т.д.;
— по отношению объекта управления к субъекту — между системой и внешней средой, по вертикали и горизонтали, между управляющей и управляемой подсистемой.
С точки зрения применения информационные системы могут классифицироваться:
1) по характеру использования результатной информации:
— информационно-поисковые (сбор, хранение, выдача информации по запросу пользователя);
— информационно-советующие (системы поддержки принятия решений);
— информационно-управляющие (результатная информация непосредственно участвует в формировании управляющих воздействий);
2) по функциональному назначению:
— финансовые ИС и т.д.
3) по объектам управления
— ИС автоматизированного проектирования;
— ИС управления технологическими процессами;
— ИС управления предприятием и т. д.
4) по степени автоматизации процессов обработки
— ИС с ручной обработкой информации;
— ИС механизированной обработки информации;
— ИС автоматизированной обработки информации;
— ИС автоматической обработки информации.
Другим аспектом типологии ИС является «информационный», что позволяет выделить следующие классы, определяющиеся, по существу, технологией создания и использования информации, основанной на концепции баз данных, свойства которых и переносятся на информационные системы.
По форме представляемой информации можно выделить фактографические, документальные, мультимедийные, что в той или иной степени соответствует цифровой, символьной и другим формам представления информации в вычислительной среде.
По типу хранимой (исключая мультимедийную) информации можно выделить фактографические, документальные, лексикографические БД. Лексикографические базы – это классификаторы, кодификаторы, словари основ слов, тезаурусы, рубрикаторы и т.д., которые обычно используются в качестве справочных совместно с документальными или фактографическими БД. Документальные базы подразделяются по уровню представления информации – полнотекстовые (обрабатывающие так называемые «первичные» документы) и библиографическо-реферативные (обрабатывающие «вторичные» документы, отражающие на адресном и содержательном уровне первичный документ).
По типу используемой модели данных выделяют традиционно три класса БД: иерархические, сетевые, реляционные. Развитие технологий обработки данных привело к появлению постреляционных , объектноориентированных , многомерных БД, которые в той или иной степени соответствуют трем упомянутым классическим моделям.
По топологии хранения данных различают локальные и распределенные ИС.
По типологии доступа и характеру использования хранимой информации ИС могут быть разделены на специализированные и интегрированные [3] .
По функциональному назначению (характеру решаемых с помощью ИС задач и, соответственно, характеру использования данных) можно выделить операционные и справочно-информационные. К последним можно отнести ретроспективные ИС (электронные каталоги библиотек, БД статистической информации и т.д.), которые используются для информационной поддержки основной деятельности и не предполагают внесение изменений в уже существующие записи, например, по результатам этой деятельности. Операционные ИС предназначены для управления различными технологическими процессами. В этом случае данные не только извлекаются из БД, но и изменяются (в том числе добавляются), в том числе в результате этого использования.
По сфере возможного применения можно различать универсальные и специализированные (или проблемно-ориентированные) системы.
По степени доступности можно выделить общедоступные и ИС с ограниченным доступом пользователей. В последнем случае говорят об управляемом доступе, индивидуально определяющем не только набор доступных данных, но и характер операций, которые доступны пользователю.
Следует отметить, что представленная классификация не является полной и исчерпывающей. Она в большей степени отражает исторически сложившееся состояние дел в сфере деятельности, связанной с разработкой и применением баз данных.
2.1.2. Основные компоненты ИС [4]
Как было сказано, ИС – это составная часть некоторой большей системы, обеспечивающая достижение какой-либо реальной цели в деятельности человека. Это уже предполагает, что всякая информационная система имеет некоторую материальную основу – носитель информации. Такими носителями, составляющими физический компонент системы (технические средства), являются как среда внешней памяти, так и технические и вычислительные средства, обеспечивающие непосредственно обработку и взаимодействие пользователя с АИС.
Второй компонент – это процедуры, обеспечивающие функционирование системы (программные средства), и в первую очередь – подсистемы управления данными, а также процедуры специализированной обработки, отражающие требования предметной области.
Однако существо информационной системы в наибольшей степени выражается третьим компонентом — информационным фондом, который характеризуется не только содержащейся информацией, но и способом ее организации (модель данных) и формой представления. Последнее в свою очередь определяется языком представления и управления информацией (лингвистическое обеспечение).
Примерная организационно-функциональная классификация АИС приведена на рис. 2.1.
Рис. 2.1. Организационно-функциональный состав ИС
Функциональные подсистемы ИС реализуют и поддерживают модели, методы и алгоритмы получения управляющей информации. Состав функциональных подсистем зависит от предметной области использования ИС. Их назначение достаточно очевидно. Отметим только, что подсистема научно-технической подготовки отвечает за выполнение научно-исследовательских (в том числе маркетинговых) работ, конструкторскую и технологическую подготовку производства.
Состав обеспечивающих систем достаточно стабилен и по большей части мало зависит от предметной области использования ИС. Отметим следующие компоненты:
— Программное обеспечение – совокупность программ регулярного применения, необходимых для решения функциональных задач, и программ, позволяющих наиболее эффективно использовать вычислительную технику, обеспечивая пользователям наибольшие удобства в работе.
— Математическое обеспечение – совокупность методов, моделей и алгоритмов обработки информации, используемых в системе.
— Лингвистическое обеспечение – совокупность языковых средств. Обычно включает комплекс языков, отражающий многоуровневость представления информации в АИС, и в том числе язык запросов и отчетов, обеспечивающий удобство работы конечному пользователю, специальные языки определения и управления данными, обеспечивающие адекватность внутреннего представления и согласование внутреннего и внешнего представлений. В наибольшей степени определяется особенностями предметной области.
Организационные подсистемы также относятся к обеспечивающим подсистемам, но направлены в первую очередь на обеспечение эффективной работы персонала и поэтому могут быть выделены отдельно.
Отметим, что разработка ИС должна начинаться именно с создания организационного обеспечения: экономического обоснования целесообразности системы, состава экономических показателей, определяющих ее деятельность, состава функциональных подсистем, организационной структуры управления, технологических схем преобразования информации, порядка проведения работ и т.д.
2.2. Информационные компоненты в системах управления
Управление – это процесс обработки информации, направленный на достижение определенной цели. С другой стороны, управление – это функция системы, обеспечивающая либо сохранение ее основных свойств, либо ее развитие в заданном направлении. Управление осуществляется для достижения определенной цели, вполне конкретной для каждого отдельного объекта управления и связанной с состояниями объекта и среды, в которой он находится. Обобщенная схема информационных потоков и место ИС в процессе управления представлены на рис. 2.2.
Для исследования характера взаимодействия управляемого процесса и информационной системы через определение структуры и характера информационных потоков между ними будем рассматривать эти элементы с позиции системного подхода, принимая, что «…система представляет собой отражение материального образования с точки зрения единства его поведения и строения, обусловленность поведения этого целого определяется спецификой внутреннего строения, спецификой его элементов и особенностями взаимодействия между ними. Т.е., система это такое строение, которое осуществляет преобразование причинных воздействий из окружающей среды и изнутри системы в соответствующие изменения объекта как целого» [Смирнов1978]. Здесь понятие «поведение» отражает связь изменений в окружающей среде и/или самой системе с внешними или внутренними причинными воздействиями, вызвавшими эти изменения, а «строение» системы, как противоположное свойство, определяется единством множества элементов и структуры, осуществляющей их интеграцию в целостное образование.
2.2.1. Информационная модель управления в системах материальных преобразований
На основании результатов анализа генезиса механизма управления, представленных в [Дружинин1976, Криницкий1982, Поспелов1975], обобщенная информационная модель механизма управления, как средства, реализующего «поведение» системы в сфере материальных преобразований, может быть представлена в виде, приведенном на рис. 2.3.
Рис. 2.3. Информация в системах управления
Здесь система — это часть реального мира (среды), реализующая целенаправленное взаимодействие с объектами ближней среды, и не совпадающая с ней. Результатом взаимодействия является изменение ближней среды.
К ближней среде относится та часть среды, которая существенно воздействует на систему и/или подвергается существенному воздействию со стороны системы. Средой могут быть и другие системы, в том числе и более высокого уровня. С этой точки зрения вход трактуется как причина, а выход — как следствие взаимодействия.
Состоянием системы будем называть множество существенных свойств, которыми обладает система, а структурой – ту их часть, которая остается в системе неизменной при изменении ее состояния.
В системе выделяются входной, преобразующий и выходной компоненты. Для систем, реализующих целенаправленное поведение, преобразующий компонент включает (или зависит от) компонента управления, который обеспечивает посредством управляющих сигналов изменение свойств преобразователя, т.е. характер преобразования объектов среды.
Входной компонент — это обобщенное средство восприятия среды, будь то активное ее воздействие на систему или, например, активное измерение системой параметров, характеризующих состояние среды.
Аналогично, выходной компонент — это обобщенное средство воздействия на среду или изменения соотношения с ней (в том числе, например, изменение самой системы по отношению к среде).
Преобразователь осуществляет изменение объекта, поступающего через входной компонент. Таким объектом может быть элемент среды, либо изменяемый компонент самой системы. Можно сказать, что первый случай соответствует системам, целью которых является преобразование среды или сохранение себя в условиях изменяющейся среды, а второй – саморазвивающимся системам, конечной целью которых является построение новой системы или новых взаимосвязей со средой.
Решатель осуществляет по фиксированным правилам (например, на уровне соответствий) выбор преобразования (например, через установку значений соответствующих параметров). Т.е., решатель осуществляет регулирование преобразования на уровне оперативного управления, которое реализуется в виде отдельной реакции на отдельное текущее воздействие. В том случае, когда решатель реализует принцип «обратной связи», т.е. вырабатывает сигналы управления на основе измерения параметров изменяемых объектов (как результата взаимодействия с системой), система может реализовать задачу «самосохранения».
Системы, имеющие первый контур управления, могут быть отнесены к саморегулирующимся и представляют собой класс детерминированных систем с управлением, не предвосхищающим будущие состояния, т.е. реагирующими только на случившиеся входные воздействия, а не на их будущие значения. Для рассматриваемых реальных систем материальность преобразования предопределяет единственность процесса с предопределенным разнообразием состояний. А в том случае, если для процесса выполняется некоторый принцип «самосохранения», управление может рассматриваться как задача оптимального управления (например, как максимизация эффекта при минимуме затрат).
Такого рода замкнутость и предопределенность условий предполагает наличие субъекта управления, имеющего целевые установки и выбирающего или определяющего пределы функционирования не только «решателя-преобразователя», но и всей системы в целом. Компонент, обеспечивающий выполнение таких функций, представлен в схеме организатором, собственно и осуществляющим выбор цели, а также определение методов и принципов ее достижения. Для этого (второго) контура управления характерны сигналы, представленные преимущественно в информационной форме. Кроме того, поскольку задачи прогнозирования поведения, обеспечивающего достижение цели, базируются на знании причинно-следственных связей, организатор должен обладать свойством памяти для хранения и выборочного использования данных о состояниях среды и «опыта» системы.
Рассматриваемая обобщенная модель объекта деятельности как управляемой системы, взаимодействующей со средой на уровне обмена веществом и энергией, уже включает в явной форме информационные компоненты, что собственно и обеспечивает саму возможность управления. Причем для систем человеко-машинных и социальных выделяют [Урсул1973] две формы информации [5] : материальную и идеальную. Под материальной информацией здесь понимается отражение разнообразия вне сознания человека и независимо от него. Отражение же в сознании человека есть идеальная информация, которая в свою очередь может материализоваться в виде разнообразия управляющих воздействий или знания, фиксирующего это разнообразие в документальной форме. То есть, информация изначально не создается системой, а только отображается. Однако при наличии второго контура возникает необходимость (и целесообразность) создания новой информации, отражающей сам процесс управления, например, в виде результатов, принципов и методов. Особенностью такой информации является языковая форма ее представления, что и обеспечивает возможности коммуникации в науке и обществе.
Выбор целей, принципов и методов решения представляет собой реализацию стратегии управления как способа распределения ресурсов в течение всего периода взаимодействия со средой и по существу является «…процессом отбора из всех возможностей системы одной или нескольких близких возможностей, которые и реализуются в действительности или, по крайней мере, осознаются как оптимальные» [Разумовский1983]. Здесь «оптимальность» представляется как своеобразный принцип сохранения, указывающий, что никакой результат не может быть получен «из ничего». Кроме того, свойственное человеко-машинным системам научное мышление «..не ограничивается фиксацией эмпирических фактов, а также частных и специфических законов. Оно с необходимостью, в ходе развития теорий, выходит на уровень обобщающих специфических и неспецифических научных принципов, отражающих в своем содержании объективно общее и всеобщее. Принципы науки суть фиксация опыта, и доказуемы они только опытом. Поэтому сфера их действия, а также сфера действия построенных на их основе теорий имеет те же границы, что и научная эмпирия. Применение тех или иных принципов вне сферы этого опыта, в частности обобщение специфических научных принципов до уровня неспецифических, происходит на основе предположения и последующего обнаружения общности и единства формы новых классов явлений с углублением в сущность на базе новой эмпирии. Такая экстраполяция носит гипотетический характер, но опирается на принцип материального единства мира, единства пространственно-временных отношений. Конкретные способы такого обобщения многообразны» [Разумовский1983]. Таким образом, функция оснований любой теории – это, прежде всего, организация наличного знания с целью удобного получения следствий. Но, даже имея некоторый минимум твердо установленных принципов, трудно априори утверждать, что к нему нельзя еще добавить какой-нибудь новый принцип.
Схема, представленная на рис. 2.3, отражает наблюдаемое в природе и человеческой деятельности стремление так распределять задачи, чтобы была обеспечена физическая реализуемость решения и минимизирована полная работа. Это выражается в принципе выделения блоков, ориентируемых на реализацию одной функции, с однородными операционными (входными) объектами или, по крайней мере, имеющими одну форму существования [6] . Для блоков компонента управления этот принцип реализуется в стремлении минимизировать количество управляющих сигналов и количество отслеживаемых параметров и показателей (т.е., хорошо структурированная система – это «один вход – один выход – один управляющий параметр»). Это позволяет минимизировать потери точности (адекватности), которые привносят многокритериальные методы.
2.2.2. Информация в системах обработки и генерации знания
Рассмотрим обобщенную информационную схему деятельности в научной сфере (рис. 2.4), где обрабатываемые (преобразуемые) объекты (в частности и сама среда) имеют преимущественно абстрактную природу (идеальное, а не материальное происхождение). Имея ту же информационно-функциональную структуру, такие системы принципиально отличаются по характеру взаимоотношения с окружающей средой.
Рассмотренные выше системы имеют преимущественно цель самосохранения, вырабатывая отклик в ответ на изменение ближней среды. Цель вторых – преобразование среды или самой системы (самосовершенствование) для изменения (к лучшему) условий взаимодействия со средой. В этом смысле термин «научный поиск» наилучшим образом отражает активный характер системы (по отношению к среде). Для систем такого типа стимул – это неопределенность как свойство, характеризующее, но еще не выражающее проблемную ситуацию [Дорожкин1995]. Состояние неопределенности (взаимодействие внутреннего знания и внешнего по отношению к системе стимула) – симптом возможного противоречия, которое, если будет выявлено в процессе развития (исследования), формализуется в виде проблемы – состоявшегося, признанного противоречия, которое, тем не менее, еще не имеет решения и/или может иметь неоднозначные решения. Причем, решение может быть найдено рациональным способом (сведением к решаемым задачам – через уменьшение размерности), так и иррациональным, т.е. выходом за пределы существующего знания. В первом случае проблемной ситуации может быть сопоставлен ряд средств, обеспечивающих решение, причем для задач исходными данными являются как сама обрабатываемая (входная) информация, так и методы ее обработки. Именно здесь появляется возможность множественности решения проблемы. В зависимости от цели решение, например, может находиться путем элиминирования факторов и сведения к типовым случаям. То есть, в контексте понятия «цель», «задача имеет актуально достижимую цель, а проблема – потенциально достижимую» [Дорожкин1995].
Таким образом, решение проблемы (в том числе и постановка) – это отыскание форм и условий взаимодействия нового элемента знания (стимула, породившего неопределенность) с существующим знанием.
Для процесса постановки–решения задачи (как ситуации определенного выбора) характерно наличие следующих четырех компонентов:
— субъект, осуществляющий выбор;
— среда решения – принятые в качестве рабочих понятия, гипотезы, законы, парадигмы и т.п.;
— доступные средства решения и практических действий;
Проблема выбора (как частного случая нахождения) решения задачи тесно связана с методологической проблемой выбора критерия оценки альтернатив, где существуют различные точки зрения и основания, такие, как простота, обоснование правдоподобности, синтаксические, семантические и другие критерии.
Существенной особенностью ситуации выбора является то, что «выбираемые основания — это еще и средство организации наличного знания субъекта с целью удобного получения следствий» [Разумовский1983], при этом, сам процесс включает следующие взаимосвязанные и взаимообуславливающие этапы:
— определение потенциально или актуально достижимой цели (путем систематизации фактов и гипотез);
— определение основных законов и принципов (как решения, так и применения решения);
— постановку задачи – определение известных и неизвестных параметров, определение методов решения и критериев оценки решения.
Причем взаимосвязь принципов, целей и задач при их выборе обуславливается требованием «конструктивности» (разрешимости задач и достижимости цели), что допускает их вариантность и комбинативность .
Компоненты взаимодействия со средой обеспечивают как выделение (в том числе активными методами) тех объектов предметной области, которые в совокупности своей или взаимосвязи порождают неопределенность – стимул (проблемную ситуацию), так и обратную связь (управление) – оценку полученного решения как результата включения (вписывания) вновь полученного элемента среды в существующую структуру.
Так же, как и в рассмотренном выше случае модели управления (рис. 2.3), здесь в компоненте преобразования присутствуют три уровня:
1) генерация актуального результата как реализация предопределенного метода преобразования текущего входа (фиксированного набора значимых параметров в пространстве возможных состояний);
2) управление реализацией преобразования (и обеспечение его эффективности) в соответствии с предопределенными принципами и критериями – оперативное управление процессом достижения цели;
3) выбор целей (порождение гипотез), а также формирование оснований (теорий, принципов, законов) и критериев оценки применимости и эффективности преобразования – целеполагание и стратегическое управление.
Рис. 2.4. Информация в системе воспроизводства знания
В общем случае, необходимость и достаточность двух контуров управления объясняется и с позиции принципа наименьшего действия, выражающемся в стремления к однородности объектов или преобразований:
— первый контур (оперативного управления) замыкает преобразование, изолируя его от изменяющегося во времени характера воздействия среды;
— второй контур (стратегического управления) – через выбор базиса управляет взаимодействием со средой (преобразуя состояния среды в сигналы), определяет степень и границы применимости выбранного решения, а также анализирует актуальные или потенциальные противоречия внедрения вновь получаемого объекта в структуру ранее существовавших.
С точки зрения пространственно-временной динамики второй контур обеспечивает построение предполагаемой траектории (плана), а первый контур реализует этот план для каждой дискретной точки пространства состояний.
И, поскольку план — это предварительно принятые, но еще не реализованные решения, достижение предполагаемой цели обязательно характеризуется неопределенностью, которая снимается либо реализацией решения (возможно ресурсоемкой), либо предварительной оценкой степени достижимости, получаемой моделированием или аналитическим путем. Снижение ресурсоемкости в этих случаях достигается за счет использования информационных ресурсов – теоретических или эмпирических знаний о значимости того или иного свойства или знаний об их устойчивой взаимозависимости в виде законов или закономерностей, обусловленных, например, природой объекта. Более того, если нет таких информационных ресурсов или среда не обладает свойством «памяти», то система может только реагировать на сигналы: ни «обучаться», ни «планировать» такая система не может.
Для рассматриваемого случая научного поиска новое знание (результат исследований) воплощается обычно в форме сообщения — документа, реализующего преобразование смысла в текст. Такая «материализация» «идеальных» знаний обеспечивает унифицированную форму отчуждения и за счет сравнительно низкой стоимости их тиражирования существенно расширяет сферу потенциальных потребителей. С другой стороны, как неизбежное противоречие, низкая стоимость публикации (по сравнению со стоимостью получения самого результата) приводит к колоссальному и все возрастающему объему публикаций, а унифицированность способа представления обуславливает внешнюю безликость сообщений. Кроме того, чтобы опубликованное сообщение стало стимулом, сенсор должен произвести и семантические преобразования: сообщение должно быть не только воспринято (выделено среди других), но и понято (выделен смысл) и вписано в систему наличного знания (потенциально применено).
Соответственно, для обеспечения эффективности «узнавания» — первой фазы использования, сообщения должны иметь «сигнальные» признаки. Такие признаки могут быть сформированы, например, по схеме «род – видовое отличие», т. е. путем введения явной систематизации, что является достаточно естественным – научные знания всегда системны, т.к. создаются в рамках некоторой системы понятий соответствующей отрасли знаний.
Создаваемые сообщения (документы) сами в свою очередь образуют среду как воспроизводимую особую информационную ее часть, но как объекты они не могут быть отнесены к типу «активных» стимулов, что также обуславливает необходимость построения активных сенсоров – информационно-поисковых систем. Характерной особенностью этой среды является цикличность воспроизводства: объекты, ее образующие, являются результатами целенаправленной деятельности, и цель их создания – использование их самих для получения новых результатов (см. рис. 2.5). Это предопределяет «естественность» существования информационной деятельности [Попов1996], имеющей целью такое преобразование информационной среды, которое бы обеспечило ее полное и эффективное [7] использование в процессе воспроизводства. Причем, следует отметить, что такими преобразованиями могут быть либо непосредственное упорядочение сообщений, либо их «виртуальное» упорядочение – создание дополнительных (справочных) информационных сообщений, обеспечивающих альтернативный прямой вход во множество сообщений, ассоциируемых с решаемой проблемой.
С точки зрения управления информационные системы, как и ранее рассмотренные, также должны иметь двухконтурное управление.
Рис.2.5. Основные элементы (фазы) деятельности в системе воспроизводства знаний (информации)
2.2.3. Характер информационных составляющих в системах управления
Как было показано ранее, основой любого управления является наличие информационной составляющей. В цепи управления, основной задачей которого является выполнение действий, организационно предшествующих самому преобразованию, именно информация выступает в качестве операбельного эквивалента преобразуемого объекта. Возможность абстрагироваться от фиксированного момента времени (извлечь объект из реального временного пространства) позволяет построить ряд сопоставимых объектов (образов, одинаковых с точки зрения управления), каждый из которых соответствует отдельному состоянию реального объекта в фиксированный момент времени, образуя тем самым траекторию во времени, что и предопределяет возможность прогнозирования будущих состояний уже реального объекта.
Здесь, с точки зрения как теории систем, так и этапности реализации решения (действие – оценка результата действия, используемая для корректировки повторно выполняемого действия) можно выделить следующие типы информационных компонентов (сообщений):
— фактографическую информацию, фиксирующую ситуацию (состояние взаимодействия системы со средой) как результат преобразования;
— систематическую информацию, определяющую прагматические условия (принципы, законы, критерии) применения преобразования и/или построения системы.
Причем, именно вторая составляющая отражает способность и возможность качественного развития системы (на основе изменения базовых системообразующих принципов, а не только экстенсивного роста за счет свойства комбинативности компонентов). И именно введение систематической составляющей обеспечивает снижение размерности задачи идентификации входных объектов и выделения ближней среды, позволяя абстрагироваться от конкретики ситуационной составляющей (фиксируя условия выделения самой системы) и представления ее в виде отдельной структурной информационной компоненты.
Для систем управления материальными объектами такая структурная составляющая представляется, например, опытом или сводами принципов и правил; для систем преобразования объектов в идеализированной форме (например, научные исследования) – это законы природы и научные принципы; для систем управления информационными потоками (информационной деятельности) – это метаинформация: тезаурусы, классификаторы и т.д.
Таким образом, информационная составляющая управления (например, сигнал обратной связи) каждого следующего уровня может быть представлена как отражение фактической составляющей информационного компонента на системную.
Выделение ближней среды среди всех объектов по существу есть представление выделенного подмножества как системы – единого образования, целостного прежде всего по отношению к преобразующему компоненту. Т.е., с субъектно-объектной точки зрения, среда как объект преобразования — это система взаимосвязанных объектов, преобразующим субъектом которой в общем случае является совокупность взаимодействующих подсистем, в результате функционирования которых изменяются свойства объектов среды или отношения между ними.
Учитывая принцип наименьшего действия, определяющего требование однофакторности преобразования (и, соответственно, декомпозиции преобразующей системы на функциональные блоки с одним входом, одним выходом и одним управлением) можно говорить о подобии структур взаимодействующих систем – «среды» и «преобразователя», то есть, о существовании общего системообразующего основания системы, определяемой в [Урманцев1978] как
Si = < Mi , Ai , Ri , Zi > , где Mi – множество объектов; Ai – множество системообразующих признаков объектов, относимых к системе; Ri – множество отношений; Zi – системообразующий закон композиции системы.
Для объекта преобразования Si – это, соответственно, множество характерных признаков, идентифицируемых преобразователем ( Ai ); отношения связывающие объекты ( Ri ); законы композиции системы, определяющие условия и границы возможности преобразования ( Zi ).
Для субъекта преобразования Si – это, соответственно, множество базовых функций ( Ai ); множество каналов и сигналов связи подсистем ( Ri ); средства управления, обеспечивающие адаптируемость и развитие системы ( Zi ). Здесь набор базовых функций определяется свойствами объекта и характером преобразования, взаимосвязь подсистем – причинно-следственными взаимоотношениями объекта, а управляемость – целями этого преобразования, как этапа жизненного цикла субъекта.
На практике введение такого представления позволяет реализовать управление преобразованием: установление значений параметров преобразования до начала выполнения самого преобразования, т.е., определение поведения системы на основе сигналов, отражающих (с точностью, определяемой системообразующим основанием) состояние преобразуемой среды.
В этом контексте информация — это образ: результат отражения ближней среды (множество объектов и связей, удовлетворяющих требованиям системообразующего основания) как на входе, так и на выходе. Причем, физически образ реализуется как множество сигналов (сообщений), носителем которых являются объекты, не обязательно принадлежащие ближней среде.
Аналогично, управляющая информация — это модель (образ) преобразования, близкая к тем действиям, которые должны быть реализованы эффектором. Т.е., поведение системы определяется из условия, как будто система уже находится в целевом состоянии, которое реально может быть и не существует [8] .
Таким образом, информационная модель любой системы, ориентированной на взаимодействие (со средой), необходимо включает компоненты двух типов [9] — множество сообщений, отражающих актуальное (текущее) состояния ближней среды (текущие значения параметров), и сообщения о системообразующем основании, выбранном для построения этой модели. Соответственно, управление реализуется через изменение значений параметров (регулирование, эволюционное развитие) или адаптивно через изменение компонентов системообразующего основания (революционное развитие, в том числе через изменение целей).
Информационные компоненты в свою очередь расширяют (вновь образуют) среду, что предполагает наличие носителя – «памяти», локальной — как свойства самой системы, или глобальной — как свойства среды, включая в том числе и компоненты системы. При этом носителями информации могут быть как искусственные специально создаваемые среды (например, бумажные или машиночитаемые носители), так и объекты естественной природы (в этом случае информация о предшествующих состояниях объекта может представляться, например, собственной упорядоченной структурой).
В предложенном изложении понятие информации рассматривается как объект или продукт процесса целенаправленного преобразования системой компонентов среды (или преобразование самой системы, как саморазвитие), имеющих как материальную, так и идеальную (информационную) природу.
В то же время, в целеустремленных системах (к которым относятся человеко-машинные информационные системы) проявляется двойственность природы информации. Здесь информация проявляется как движущая сила: именно она является инициирующей, организующей и управляющей составляющей процесса преобразования. В этом контексте информация — это собственно преобразование некоторого объекта (имеющего информационную природу, например, сообщения, передающего некоторый смысл) среды с целью изменения его состояния (смысла). Поскольку объекты такого рода имеют в основном «идеальную» природу, их состояние фиксируется другими объектами, имеющими материальную природу, например, документами.
Именно с этой точки зрения информация рассматривается «как преобразование, которому следует подвергнуть одно сообщение, чтобы получить другое сообщение той же (смысловой) ассоциации» [Мазур1974]. Информация – это отражение в рамках принятого системообразующего основания процесса познания или, иначе, — процесс преобразования состояния наличного знания. Причем, исходное и конечное состояние (сообщения), фиксируемое традиционно в виде документов, в свою очередь является отражением основной информации в рамках познавательной парадигмы. Это представление является моделью передачи информации – информирования, реализуемого, например, в виде процесса обучения, научного исследования, а также и информационного обеспечения.
Реализация информационного обеспечения посредством информационных систем — это по существу есть преобразование информации, содержащейся в источнике (оригинал – отражение изменения наличного знания), в информацию приемника (образ – восприятие изменения состояния знания) через цепь промежуточных сообщений – ассоциации сообщений, связанных некоторыми информационными преобразованиями.
Используя основные понятия, предложенные в [Мазур1974], обобщенную структурно-функциональную модель ИС как системы, взаимодействующей с множеством сообщений внешней среды (цепочка источник информации — информационная система – потребитель информации), можно представить в виде схемы рис. 2.6.
Здесь информация IX 12 цепи оригинала — ассоциация связанных по смыслу сообщений < X 1, X 2 > , преобразуется в продольных цепях в промежуточную информацию IY 12 и воспринимается приемником как результирующая информация (образ оригинала) IZ 12 – ассоциация сообщений < Z 1, Z 2 > , в общем случае образующая, возможно, другой смысл. Соответственно, информирование – это преобразование информации, содержащейся в цепи оригиналов, в информацию цепи образов. Преобразование понимается как процесс, в результате которого одно сообщение превращается в другое, а ассоциация сообщений – это сообщения, связанные одним преобразованием.
Рис. 2.6. Информационные преобразования в совокупной ИС
В схеме, представленной на рис. 2.6, различаются кодовые (продольные) и информационные (поперечные) преобразования. Кодовые преобразования имеют целью изменение формы представления сообщения без изменения его смыслового содержания. Например, рукопись – статья – электронный документ, или авторское видение проблемы — публикация – образ, возникающий у читателя. Информационные преобразования имеют аналитико-синтетический характер и связаны с изменением смыслового содержания. Например, исходные данные – результат научного исследования – граф понятий, или документ – поисковый образ.
Таким образом, процесс получения информации, как система информационных преобразований может быть представлена трехуровневой схемой (рис. 2.7).
Рис. 2.7. ИС как система информационных преобразований
X 1 – генерируемое источником (сознанием человека) новое знание на образном уровне;
X 2 – публикация – сообщение, подготовленное автором с учетом специфики предметной области издания;
X 3 – основные понятия и закономерности, использованные автором;
Y 2 – документ – опубликованные результаты исследования, оформленные в соответствии с требованиями издания;
Y 3 – поисковый образ документа;
Z 0 – наличное знание человека – приемника информации;
Z 1 – получаемое новое знание (образное представление), возникающее в сознании человека принимающего информацию;
Z 2 – восприятие содержания документа, в контексте понимания приемником специфики предметной области;
Z 3 – восприятие приемником поискового образа документа (отражение понятий ПОДа на системообразующую понятийную схему приемника).
Такая схема передачи знаний соответствует случаю параинформирования , когда образ знания Z 1 будет получен не передачей по кодовой цепи (она реально отсутствует, так как нет носителя соответствующего уровню сознания), а будет восстановлен или вновь построен на основе образа Z 2 и наличного знания приемника Z 0 .
С точки зрения представленного ранее рассмотрения информационных компонент в системах управления, можно сказать, что кодовые преобразования инвариантны относительно внешней среды, в то время как информационные – значимы.
2.3. Информационные технологии
Согласно определению, принятому в [Колин1995], информационная технология — это представленное в проектной форме (формализованном виде, пригодном для практического использования) концентрированное выражение научных знаний и практического опыта, позволяющее рациональным образом организовать тот или иной достаточно часто повторяющийся информационный процесс. При этом достигается экономия затрат труда, энергии людских и материальных ресурсов, необходимых для реализации данного процесса.
Информационные технологии позволяют оптимизировать разнообразные информационные процессы, начиная от подготовки и издания печатной продукции и кончая информационным моделированием и прогнозированием глобальных процессов развития природы и общества.
В рамках класса задач, характерных для информационных систем, технологией обработки информации будем называть упорядоченную последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов.
Технология обработки информации зависит от характера решаемых задач, используемых средств вычислительной техники, числа пользователей, систем контроля за процессом обработки информации и т.д. Технология, как некоторый процесс, всегда присутствует в любой предметной области, особенности которой, в свою очередь, оказывают существенное влияние на функции соответствующих технологий. Информационные технологии ориентированы на решение технических, экономических и управленческих задач, связанных с выполнением операций по сбору необходимой для решения этих задач информации, переработки ее по некоторым алгоритмам и выдачи результата лицу, принимающему решение, в удобной для него форме.
Обработка информации происходит в процессе реализации технологического процесса, определяемого предметной областью.
Информационные технологии, в отличие от производственных (как следствие свойств самого объекта – информации), обладают рядом относительно специфических функций, таких как: сбор, регистрация, хранение, поиск, накопление, генерация, анализ, передача и распространение данных, информации и знаний. Информационная технология направлена на обработку и/или переработку “сырья” (в качестве которого выступают данные, информация) путем использования соответствующих “машин”, “механизмов” и “организационно-технологических приемов” (в качестве которых выступают аппаратные, программные, а также организационно-методические средства).
Таким образом, информационную технологию (ИТ) можно определить как систему методов, способов и средств сбора, регистрации, хранения, поиска, накопления, обработки, генерации, анализа, передачи и распространения данных, информации и знаний на основе применения средств вычислительной техники, программных средств и телекоммуникаций.
Сбор данных (информации) представляет собой процесс регистрации, фиксации, записи данных о событиях, объектах (реальных и абстрактных), связях, признаках и соответствующих действиях. При этом иногда выделяют в отдельные операции «сбор данных» и «сбор информации». Здесь сбор информации — это процесс идентификации и получения данных от различных источников, группирования полученных данных и представления их в форме, необходимой для ввода в ЭВМ.
Обработка данных включает в себя несколько взаимосвязанных операций, таких, как поиск, выборка, сортировка, слияние, проведение расчетов и т.д. Обработка данных представляет собой процесс управления данными, по возможности без учета смысла, заложенного в данные.
Обработка информации представляет собой переработку данных, отражающих информацию определенного типа (текстовой, цифровой, графической и др.) в процессе преобразования ее в информацию другого типа. Причем, зачастую и тип данных (как форма существования информации) определяется характером содержания, т.е., обработка информации – это преобразование данных с учетом их содержания.
Таким образом, говоря о технологии как процессе преобразования объектов (т.е., представленных в материальной форме), необходимо определить адекватный способ их идентификации. Это необходимо для их поиска — «узнавания» и выделения из множества других объектов окружающей среды.
Однако, с точки зрения рассмотренных в первой главе свойств информации, идентификация информации как объекта имеет двойственную природу: информация идентифицируется как целостный (неделимый) объект, имеющий как форму существования, так и содержание.
Это предполагает, что содержание представлено в форме композиции некоторых «атомарных» единиц информации. Например, текст, состоящий из слов.
Забегая вперед, отметим, что именно форма существования «единичного» неявно предопределяет разделение информационных систем (а точнее – баз данных, составляющих основу ИС) на фактографические и документальные. Для первых «факт» — это самодостаточная единица информации, не теряющая смысл вне других фактов обрабатываемой коллекции. Для документальных систем значение слова как семантически значимой единицы, будет однозначно восприниматься только в контексте — в единстве с другими словами.
2.4. О реализации процесса поиска информации
Для рассмотрения особенностей реализации процессов поиска информации, как одной из основных операций ИТ, отметим тот простой факт, что поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым [10] объектом, хранящимся в массиве. Причем, определяющими для понимания методов автоматизации поиска являются два следующих фактора: 1) сравниваются не сами объекты, а описания — так называемые «поисковые образы»; 2) сам процесс является сложным (составным и не одноактным) и обычно реализуется последовательностью операций. Первый фактор имеет коммуникативную природу, что обуславливает решение на уровне лингвистических средств. Второй – технологическую, когда оптимизация поиска может быть сведена к оптимизации структур данных и алгоритмов обработки.
Алгоритм поиска включает, по крайней мере (необходимо), следующие операции:
— выборку очередного объекта из массива для выполнения сравнения с запрашиваемым;
— сравнение выбранного объекта с образцом;
— принятие решения, соответствует ли объект образцу (определение степени соответствия и применение некоторого критерия для принятия решения на уровне двузначной логики «соответствует» / «не соответствует»);
— переход к выборке следующего объекта или завершение процесса поиска.
Различают два вида поиска информации – поиск целостного объекта (единицы хранения) и поиск по содержанию (точнее, некоторой части содержания – того, что не доставало пользователю в его практической деятельности). Здесь обязательно надо отметить условность такого деления. Определяющим (классификационным) признаком в этом случае является скорее не природа сравниваемых объектов, а то, что будет результатом процесса поиска в целом – документ (машинная запись как операционная единица в последующих процессах) или конкретная информация (которая будет сразу использована человеком, но, которая, естественно, представляет часть документа) [11] .
С точки зрения организации процедуры отбора этому соответствует два способа соотнесения затребованного с имеющимся в информационном массиве: 1) путем сопоставления запроса непосредственно с содержанием объекта, выбранного для сравнения; 2) опосредованно, когда запрос сопоставляется с образом, производным (вторичным) по отношению к самому объекту. С точки зрения представленного выше алгоритма разница между этими способами состоит в том, объект какой природы будет выбираться в цикле для сравнения – непосредственное содержание или некоторый идентификатор, отражающий содержание отчасти или в целом. Неявным, но, с точки зрения реализации алгоритма поиска – основным фактором здесь является форма (способ), определяющая порядок выборки: от порядка расположения объектов в массиве (например, в том «естественном» порядке, в каком они поступали для хранения), или в «искусственном» порядке, соответствующем, например, классификации предметной области. Но, поскольку и в том, и в другом случае мы имеем дело с перебором объектов, выбираемых из хранилища для сравнения, рациональность построения процедуры поиска будет определяться длиной перебора, что в свою очередь определяется как характеристиками хранимых объектов (в нашем примере – размерами документов), так характером запросов (в нашем примере – поиском по предмету или по шифру хранения документов). Соответственно, оптимизация процесса в первую очередь связывается с возможностью сокращения времени перебора, то есть — длины выбираемой последовательности.
В общем случае можно сказать, что технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной. Для рассмотрения взаимосвязи алгоритма поиска и организации массива здесь и далее используем знакомый всем пример организации и поиска информации в традиционных библиотеках [12] .
В случае прямой организации массива документы размещаются в последовательности, не связываемой с порядком какой-либо классификации или алфавита, например, в порядке их поступления в хранилище. Но здесь надо отметить, что определяющим в понятии «прямая организация» является не характер размещения документов – единиц хранения, а размещение содержания документов, которое представлено изначальной «естественной» последовательностью слов, образующих, в том числе, и контекст их употребления. Поиск по предмету при такой организации для больших массивов будет требовать достаточно много времени, так как для этого надо последовательно выбирать для сравнения с запросом все документы из хранилища, поскольку, не обратившись к документу, мы не можем судить о его содержании.
В инвертированном массиве документы могут быть, например, разбиты на подмножества, которые упорядочены в соответствии с некоторой классификацией и, что особенно важно, обозначены идентификаторами, отражающими предметное содержание соответствующего класса. Более того, такое упорядочение документов в хранилище сопровождается построением вспомогательной структуры – инвертированного справочника, в котором с каждым индексом (идентификатором класса) связан список ссылок на документы, отнесенные к этому классу.
Целесообразность использования терминов «прямая» и «инвертированная» форма представления информации становится очевидной при рассмотрении «предельного» варианта организации инвертированного справочника, в котором в качестве индексов используются все без исключения слова документов, а в ссылку на документ, содержащий данное слово, включены данные о позиции этого слова в документе (например, номер главы, параграфа, предложения, позиции в предложении).
В этом случае избыточность данных может быть уменьшена за счет отказа от прямого массива документов. Но это приведет к дополнительным затратам пространства для хранения позиционных параметров и дополнительным действиям по сборке текста документов, которые необходимо выдавать пользователю, что, соответственно потребует больше времени.
При инвертированной организации на первом шаге проводится поиск в инвертированном справочнике и, если предмет запроса отождествлен с соответствующим классом, то на втором шаге для детального соотнесения содержания документа и запроса обращение будет производиться только к сравнительно небольшому числу документов – только тем, которые отнесены к этому классу. Таким образом, за счет введения информационно избыточной структуры и дополнительного шага поиска достигается существенный выигрыш во времени: суммарное время на поиск в инвертированном справочнике существенно меньше поиска в целом массиве документов, поскольку длина индекса обычно на несколько порядков меньше длины документа, и, кроме того, индексы строго упорядочены, например, по лексико-графическому признаку.
Идентификация содержания с помощью индексов строится по принципам языковых систем (каждый индекс представляет то или иное множество характеристических признаков), что позволяет еще сократить число просматриваемых документов: в соответствии с формулой композиции признаков (что хорошо реализуется выражением алгебры логики) производится слияние относящихся к разным индексам списков ссылок на документы, то есть выбираются только те документы, которые описываются именно этим сочетанием. Кроме того, для индексирования содержания отдельного документа могут быть использованы разные лингвистические системы, то есть один документ может иметь несколько поисковых образов, отражающих его содержание в различных аспектах и с разной степенью детализации.
Использование технологии индексирования (и, соответственно, инвертированных форм представления информации) тем не менее, имеет ряд следующих принципиальных недостатков:
1) индексационная информация, относящаяся к документу, статична: индексы, приписанные к документу, будут всегда иметь смысл, определенный при создании языка индексирования (например, классификации);
2) нельзя без дополнительных затрат реализовать управление глубиной поиска, а также поиск с использованием критерия «частичного» соответствия.
Тем не менее, автоматизация поиска информации основывается именно на технологии индексирования (как способа идентификации содержания) документов, поскольку документальные ИПС имеют следующие принципиально важные особенности [Солтон1979] построения и использования.
Во-первых, нужно помнить, что задачи в области документального поиска не сравнимы с другими задачами обработки текстов, такими, как автоматический перевод или поисковые процедуры типа вопрос-ответ (при которых даются прямые ответы на самые разные вопросы). Документальные ИПС создаются только для того, чтобы указать потребителю те документы, которые, скорее всего, имеют отношение к данному интересующему его вопросу. Поэтому здесь можно ограничиваться довольно грубым раскрытием содержания документа, указывающим лишь основные моменты, вместо фразеологического анализа, необходимого, например, при переводе.
Во-вторых, поисковые системы создаются для обслуживания больших и часто разнородных групп потребителей. Поскольку последние могут иметь различные потребности и цели, поисковые запросы варьируются от вопросов обзорного или познавательного характера до очень подробных аналитических запросов. При таких условиях слишком подробный анализ может оказаться излишне (или даже — неприемлемо) специализированным для большинства пользователей.
В-третьих, в основе процесса оценки лежит некоторый критерий эффективности, обычно усредняемый по многим поисковым запросам. Это означает, что более предпочтительными оказываются такие методы анализа, которые дают умеренно высокую общую эффективность, чем, может быть, более тонкие алгоритмы, которые могут превосходно обрабатывать одни запросы, но значительно хуже другие. Практически может оказаться, что для каждого вида запроса оптимальным будет некоторый специфический метод анализа, но для среднего запроса наилучшими являются более простые методы индексирования.
Вопросы для самопроверки
1. Приведите примеры абстрактных систем.
2. Приведите примеры материальных систем.
3. Дайте определение понятия «информационная система»
4. Охарактеризуйте и классифицируйте информацию, как основной объект обработки в ИС.
5. Приведите классификацию ИС.
6. Охарактеризуйте основные компоненты ИС.
7. Перечислите и охарактеризуйте основные обеспечивающие подсистемы ИС.
8. Охарактеризуйте движение информации в системах управления и в системах воспроизводства знаний.
9. Определите понятие «информационная деятельность».
10. Дайте определение информационной технологии.
11. Перечислите основные операции процесса поиска информации.
[1] Существенным фактором с точки зрения абстрактности (идеальности природы) определения понятия «система» является то, что отдельный элемент какой-либо системы (как и сама система) может также быть элементом другой системы.
[2] Лингвистическими переменными называют величины, которые могут иметь несколько значений. Впервые это понятие было введено в лингвистике для обозначения свойств слов иметь несколько смыслов в зависимости от контекста, например, ключ для дверного замка и ключ – водный источник.
[3] В последнем случае правильнее говорить об интегрированных информационных системах, объединяющих в общей среде разнородные данные, хранимые возможно в разнотипных базах, но используемые для решения одной прикладной задачи.
[4] Практически все современные ИС включают в свой состав вычислительные машины и поэтому являются информационно-вычислительными системами (ИВС). Обычно функциями ИВС, управляющей крупным предприятием, являются следующие: вычислительная, коммуникационная, запоминающая, следящая, регулирующая, оптимизационная, прогнозирующая, анализирующая, контролирующая, документирующая.
[5] Здесь информация — это отраженное (системой) разнообразие (среды), влияющее на поведение или изменение состояния системы.
[6] В случае систем обработки однородных объектов большой размерности аналогичные рассуждения применимы скорее не к самой системе, а к процессу ее создания через приведение операционных объектов строительства к размерности, соответствующей операционным возможностям субъекта.
[7] Эффективность имеет двоякую природу: 1) такое использование информации чтобы были минимизированы затраты на основную деятельность или максимизирован результат; 2) такая организация самой информационной среды, чтобы была обеспечена сохранность и доступность любого объекта.
[8] Информация является необходимым компонентом любого целевого преобразования, поскольку только в этом виде может быть обеспечено сохранение системообразующего основания преобразования (цели воздействия на среду), замещая собой уже не существующую в прежнем виде после выполнения преобразования среду.
[9] Аналогичная дихотомия типов информации вводится в [Криницкий1982], где информация подразделяется на осведомляющую и управляющую; [Абдеев1994] – оперативная и структурная; [Урсул1073] – кибернетическая (управляющая) и некибернетическая (структурная); [Бриллюэн1966] — свободная и связанная.
[10] Естественно, что процесс поиска может быть завершен и раньше, например, если какой-либо очередной выбранный из массива объект будет полностью удовлетворять потребности, инициировавшей необходимость проведения самого поиска.
[11] Указанным двум видам поиска иногда ставят в соответствие способы поиска — адресный и ассоциативный поиск.
[12] Отметим, что выбор этого примера основывается не только на его «привычности» для человека, но и на том, что с методологической и системной точек зрения применяемые в библиотеках подходы, методы и технологии являются по существу универсальными и не зависящими от уровня автоматизации.
Источник