- Лекция 3. Организация данных в информационных системах
- Способы организации данных
- Основные структуры данных. Матчасть. Азы
- Что такое структура данных?
- Какие бывают?
- Основные структуры данных.
- Массивы
- Бывают
- Основные операции
- Вопросы
- Стеки
- Основные операции
- Вопросы
- Очереди
- Основные операции
- Вопросы
- Связанный список
- Бывают
- Основные операции
- Вопросы
- Графы
- Бывают
- Встречаются в таких формах как
- Общие алгоритмы обхода графа
- Вопросы
- Деревья
- Три способа обхода дерева
- Вопросы
- Trie ( префиксное деревое )
- Вопросы
- Хэш таблицы
- Вопросы
- Список ресурсов
- Вместо заключения
- Глава 1. Информационные системы (ИС)
- §1. Понятие информационной системы
- §2. Структура информационной системы
- §2.1. Типы обеспечивающих подсистем
- §2.2. Информационное обеспечение
- §2.3. Техническое обеспечение
- §2.4. Математическое и программное обеспечение
- §2.5. Организационное обеспечение
- §2.6. Правовое обеспечение
- §3. Классификации информационных систем
- §3. 1. Классификация ИС по признаку структурированности задач
- §3. 2. Классификация ИС по степени автоматизации
- §3. 3. Классификация ИС по характеру использования информации
- §3. 4. Классификация ИС по сфере применения
- Глава 2. Базы данных (БД)
- §1. Введение
- §2. Классификации баз данных
- §3. Модели данных
Лекция 3. Организация данных в информационных системах
Организация данных в информационных системах
Под организацией данных понимается совокупность методов и средств, позволяющая эффективно использовать данные при решении информационных задач.
В любых автоматизированных системах данные организованы с помощью двух основных типов данных:
Под базой данных понимается упорядоченное или структурированное, определенным образом, информация, необходимая для решения информационных задач в АС.
БД выполняет сложные основные функции:
· преобразование к виду, удобному для обработки.
Внутримашинные базы данных представляют собой совокупность структурированных данных и управляющих программ, обеспечивающих работу с данными.
Внутримашинняя база данных состоит из двух основных частей:
· совокупности данных, представленных связанными файлами
· системы управления базой данных (СУБД), представляющие программное обеспечение обработки данных.
Данные в компьютере могут храниться с помощью двух основных способов:
1. файловая система
Данные, организованные в файловой системе (Windows) – это совокупность файлов и папок, упорядоченных в иерархическую структуру.
Основное отличие файловой системы от базы данных – файлы между собой не связаны, независимы. Преимущество файловой структуры заключается в простоте работы с данными. Недостатки заключаются в малой эффективности решения задач поиска и извлечения нужной информации.
В базе данных данные также хранятся в файле, но эти файлы связанны между собой в определенную структуру, основное значение которой – исключить дублирование данных, обеспечить их эффективный поиск, поддержку целостности данных так, чтобы при удалении (добавлении) данных структура не нарушалась.
В настоящее время, используют реляционные типы(relation — отношение) данных. В таких базах данных, данные связаны между собой специальными типами отношений, которые позволяют эффективно хранить и обрабатывать базу данных.
1. это быстрый поиск нужной информации
2. сохранение целостности данных
3. исключение дублирующего ввода данных.
1. сложность создания и поддержки баз данных
2. специальные алгоритмические языки для описания структуры данных
3. сложность поддержания целостности данных
4. для работы с базой данных требуются специалисты высокой квалификации (администраторы базы данных).
Наиболее известные СУБД:
Задачи эффективного представления и хранения данных, в настоящее время, не решена до конца, поэтому пользователь всегда стоит перед проблемой выбора: «Какую СУБД использовать в своей информационной системе?»
СУБД Access предназначена для решения задач в информационной системе малых предприятий.
Под немашинной информацией БД понимается совокупность методов и средств кодирования, идентификации, хранения, поиска и извлечения данных, хранящихся в немашинной форме представления:
· Нормативно – справочный материал
· Подлинники документов (фото/киноматериал, накладные, видео/аудио материал, на кассетах с магнитной лентой).
Для немашинной информации центральную роль играют методы и технологии классификаций и кодирования информации. Существуют стандарты на методы классификации и кодирование информации, а также общероссийские классификаторы документов в различных прикладных областях.
Источник
Способы организации данных
Существует два способа организации данных на листе: таблица и список.
При организации данных в виде таблицы формируются строки и столбцы с записями, для которых в ячейку на пересечении строки и столбца помещаются данные. Например, на рис. 5.1 показана таблица уровня образования студентов Интернет-Университета по годам: года размещены в строках, а количество студентов соответствующего уровня образования – в столбцах.
Рис. 5.1. Табличный способ организации данных
Таблицы могут иметь весьма сложную структуру с несколькими уровнями записей в строках и столбцах.
Табличный способ обеспечивает, как правило, более компактное размещение данных на листе. Для данных, организованных табличным способом, удобнее создавать диаграммы; в отдельных случаях удобнее производить вычисления. С другой стороны, данные, организованные в виде таблицы, сложнее обрабатывать: производить выборки, сортировки и т. п.
Другой способ организации данных – список. Список – набор строк листа, содержащий однородные данные; первая строка содержит заголовки столбцов, остальные строки содержат однотипные данные в каждом столбце.
В виде списка можно представлять как данные информационного характера (номера телефонов, адреса и т. п.), так и данные, подлежащие вычислениям.
Представление данных в виде списка обеспечивает большее удобство при сортировках, выборках, подведении итогов и т. п. С другой стороны, в этом случае затруднено построение диаграмм, снижается наглядность представления данных на листе.
Одни и те же данные можно представить как в виде таблицы, так и в виде списка. Например, в списке на рис. 5.2 представлены данные, организованные как таблица на рис. 5.1.
Рис. 5.2. Организация данных в виде списка
Нет каких-либо конкретных рекомендаций по использованию того или иного способа организации данных на листе. В каждом случае оптимальный способ выбирают исходя из решаемых задач.
Поскольку термин «таблица» является более традиционным, здесь и далее массив данных будет называться таблицей, кроме тех случаев, когда способ организации имеет принципиальное значение.
Источник
Основные структуры данных. Матчасть. Азы
Все чаще замечаю, что современным самоучкам очень не хватает матчасти. Все знают языки, но мало основы, такие как типы данных или алгоритмы. Немного про типы данных.
Еще в далеком 1976 швейцарский ученый Никлаус Вирт написал книгу Алгоритмы + структуры данных = программы.
40+ лет спустя это уравнение все еще верно. И если вы самоучка и надолго в программировании пробегитесь по статье, можно по диагонали. Можно код кофе.
В статье так же будут вопросы, которое вы можете услышать на интервью.
Что такое структура данных?
Структура данных — это контейнер, который хранит данные в определенном макете. Этот «макет» позволяет структуре данных быть эффективной в некоторых операциях и неэффективной в других.
Какие бывают?
Линейные, элементы образуют последовательность или линейный список, обход узлов линеен. Примеры: Массивы. Связанный список, стеки и очереди.
Нелинейные, если обход узлов нелинейный, а данные не последовательны. Пример: граф и деревья.
Основные структуры данных.
Массивы
Массив — это самая простая и широко используемая структура данных. Другие структуры данных, такие как стеки и очереди, являются производными от массивов.
Изображение простого массива размера 4, содержащего элементы (1, 2, 3 и 4).
Каждому элементу данных присваивается положительное числовое значение (индекс), который соответствует позиции элемента в массиве. Большинство языков определяют начальный индекс массива как 0.
Бывают
Одномерные, как показано выше.
Многомерные, массивы внутри массивов.
Основные операции
Вопросы
Стеки
Стек — абстрактный тип данных, представляющий собой список элементов, организованных по принципу LIFO (англ. last in — first out, «последним пришёл — первым вышел»).
Это не массивы. Это очередь. Придумал Алан Тюринг.
Примером стека может быть куча книг, расположенных в вертикальном порядке. Для того, чтобы получить книгу, которая где-то посередине, вам нужно будет удалить все книги, размещенные на ней. Так работает метод LIFO (Last In First Out). Функция «Отменить» в приложениях работает по LIFO.
Изображение стека, в три элемента (1, 2 и 3), где 3 находится наверху и будет удален первым.
Основные операции
Вопросы
Очереди
Подобно стекам, очередь — хранит элемент последовательным образом. Существенное отличие от стека – использование FIFO (First in First Out) вместо LIFO.
Пример очереди – очередь людей. Последний занял последним и будешь, а первый первым ее и покинет.
Изображение очереди, в четыре элемента (1, 2, 3 и 4), где 1 находится наверху и будет удален первым
Основные операции
Вопросы
Связанный список
Связанный список – массив где каждый элемент является отдельным объектом и состоит из двух элементов – данных и ссылки на следующий узел.
Принципиальным преимуществом перед массивом является структурная гибкость: порядок элементов связного списка может не совпадать с порядком расположения элементов данных в памяти компьютера, а порядок обхода списка всегда явно задаётся его внутренними связями.
Бывают
Однонаправленный, каждый узел хранит адрес или ссылку на следующий узел в списке и последний узел имеет следующий адрес или ссылку как NULL.
Двунаправленный, две ссылки, связанные с каждым узлом, одним из опорных пунктов на следующий узел и один к предыдущему узлу.
Круговой, все узлы соединяются, образуя круг. В конце нет NULL. Циклический связанный список может быть одно-или двукратным циклическим связанным списком.
Самое частое, линейный однонаправленный список. Пример – файловая система.
Основные операции
Вопросы
Графы
Граф-это набор узлов (вершин), которые соединены друг с другом в виде сети ребрами (дугами).
Бывают
Ориентированный, ребра являются направленными, т.е. существует только одно доступное направление между двумя связными вершинами.
Неориентированные, к каждому из ребер можно осуществлять переход в обоих направлениях.
Смешанные
Встречаются в таких формах как
Общие алгоритмы обхода графа
Вопросы
Деревья
Дерево-это иерархическая структура данных, состоящая из узлов (вершин) и ребер (дуг). Деревья по сути связанные графы без циклов.
Древовидные структуры везде и всюду. Дерево скилов в играх знают все.
Типы деревьев
- N дерево
- Сбалансированное дерево
- Бинарное дерево
- Дерево Бинарного Поиска
- AVL дерево
- 2-3-4 деревья
Бинарное дерево самое распространенное.
«Бинарное дерево — это иерархическая структура данных, в которой каждый узел имеет значение (оно же является в данном случае и ключом) и ссылки на левого и правого потомка. » — Procs
Три способа обхода дерева
Вопросы
Trie ( префиксное деревое )
Разновидность дерева для строк, быстрый поиск. Словари. Т9.
Вот как такое дерево хранит слова «top», «thus» и «their».
Слова хранятся сверху вниз, зеленые цветные узлы «p», «s» и «r» указывают на конец «top», «thus « и «their» соответственно.
Вопросы
Хэш таблицы
Хэширование — это процесс, используемый для уникальной идентификации объектов и хранения каждого объекта в заранее рассчитанном уникальном индексе (ключе).
Объект хранится в виде пары «ключ-значение», а коллекция таких элементов называется «словарем». Каждый объект можно найти с помощью этого ключа.
По сути это массив, в котором ключ представлен в виде хеш-функции.
Эффективность хеширования зависит от
- Функции хеширования
- Размера хэш-таблицы
- Метода борьбы с коллизиями
Пример сопоставления хеша в массиве. Индекс этого массива вычисляется через хэш-функцию.
Вопросы
Список ресурсов
Вместо заключения
Матчасть так же интересна, как и сами языки. Возможно, кто-то увидит знакомые ему базовые структуры и заинтересуется.
Спасибо, что прочли. Надеюсь не зря потратили время =)
PS: Прошу извинить, как оказалось, перевод статьи уже был тут и очень недавно, я проглядел.
Если интересно, вот она, спасибо Hokum, буду внимательнее.
Источник
Глава 1. Информационные системы (ИС)
2. Архипова З.В., Пархомов В.А. Информационные технологии в экономике. Учебное пособие. – Иркутск, Издательство БГУЭП, 2003.
§1. Понятие информационной системы
Под системой понимают любой объект, который одновременно рассматривается и как единое целое, и как объединенная в интересах достижения поставленных целей совокупность разнородных элементов. Системы значительно отличаются между собой как по составу, так и по главным целям.
Система – это сложный объект, состоящий из взаимосвязанных частей (элементов) и существующий как единое целое.
Подсистема – это часть системы, выделенная по какому-либо признаку.
Пример. Приведем в качестве примера несколько систем, состоящих из разных элементов и направленных на реализацию разных целей.
Главная цель системы
Люди, оборудование, материалы, здания и др.
Электронные и электромеханические элементы, линии связи и др.
Компьютеры, модемы, кабели, сетевое программное обеспечение и др.
Компьютеры, компьютерные сети, люди, информационное и программное обеспечение
Производство профессиональной информации
Добавление к понятию «система» слова «информационная» отражает цель ее создания и функционирования. Информационные системы обеспечивают сбор, хранение, обработку, поиск, выдачу информации, необходимой в процессе принятия решений задач из любой области. Они помогают анализировать проблемы и создавать новые продукты.
Информационная система – взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели.
Современное понимание информационной системы предполагает использование в качестве основного технического средства переработки информации персонального компьютера (сервера, периферийного оборудования и т.д.).
Необходимо понимать разницу между компьютерами и информационными системами. Компьютеры, оснащенные специализированными программными средствами, являются технической базой и инструментом для информационных систем. Информационная система немыслима без персонала, взаимодействующего с компьютерами и телекоммуникациями.
Говоря об информационной системе, следует рассмотреть следующие вопросы: структура ИС, классификации ИС.
Структура ИС обычно рассматривается как совокупность различных подсистем. Все подсистемы можно рассматривать как по отдельности, так и во взаимосвязи друг с другом.
Классифицировать информационные системы можно по различным признакам. В отечественной литературе по информационным системам управления ИС классифицируют обычно по следующим признакам:
— по типу объекта управления (ИС управления технологическим процессом, ИС организационного управления);
— по степени интеграции (локальные, интегрированные);
— по уровню автоматизации управления (информационно-справочные системы, системы обработки данных, информационно-советующие системы, системы принятия решений, экспертные системы);
— по уровню управления (информационные системы управления предприятием, корпорацией, отраслью);
— по характеру протекания технологических процессов на объекте управления (автоматизированная система управления дискретным производством, автоматизированная система управления непрерывным производством)
— по признаку структурированности задачи
§2. Структура информационной системы
§2.1. Типы обеспечивающих подсистем
Структуру информационной системы составляет совокупность отдельных ее частей, называемых подсистемами.
Итак, подсистема – это часть системы, выделенная по какому-либо признаку.
Общую структуру информационной системы можно рассматривать как совокупность подсистем независимо от сферы применения. В этом случае говорят о структурном признаке классификации, а подсистемы называют обеспечивающими. Таким образом, структура любой информационной системы может быть представлена совокупностью обеспечивающих подсистем (смотри рисунок).
Рис 1. Структура информационной системы как совокупность обеспечивающих подсистем
Среди обеспечивающих подсистем обычно выделяют информационное, техническое, математическое, программное, организационное и правовое обеспечение.
§2.2. Информационное обеспечение
Назначение подсистемы информационного обеспечения состоит в современном формировании и выдаче достоверной информации для принятия управленческих решений.
Информационное обеспечение – совокупность единой системы классификации и кодирования информации, унифицированных систем документации, схем информационных потоков, циркулирующих в организации, а также методология построения баз данных.
Унифицированные системы документации создаются на государственном, республиканском, отраслевом и региональном уровнях. Главная цель – это обеспечение сопоставимости показателей различных сфер общественного производства. Разработаны стандарты, где устанавливаются требования:
· к унифицированным системам документации;
· к унифицированным формам документов различных уровней управления;
· к составу и структуре реквизитов и показателей;
· к порядку внедрения, ведения и регистрации унифицированных форм документов.
Например, для учителей тоже есть требования к оформлению документов. Например, план урока оформляется с указанием темы урока, цели и задач урока, плана урока и так далее.
Однако, несмотря на существование унифицированной системы документации, при обследовании большинства организаций постоянно выявляется целый комплекс типичных недостатков:
· чрезвычайно большой объем документов для ручной обработки;
· одни и те же показатели часто дублируются в разных документах;
· работа с большим количеством документов отвлекает специалистов от решения непосредственных задач;
· имеются показатели, которые создаются, но не используются, и др.
Поэтому устранение указанных недостатков является одной из задач, стоящих при создании информационного обеспечения.
Схемы информационных потоков отражают маршруты движения информации и ее объемы, места возникновения первичной информации и использования результатной информации. За счет анализа структуры подобных схем можно выработать меры по совершенствованию всей системы управления.
Например. В качестве примера простейшей схемы потоков данных можно привести схему, где отражены все этапы прохождения служебной записки или записи в базе данных о приеме на работу сотрудника – от момента ее создания до выхода приказа о его зачислении на работу.
Построение схем информационных потоков, позволяющих выявить объемы информации и провести ее детальный анализ, обеспечивает:
· исключение дублирующей и неиспользуемой информации;
· классификацию и рациональное представление информации.
Методология построения баз данных базируется на теоретических основах их проектирования.
Для создания информационного обеспечения необходимо:
· понимание целей, задач, функций всей системы;
· выявление движения информации от момента возникновения и до ее использования, представленной для анализа в виде схем информационных потоков,
· наличие и использование системы классификации и кодирования;
· владение методологией создания концептуальных информационно-логических моделей, отражающих взаимосвязь информации;
· создание массивов информации на машинных носителях, что требует наличия современного технического обеспечения.
§2.3. Техническое обеспечение
Техническое обеспечение – комплекс технических средств, предназначенных для работы информационной системы, а также соответствующая документация на эти средства и технологические процессы.
Комплекс технических средств составляют:
· компьютеры любых моделей;
· устройства сбора, накопления, обработки, передачи и вывода информации;
· устройства передачи данных и линии связи;
· оргтехника и устройства автоматического съема информации;
· эксплуатационные материалы и др.
Документацией оформляются предварительный выбор технических средств, организация их эксплуатации, технологический процесс обработки данных, технологическое оснащение. Документацию можно условно разделить на три группы:
1. общесистемную, включающую государственные и отраслевые стандарты по техническому обеспечению;
2. специализированную, содержащую комплекс методик по всем этапам разработки технического обеспечения;
3. нормативно-справочную, используемую при выполнении расчетов по техническому обеспечению.
К настоящему времени сложились две основные формы организации технического обеспечения (формы использования технических средств): централизованная и частично или полностью децентрализованная.
· Централизованное техническое обеспечение базируется на использовании в информационной системе больших ЭВМ и вычислительных центров.
· Децентрализация технических средств предполагает реализацию функциональных подсистем на персональных компьютерах непосредственно на рабочих местах.
Перспективным подходом следует считать, по-видимому, частично децентрализованный подход – организацию технического обеспечения на базе распределенных сетей, состоящих из персональных компьютеров и большой ЭВМ для хранения баз данных, общих для любых функциональных подсистем.
§2.4. Математическое и программное обеспечение
Математическое и программное обеспечение – совокупность математических методов, моделей, алгоритмов и программ для реализации целей и задач информационной системы, а также нормального функционирования комплекса технических средств.
К средствам математического обеспечения относятся:
· средства моделирования процессов;
· методы математического программирования, математической статистики, теории массового обслуживания и др.
В состав программного обеспечения входят общесистемные и специальные программные продукты, а также техническая документация.
· К общесистемному программному обеспечению относятся комплексы программ, ориентированных на пользователей и предназначенных для решения типовых задач обработки информации. Они служат для расширения функциональных возможностей компьютеров, контроля и управления процессом обработки данных.
· Специальное программное обеспечение представляет собой совокупность программ, разработанных при создании конкретной информационной системы. В его состав входят пакеты прикладных программ (ППП), реализующие разработанные модели разной степени адекватности, отражающие функционирование реального объекта.
· Техническая документация на разработку программных средств должна содержать описание задач, задание на алгоритмизацию, экономико-математическую модель задачи, контрольные примеры.
§2.5. Организационное обеспечение
Организационное обеспечение – совокупность методов и средств, регламентирующих взаимодействие работников с техническими средствами и между собой в процессе разработки и эксплуатации информационной системы.
Организационное обеспечение реализует следующие функции:
· анализ существующей системы управления организацией, где будет использоваться ИС, и выявление задач, подлежащих автоматизации;
· подготовка задач к решению на компьютере, включая техническое задание на проектирование ИС и технико-экономическое обоснование ее эффективности;
· разработка управленческих решений по составу и структуре организации, методологии решения задач, направленных на повышение эффективности системы управления.
Организационное обеспечение создается по результатам предпроектного обследования на 1-м этапе построения баз данных.
§2.6. Правовое обеспечение
Правовое обеспечение – совокупность правовых норм, определяющих создание, юридический статус и функционирование информационных систем, регламентирующих порядок получения, преобразования и использования информации.
Главной целью правового обеспечения является укрепление законности.
В состав правового обеспечения входят законы, указы, постановления государственных органов власти, приказы, инструкции и другие нормативные документы министерств, ведомств, организаций, местных органов власти.
В правовом обеспечении можно выделить:
· общую часть, регулирующую функционирование любой информационной системы,
· локальную часть, регулирующую функционирование конкретной системы.
Правовое обеспечение этапов разработки информационной системы включает нормативные акты, связанные с договорными отношениями разработчика и заказчика и правовым регулированием отклонений от договора.
Правовое обеспечение этапов функционирования информационной системы включает:
· статус информационной системы;
· права, обязанности и ответственность персонала;
· правовые положения отдельных видов процесса управления;
· порядок создания и использования информации и др.
§3. Классификации информационных систем
§3. 1. Классификация ИС по признаку структурированности задач
Понятие структурированности задач
При создании или при классификации информационных систем неизбежно возникают проблемы, связанные с формальным — математическим и алгоритмическим описанием решаемых задач. От степени формализации во многом зависят эффективность работы всей системы, а также уровень автоматизации, определяемый степенью участия человека при принятии решения на основе получаемой информации.
Чем точнее математическое описание задачи, тем выше возможности компьютерной обработки данных и тем меньше степень участия человека в процессе ее решения. Это и определяет степень автоматизации задачи.
Различают три типа задач , для которых создаются информационные системы: структурированные (формализуемые), неструктурированные (неформализуемые) и частично структурированные.
1. Структурированная (формализуемая) задача – задача, где известны все ее элементы и взаимосвязи между ними.
В структурированной задаче удается выразить ее содержание в форме математической модели, имеющей точный алгоритм решения. Подобные задачи обычно приходится решать многократно, и они носят рутинный характер. Целью использования информационной системы для решения структурированных задач является полная автоматизация их решения, т.е. сведение роли человека к нулю.
Например: В информационной системе необходимо реализовать задачу расчета заработной платы. Это структурированная задача, где полностью известен алгоритм решения. Рутинный характер этой задачи определяется тем, что расчеты всех начислений и отчислений весьма просты, но объем их очень велик, так как они должны многократно повторяться ежемесячно для всех категорий работающих.
2. Неструктурированная (неформализуемая) задача – задача, в которой невозможно выделить элементы и установить между ними связи.
Решение неструктурированных задач из-за невозможности создания математического описания и разработки алгоритма связано с большими трудностями. Возможности использования здесь информационной системы невелики. Решение в таких случаях принимается человеком из эвристических соображений на основе своего опыта и, возможно, косвенной информации из разных источников.
Например: Формализовать взаимоотношения в студенческой группе. Данную задачу сложно решить при помощи информационной системы. Это связано с тем, что для данной задачи существен психологический и социальный факторы, которые очень сложно описать алгоритмически.
3. Частично структурированная задача.
Заметим, что существует сравнительно немного полностью структурированных или совершенно неструктурированных задач. О большинстве задач можно сказать, что известна лишь часть их элементов и связей между ними . Такие задачи называются частично структурированными. В этих условиях можно создать информационную систему. Получаемая в ней информация анализируется человеком, который будет играть определяющую роль. Такие информационные системы являются автоматизированными, так как в их функционировании принимает участие человек.
Типы информационных систем, используемые для решения частично структурированных задач
Информационные системы , используемые для решения частично структурированных задач, подразделяются на два вида :
- создающие отчеты и ориентированные главным образом на обработку данных (поиск, сортировку, агрегирование, фильтрацию). Используя сведения, содержащиеся в этих отчетах, человек принимает решение ;
- разрабатывающие возможные альтернативы решения. Принятие решения при этом сводится к выбору одной из предложенных альтернатив .
Информационные системы, создающие отчеты, обеспечивают информационную поддержку пользователя, т.е. предоставляют доступ к информации в базе данных и ее частичную обработку. Процедуры манипулирования данными в информационной системе должны обеспечивать следующие возможности:
- составление комбинаций данных, получаемых из различных источников;
- быстрое добавление или исключение того или иного источника данных и автоматическое переключение источников при поиске данных;
- управление данными с использованием возможностей систем управления базами данных;
- логическую независимость данных этого типа от других баз данных, входящих в подсистему информационного обеспечения;
- автоматическое отслеживание потока информации для наполнения баз данных.
Информационные системы, разрабатывающие альтернативы решений, могут быть модельными и экспертными.
1) Модельные информационные системы предоставляют пользователю математические, статистические, финансовые и другие модели, использование которых облегчает выработку и оценку альтернатив решения. Пользователь может получить недостающую ему для принятия решения информацию путем установления диалога с моделью в процессе ее исследования.
Основными функциями модельной информационной системы являются:
· возможность работы в среде типовых математических моделей, включая решение основных задач моделирования типа «как сделать, чтобы?», «что будет, если?», анализ чувствительности и др.;
· достаточно быстрая и адекватная интерпретация результатов моделирования;
· оперативная подготовка и корректировка входных параметров и ограничений модели;
· возможность графического отображения динамики модели;
· возможность объяснения пользователю необходимых шагов формирования и работы модели.
2) Экспертные информационные системы обеспечивают выработку и оценку возможных альтернатив пользователем за счет создания экспертных систем, связанных с обработкой знаний .
§3. 2. Классификация ИС по степени автоматизации
В зависимости от степени автоматизации информационных процессов ИС определяются как: ручные, автоматические, автоматизированные.
Ручные ИС характеризуются отсутствием современных технических средств переработки информации и выполнением всех операций человеком.
Автоматические ИС выполняют все операции по переработке информации без участия человека.
Автоматизированные ИС предполагают участие в процессе обработки информации и человека, и технических средств, причем главная роль отводится компьютеру. В современном толковании в термин «информационная система» вкладывается обязательно понятие автоматизируемой системы.
§3. 3. Классификация ИС по характеру использования информации
Информационно-поисковые системы производят ввод, систематизацию, хранение, выдачу информации по запросу пользователя без сложных преобразований данных. Например, информационно-поисковая система в библиотеке, в железнодорожных и авиакассах продажи билетов.
Информационно-решающие системы осуществляют все операции переработки информации по определенному алгоритму. Среди них можно провести классификацию по степени воздействия выработанной результатной информации на процесс принятия решений и выделить два класс а: управляющие и советующие .
Управляющие ИС вырабатывают информацию, на основании которой человек принимает решение. Для этих систем характерны тип задач расчетного характера и обработка больших объемов данных. Примером может служить система бухгалтерского учета.
Советующие ИС вырабатывают информацию, которая принимается человеком к сведению и не превращается немедленно в серию конкретных действий. Эти системы обладают более высокой степенью интеллекта, так как для них характерна обработка знаний, а не данных.
Например. Существуют медицинские информационные системы для постановки диагноза больного и определения предполагаемой процедуры лечения. Врач при работе с подобной системой может принять к сведению полученную информацию, но предложить иное по сравнению с рекомендуемым решение.
§3. 4. Классификация ИС по сфере применения
ИС управления технологическими процессами (ТП) служат для автоматизации функций производственного персонала.
ИС автоматизированного проектирования (САПР) предназначены для автоматизации функций инженеров-проектировщиков, конструкторов, архитекторов, дизайнеров при создании новой техники или технологии. Основными функциями подобных систем являются: инженерные расчеты, создание графической документации (чертежей, схем, планов), создание проектной документации, моделирование проектируемых объектов.
Интегрированные (корпоративные) ИС используются для автоматизации всех функций организации и охватывают весь цикл работ.
Глава 2. Базы данных (БД)
1. З.В. Архипова, В.А. Пархомов Информационные технологии в экономике. Учебное пособие. Иркутск, Издательство БГУЭП, 2003
§1. Введение
Существует множество различных областей человеческой деятельности, связанных с использованием определенным образом организованных хранилищ информации.
· Книжный фонд и каталог библиотеки.
· Картотека сотрудников учреждения, хранящаяся в отделе кадров.
· Хранилище медицинских карт пациентов в регистратуре поликлиники.
Раньше хранилища были только на бумажных носителях, обработка велась «вручную». Современным средством хранения и обработки подобной информации являются компьютеры, с помощью которых создаются базы данных.
По сути одним из способов структурирования, организации информации является база данных.
Все информационные системы имеют следующие особенности:
- Для обеспечения их работы нужны сравнительно низкие вычислительные мощности.
- Данные, которые они используют, имеют сложную структуру.
- Необходимы средства сохранения данных между последовательными запусками системы.
Другими словами, информационная система требует создания в памяти ЭВМ динамически обновляемой модели внешнего мира с использованием единого хранилища – базы данных .
База данных (БД) – это поименованный набор организованных данных, отражающий состояние объектов и их отношений в рассматриваемой предметной области.
База данных (БД) – определенным образом организованная совокупность данных, относящаяся к определенной предметной области, предназначенная для хранения во внешней памяти компьютера и постоянного применения.
v БД книжного фонда библиотеки,
v БД кадрового состава учреждения,
v БД законодательных актов в области уголовного права.
v БД современной эстрадной музыки и так далее.
Предметная область – часть реального мира, подлежащая изучению с целью организации управления и, в конечном счете, автоматизации.
Предметная область представляется множеством фрагментов, например, предприятие – цехами, дирекцией, бухгалтерией и т.д. Каждый фрагмент предметной области характеризуется множеством объектов и процессов, использующих объекты, а также множеством пользователей, характеризуемых различными взглядами на предметную область.
Словосочетание «динамически обновляемая» означает, что соответствие базы данных текущему состоянию предметной области обеспечивается не периодически, а в режиме реального времени. При этом одни и те же данные могут быть по-разному представлены в соответствии с потребностями различных групп пользователей.
Отличительной чертой баз данных следует считать то, что данные хранятся совместно с их описанием, а в прикладных программах описание данных не содержится. Независимые от программ пользователя данные обычно называются метаданными. В ряде современных систем метаданные, содержащие также информацию о пользователях, форматы отображения, статистику обращения к данным и другие сведения, хранятся в словаре базы данных.
Система управления базой данных (СУБД) – важнейший компонент информационной системы. Для создания и управления информационной системой СУБД необходима в той же степени, как для разработки программы на алгоритмическом языке необходим транслятор.
Программное обеспечение, предназначенное для работы с базами данных, называется системой управления базами данных (СУБД) .
Система управления базами данных (СУБД) – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.
Основные функции СУБД:
- управление данными во внешней памяти (на дисках);
- управление данными в оперативной памяти;
- журнализация изменений и восстановление базы данных после сбоев;
- поддержание языков БД (язык определения данных, язык манипулирования данными).
Модель данных – это совокупность взаимосвязанных структур данных и операций над этими структурами. Вид модели и используемые в ней типы структур данных отражают концепцию организации и обработки данных, используемую в СУБД, поддерживающей модель, или в языке системы программирования, на котором создается прикладная программа обработки данных.
§2. Классификации баз данных
Классификация по размещению базы данных
Для хранения БД может использоваться как один компьютер, так и множество взаимосвязанных компьютеров.
- Если используется один компьютер , то база данных называется централизованной .
- Если различные части одной БД хранятся на множестве компьютеров, объединенных между собой сетью , то такая БД называется распределенной базой данных .
Классификация по способу организации базы данных
По способу организации БД разделяют на:
- Базы с плоскими файлами,
- Иерархические,
- Сетевые,
- Реляционные,
- Объектно–реляционные
- Объектно–ориентированные.
§3. Модели данных
На ранней стадии использования информационных систем применялась файловая модель данных. В них реализуется модель типа плоский файл.
Плоский файл – это файл, состоящий из записей одного типа и не содержащий указателей на другие записи, двумерный массив элементов данных. Файлы, которые создаются в прикладных программах пользователя, написанных на алгоритмическом языке, также относятся к этому виду организации данных. Описание логической структуры файлов и параметры размещения на машинных носителях содержатся в каждой прикладной программе обработки файлов. В этих же программах предусмотрено их создание и корректировка. При файловой организации массивов трудно обеспечить актуальное состояние данных, их достоверность и непротиворечивость.
Сетевые и иерархические модели.
Более сложными моделями данных по сравнению с файловой являются сетевые и иерархические модели, которые поддерживаются в системе управления базами данных соответствующего типа. Тип модели данных, поддерживаемой СУБД на машинном носителе, является одним из важнейших признаков классификации СУБД.
Сетевая или иерархическая модель данных представляет соответствующий метод логической организации базы данных в СУБД.
Иерархическая модель представляет собой древовидную структуру с корневыми сегментами, имеющими физический указатель на другие сегменты. Одно из неудобств этой модели заключается в том, что реальный мир не может быть представлен в виде древовидной структуры с единственным корневым сегментом. Иерархические БД обеспечивали указатели между различными деревьями баз данных, но обработка данных с использованием таких связей была не всегда удобной.
В иерархических моделях непосредственный доступ, как правило, возможен только к объекту самого высокого уровня, который не подчинен другим объектам. К другим объектам доступ осуществляется по связям от объекта на вершине модели.
В сетевых моделях непосредственный доступ может обеспечиваться к любому объекту независимо от уровня, на котором он находится в модели. Возможен также доступ по связям от любой точки доступа.
В отличие от иерархической БД в сетевой БД нет необходимости в корневой записи. Однако, как и в иерархических БД, связи поддерживаются с помощью физических указателей.
Сетевые модели данных по сравнению с иерархическими являются более универсальным средством отображения структуры информации для разных предметных областей. Взаимосвязи данных большинства предметных областей имеют сетевой характер, что ограничивает использование СУБД с иерархической моделью данных. Сетевые модели позволяют отображать также иерархические взаимосвязи данных. Достоинством сетевых моделей является отсутствие дублирования данных в различных элементах модели. Кроме того, технология работы с сетевыми моделями является удобной для пользователя, так как доступ к данным практически не имеет ограничений и возможен непосредственно к объекту любого уровня. Допустимы всевозможные запросы.
Реляционная модель данных .
Концепция реляционной модели баз данных была предложена Э.Ф. Коддом в 1970 г. Как отмечал доктор Кодд, реляционная модель данных обеспечивает ряд возможностей, которые делают управление и использование базы данных относительно легким, предсказуемым и устойчивым по отношению к ошибкам. Наиболее важные характеристики реляционной модели заключены в следующем:
· Модель описывает данные с их естественной структурой, не добавляя каких–либо дополнительных структур, необходимых для машинного представления или для целей реализации.
· Модель обеспечивает математическую основу для интерпретации выводимости, избыточности и непротиворечивости отношений.
· Модель обеспечивает независимость данных от их физического представления, от связей между данными и от соображений реализации, связанных с эффективностью и подобными проблемами.
Реляционные модели данных отличаются от рассмотренных выше сетевых и иерархических простотой структур данных, удобным для пользователя табличным представлением и доступом к данным. Реляционная модель данных является совокупностью простейших двумерных таблиц – отношений (объектов модели). Связи между двумя логически связанными таблицами в реляционной модели устанавливаются по равенству значений одинаковых атрибутов таблиц–отношений.
Таблица–отношение является универсальным объектом реляционных моделей. Это обеспечивает возможность унификации обработки данных в различных СУБД, поддерживающих реляционную модель. Операции обработки реляционных моделей основаны на использовании универсального аппарата алгебры отношений и реляционного исчисления.
Структуры данных реляционной модели.
Таблица является основным типом структуры данных (объектом) реляционной модели. Структура таблицы определяется совокупностью столбцов. Данные в пределах одного столбца однородны. В таблице не может быть двух одинаковых строк. Общее число строк не ограничено.
Столбец соответствует некоторому элементу данных – атрибуту , который является простейшей структурой данных. В таблице не могут быть определены множественные элементы, группа или повторяющаяся группа, как в рассмотренных выше сетевых и иерархических моделях. Каждый столбец таблицы должен иметь имя соответствующего элемента данных (атрибута). Один или несколько атрибутов, значения которых однозначно идентифицируют строку таблицы, являются ключом таблицы.
В реляционном подходе к построению баз данных используется терминология теории отношений. Простейшая двумерная таблица определяется как отношение. Столбец таблицы со значениями соответствующего атрибута называется доменом, а строки со значениями разных атрибутов – кортежем (записью).
Совокупность нормализованных отношений (реляционных таблиц), логически взаимосвязанных и отражающих некоторую предметную область, образует реляционною базу данных (РБД). В ходе разработки БД должен быть определен состав логически взаимосвязанных реляционных таблиц и определен состав атрибутов каждого отношения. Состав атрибутов должен отвечать требованиям нормализации.
Реляционная модель данных зарекомендовала себя как модель, на основе которой могут разрабатываться реальные жизнеспособные приложения. В настоящее время эта модель данных является наиболее популярной.
Источник