Способы организации данных
Возможны следующие способы организации данных:
1. Последовательный, т.е. доступ к данным в порядке их следования.
Различают последовательные данные со следующей длиной записи:
— фиксированной, т.е. все порции данных, считываемых или записываемых в файл, имеют одинаковую протяженность (поле, содержащее длину записи, может располагаться в управляющих структурах файла.);
— переменной, т.е. данные содержат поле с указанием длины текущей записи непосредственно перед самой записью(это несколько увеличивает протяженность файла: если длина дополнительного поля равна четырем байтам, то накладные расходы есть учетверенное число записей; требуется дополнительное время на считывание или генерацию поля длины записи);
— неопределенной, т.е. длина текущей записи задается в программе, в операторе или группе машинных команд, реализующих доступ к данным (данные не требуют пространственных накладных расходов).
2. Прямой способ обеспечивает произвольную последовательность доступа к записям файла. Это становится возможным в результате нумерации записей. Доступ к некоторой записи осуществляется по номеру.
Прямая организация предполагает одинаковую длину всех записей, поскольку иначе невозможно обеспечить пересчет номера записи в абсолютный адрес на внешнем устройстве. Чтобы поддерживать прямую запись в файл, приходится размечать требуемое пространство на диске при создании файла.
Файл, созданный как последовательный, в дальнейшем может рассматриваться как имеющий прямую организацию.
3. Индексно-последовательный способ пытается совместить достоинства последовательного и прямого доступов к данным:
— гибкость структуры записи, присущая последовательной организации;
— быстрый доступ к произвольной записи, как в прямой организации;
— возможна высокая скорость поиска информации, соответствующей заданному критерию (контекстный поиск);
— с каждой записью, помимо поля длины связывается поле индекса – числа или строки, однозначно идентифицирующего данные в записи.
Индекс может быть встроен в запись, т.е. быть ее частью, или располагаться отдельно от нее. Протяженность индекса есть управляемая величина, которая содержится в структурах описания файла. Индексы всех записей сводятся в отдельную таблицу, где упорядочиваются в соответствии с заданным критерием и связываются с абсолютными адресами хранения на диске. Одновременно хранятся адреса всех записей, связанные с их номерами.
Доступ к записи возможен в последовательном режиме, в индексно-последовательном, в прямом.
Для добавления новых записей требуется резервирование пространства под элементы индексной таблицы.
4. Библиотечный позволяет объединять в пределах одного файла несколько самостоятельных разделов, связанных друг с другом только областью применения.
В файле поддерживается каталог – таблица, в которой именам разделов ставятся в соответствие относительные адреса начала разделов и их протяженности. Для ускорения поиска имена разделов в каталоге упорядочиваются. Переменная длина раздела в библиотеке не позволяет реализовать модификацию непосредственно в файле и обычно требует перезаписи всего файла с внесением изменений в каталог.
Контрольные вопросы
1. Сформулируйте определение системы на основе категории «целостность».
2. Чем принципиально отличаются реляционные модели от сетевых и иерархических?
3. В чем различие процедурных и декларативных языков управления (манипулирования) данными?
4. Сформулируйте основные способы организации данных.
5. В чем суть нормализации отношений?
ТЕМА 5. ИНФОРМАЦИОННЫЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ
Источник
Способы организации без данных
В настоящее время успешное функционирование различных фирм, организаций и предприятий просто не возможно без развитой информационной системы, которая позволяет автоматизировать сбор и обработку данных. Обычно для хранения и доступа к данным, содержащим сведения о некоторой предметной области, создается база данных.
База данных (БД) — именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области. Под предметной областью понимается некоторая область человеческой деятельности или область реального мира, на основе которой создается БД и её структура.
Система управления базами данных (СУБД) — совокупность языковых и программных средств, предназначенных для создания, наполнения, обновления и удаления баз данных.
Принципы построения баз данных
К современным базам данных, а, следовательно, и к СУБД, на которых они строятся, предъявляются следующие основные требования:
· Высокое быстродействие (малое время отклика на запрос). Время отклика — промежуток времени от момента запроса к БД до фактического получения данных.
· Простота обновления данных.
· Независимость данных — возможность изменения логической и физической структуры БД без изменения представлений пользователей.
· Совместное использование данных многими пользователями.
· Безопасность данных — защита данных от преднамеренного или непреднамеренного нарушения секретности, искажения или разрушения.
· Стандартизация построения и эксплуатации БД (фактически СУБД).
· Адекватность отображения данных соответствующей предметной области.
· Простой интерфейс пользователя.
Важнейшими являются первые два противоречивых требования: повышение быстродействия требует упрощения структуры БД, что, в свою очередь, затрудняет процедуру обновления данных, увеличивает их избыточность.
Безопасность данных включает их целостность и защиту. Целостность данных — устойчивость хранимых данных к разрушению и уничтожению, связанных с неисправностями технических средств, системными ошибками и ошибочными действиями пользователей. Она предполагает:
· отсутствие неточно введенных данных или двух одинаковых записей об одном и том же факте;
· защиту от ошибок при обновлении БД;
· невозможность удаления (или каскадное удаление) связанных данных разных таблиц;
· неискажение данных при работе в многопользовательском режиме и в распределенных базах данных;
· сохранность данных при сбоях техники (восстановление данных).
Целостность обеспечивается триггерами целостности — специальными приложениями-программами, работающими при определенных условиях. Защита данных от несанкционированного доступа предполагает ограничение доступа к конфиденциальным данным и может достигаться:
· введением системы паролей;
· получением разрешений от администратора базы данных (АБД);
· запретом от АБД на доступ к данным;
· формирование видов — таблиц, производных от исходных и предназначенных конкретным пользователям.
Стандартизация обеспечивает преемственность поколений СУБД, упрощает взаимодействие БД одного поколения СУБД с одинаковыми и различными моделями данных. При этом может быть осуществлен как локальный, так и удаленный доступ к данным (технология клиент/сервер или сетевой вариант).
Проектирование баз данных — процесс решения класса задач, связанных с созданием баз данных.
Основные задачи проектирования баз данных :
· Обеспечение хранения в БД всей необходимой информации.
· Обеспечение возможности получения данных по всем необходимым запросам.
· Сокращение избыточности и дублирования данных.
· Обеспечение целостности данных (правильности их содержания): исключение противоречий в содержании данных, исключение их потери и т.д.
Основные этапы проектирования баз данных:
1) Концептуальное (инфологическое) проектирование – построение формализованной модели предметной области. Такая модель строится с использованием стандартных языковых средств, обычно графических, например ER-диаграмм (диаграмм «Сущность-связь»). Такая модель строится без ориентации на какую-либо конкретную СУБД.
Основные элементы данной модели:
· Описание объектов предметной области и связей между ними.
· Описание информационных потребностей пользователей (описание основных запросов к БД).
· Описание алгоритмических зависимостей между данными.
· Описание ограничений целостности, т.е. требований к допустимым значениям данных и к связям между ними.
2) Логическое (даталогическое) проектирование – отображение инфологической модели на модель данных, используемую в конкретной СУБД, например на реляционную модель данных. Для реляционных СУБД даталогическая модель – набор таблиц, обычно с указанием ключевых полей, связей между таблицами. Если инфологическая модель построена в виде ER-диаграмм (или других формализованных средств), то даталогическое проектирование представляет собой построение таблиц по определённым формализованным правилам, а также нормализацию этих таблиц. Этот этап может быть в значительной степени автоматизирован.
3) Физическое проектирование – реализация даталогической модели средствами конкретной СУБД, а также выбор решений, связанных с физической средой хранения данных: выбор методов управления дисковой памятью, методов доступа к данным, методов сжатия данных и т.д. – эти задачи решаются в основном средствами СУБД и скрыты от разработчика БД.
На этапе инфологического проектирования в ходе сбора информации о предметной области требуется выяснить:
· основные объекты предметной области (объекты, о которых должна храниться информация в БД);
Источник
Лекция «Представление об организации баз данных и системах управления базами данных»
Тема: «Представление об организации баз данных и системах управления базами данных»
Табличные базы данных
База данных (БД) – представляет собой совокупность структуриро ванных данных, хранимых в памяти вычислительной системы и ото бражающих состояние объектов и их взаимосвязей в рассматриваемой предметной области.
— база данных книжного фонда библиотеки;
— база данных кадрового состава учреждения;
— база данных современной эстрадной песни.
По характеру хранимой информации БД делятся на:
Фактографические (БД содержат краткие сведения об объектах, представленные в строго определенном формате)
Документальные (БД содержат документы разного типа: текстового; графического; звукового; мультимедийного.
По способу хранения БД делятся на:
Централизованные БД-БД хранящиеся на одном компьютере.
Распределенные БД- различные части одной БД хранятся на множестве компьютеров, объединенных между собой сетью (н.р.Интернет)
Реляционные БД- БД с табличной формой организации информации, состоящие из одной или нескольких взаимосвязанных двумерных таблиц.
Реляционные БД содержат 4 типа полей :
числовой (имеет поля значения которых м.б.только числами);
символьный (поля в которых будут храниться символьные последовательности-слова, тексты, коды);
дата (поля содержащие календарные данные в различной форме);
логический (поля которые могут принимать только 2 значения «ДА» и «НЕТ» или « ИСТИНА» и «ЛОЖЬ».
Не реляционные БД делятся на:
Иерархическая модель- представляющая совокупность элементов, расположенных в порядке их подчинения (н.р.дерево)
Сетевая модель- БД похожа на иерархическую структуру.
Запись- строка таблицы. Одна запись содержит информацию об отдельном объекте, описываемом в БД.
Поле- столбец таблицы. Поле содержит определенное свойство объекта. Каждое поле имеет свое имя.
Значения поля — некоторые величины определенных типов, от которых зависят те действия которые можно с ней производить.
Поля могут содержать данные следующих основных типов:
счетчик — целые числа, которые задаются автоматически при вводе записей. Эти числа не могут быть изменены пользователем;
текстовый — тексты, содержащие до 255 символов;
дата/время — дата или время;
денежный — числа в денежном формате;
логический — значения Истина (Да) или Ложь (Нет);
гиперссылка — ссылки на информационный ресурс в Интернете (например, Web-сайт).
Поле каждого типа имеет свой набор свойств. Наиболее важными свойствами полей являются:
размер поля — определяет максимальную длину текстового или числового поля;
формат поля — устанавливает формат данных;
обязательное поле — указывает на то, что данное поле обязательно надо заполнить.
Каждая таблица должна содержать, по крайней мере, одно ключевое поле , содержимое которого уникально для каждой записи в этой таблице. Ключевое поле позволяет однозначно идентифицировать каждую запись в таблице.
Первичный (главный) ключ БД- это поле или группа полей, с помощью которых можно однозначно идентифицировать запись. Значение не должны повторяться у разных записей.
Тип- определяет множество значений, которые может принимать данное поле в различных записях.
Логическую структуру данных, хранимых в базе, называют мо делью представления данных.
Одним из семи стандартных объектов Microsoft Access является запрос . Запросы- средств извлечения информации из БД, отвечающим некоторым условиям, задаваемым пользователем. Результат запроса выводится в виде таблицы, все записи которой удовлетворяют условиям. Запросы могут служить источником данных для форм и отчетов Microsoft Access. Сам запрос не содержит данных, но позволяет выбирать данные из таблиц и выполнять над ними ряд операций.
Существует несколько различных типов запросов:
Запросы на выборку .
Запросы с обобщением .
Запросы с параметрами .
Активные запросы (запросы на изменение) .
Одной из основных задач создания и использования баз данных является предоставление пользователям необходимой информации на основе существующих данных. В MS Access 2007 для этих целей предназначены формы и отчеты .
Отчеты позволяют выбрать из базы данных требуемую пользователем информацию и оформить ее в виде документов, которые можно просмотреть и напечатать.
Форма – средство интерфейса пользователя БД, используемое чаще всего для просмотра, ввода и редактирования данных в таблицах. Если записи изменяются или вставляются редко, то для ввода, редактирования и отображения данных достаточно использовать таблицу. В форму можно добавить объекты, созданные в других приложениях – например, иллюстрации, диаграммы и др.
MS Access поддерживает импорт данных из других приложений и экспорт данных в другие приложения, слияние данных с документами MS Word, анализ данных средствами MS Excel .
Назовите основные объекты БД ?
Как происходит поиск записей с помощью фильтров и запросов
В каком режиме происходит редактирование?
Источник