Способы упорядочивания данных сортировка индексация

Поиск и сортировка данных, индексирование базы данных

При создании новой записи представляется размещение этой записи в памяти, что оказывает огромное влияние на время выборки. Простейшая стратегия размещения данных — новая запись размещается на первом свободном участке или вслед за последней из ранее размещённых записей. Основные способы доступа к данным.Последовательная обработка области БД предполагает, что система последовательно просматривает страницы, пропускает пустые участки и выдаёт записи в физической последовательности их хранения. Доступ по ключу базы данных (КБД). КБД определяет местоположение записи в памяти ЭВМ. Зная его, система может извлечь нужную запись за одно обращение к памяти. Доступ по структуре.Эта разновидность доступа применяется для групповых отношений и позволяет перейти к предыдущему или следующему экземпляру группового отношения, к экземпляру-владельцу группового отношения или к списку подчинённых экземпляров. Доступ по первичному ключу.Первичный ключ идентифицирует записи внутри типа. Если система обеспечивает доступ по первичному ключу, то он (ключ) используется также при запоминании записи и его значение в этом случае обычно используется при размещении записи в памяти. Наиболее распространённые механизмы доступа по первичному ключу – индексирование и хеширование.

Для ускорения доступа к записям по ключевому атрибуту создаётся специальная структура – индекс, который определяет соответствие значения атрибута и местоположения записи. Индекс обычно хранится в отдельном файле или отдельной области памяти. Пустые значения атрибутов (null) не индексируются.Обращение к записи через индексы осуществляется в два этапа: сначала в индексной структуре находится требуемое значение атрибута и соответствующий адрес записи, затем по этому адресу происходит обращение к внешнему запоминающему устройству (ВЗУ). Индекс загружается в ОП целиком (или хранится в ней постоянно во время работы с БД). Если каждому значению индекса соответствует уникальное значение ключа, то ключ первичный. Если же индекс строится по ключу, допускающему дубликаты значений, такой индекс называется вторичным. Различают одиночные индексы и составные. Составной индекс включает два или более столбца одной таблицы.Существует множество способов организации индексов:1. В плотных индексахдля каждого значения ключа имеется отдельная статья индекса, указывающая место размещения конкретной записи. Неплотные индексы строятся в предположении, что на каждой странице памяти (или в блоке) хранятся записи, отсортированные по значениям ключа индексирования. 2. Метод сжатия ключа основан на устранении избыточности хранимых данных. Последовательно идущие значения ключа обычно имеют одинаковые начальные части, поэтому в каждой статье индекса можно хранить не полное значение ключа, а лишь информацию, позволяющую его восстановить из известного предыдущего значения. Одноуровневый индекс— линейную совокупность значений одного или нескольких полей записи. Используется в простейших случаях, когда количество индексируемых записей невелико. В более сложных случаях индекс занимает много памяти (иногда – несколько страниц), и возникает задача минимизации доступа к нему. Тогда индекс разбивается на несколько иерархических уровней, что позволяет ускорить поиск требуемого значения.

Дата добавления: 2015-04-18 ; просмотров: 41 ; Нарушение авторских прав

Источник

ТЕМА 4.4. СПИСКИ. ОБРАБОТКА, СОРТИРОВКА И ФИЛЬТРАЦИЯ ТАБЛИЧНЫХ ДАННЫХ. СТРУКТУРИРОВАНИЕ ТАБЛИЦ

Познакомиться с технологиями:

  • сортировки списков;
  • фильтрации списков с помощью автофильтра;
  • фильтрации списков с помощью расширенного фильтра;
  • структурирования данных.

Оглавление

4.4.1. Понятие списка (базы данных)

Многие экономические задачи направлены на обработку больших таблиц, имеющих много столбцов и строк. Таблица данных называется списком, если она обладает следующими свойствами:

  • название столбца (имя поля) занимает только одну ячейку в верхней строке таблицы;
  • данные располагаются сразу после названия столбца;
  • таблица данных не имеет объединенных ячеек.

При таких условиях список можно считать однотабличной базой данных, поэтому при работе со списком применяют соответствующую терминологию:

  • строка списка – запись базы данных;
  • столбец списка – поле базы данных.

Ячейки верхней строки с именами полей образуют область имен полей.

Рис. 1. Структурные элементы списка (базы данных Excel)

Данные всегда располагаются, начиная со следующей строки после области имен полей. Весь блок ячеек с данными называют областью данных.

Список содержит фиксированное количество полей (столбцов), определяющих структуру записи базы данных (строки).

Над записями списка можно выполнять различные операции обработки, команды вызова которых сгруппированы в меню Данные.

4.4.2. Сортировка данных в списке

Сортировка данных является базовой операцией любой таблицы и выполняется командой Данные/Сортировка с установкой необходимых параметров. Целью сортировки является упорядочивание данных. Сортировка осуществляется на том же листе.

В среде Microsoft Excel предусмотрено три уровня сортировки, которые определяются в диалоговом окне Сортировка диапазона (Рис. 2).

В том же окне устанавливается порядок сортировки в столбцах – по возрастанию или убыванию. При сортировке по возрастанию упорядочение идет:

  • для чисел — от меньшего к большему;
  • для символьных данных – по алфавиту от А до Я;
  • для дат – в хронологическом порядке.

Для столбцов, содержащих разные по формату данные, имеет место приоритет: числа, текст, логические значения, значения ошибок, пустые ячейки. Сортировка по убыванию использует обратный порядок (исключение – пустые ячейки, которые располагаются в конце списка).

Рис. 2. Параметры сортировки

Сортировка по нескольким уровням осуществляется в том случае, если в таблице имеются столбцы, содержащие повторяющиеся значения. Тогда сортировка 1-го уровня осуществляет, по сути, группировку записей с одинаковым значением поля. Сортировка 2-го уровня осуществляет упорядочение данных в группах, полученных после сортировки 1-го уровня. Сортировка 3-го уровня упорядочивает данные в группах, полученных после сортировки 2-го уровня.

При наличии заголовков столбцов (имен полей) их следует исключить из области, подлежащей сортировке. Для этого используется переключатель Идентифицировать поля по подписям.

Кнопка Параметры выводит диалоговое окно Параметры сортировки, в котором задаются дополнительные установки сортировки: с учетом регистра или без учета; по столбцам или по строкам; порядок сортировки – обычный или специальный, выбранный из предлагаемого списка. Этот список можно сформировать самостоятельно с помощью Сервис/Параметры/вкладка Списки.

4.4.3. Фильтрация

Фильтрация данных в списке – это отбор данных по заданному критерию (условию). Осуществляется эта операция с помощью команды Данные/Фильтр. Имеется две разновидности этой команды, задаваемых параметрами: Автофильтр и Расширенный фильтр.

Фильтрация данных может осуществляться с помощью специальной формы, которая вызывается командой Данные/Форма.

4.4.4. Автофильтрация

Команда Данные/Фильтр/Автофильтр для каждого столбца строит список значений, который используется для задания условий фильтрации (Рис. 3). В каждом столбце появляется кнопка списка, нажав которую можно ознакомиться со списком критериев отбора.

Рис. 3. Список с автофильтром

Для каждого столбца в списке критериев отбора предусматриваются следующие варианты:

  • все – выбираются все записи без ограничений;
  • первые 10 – данный пункт позволяет во вновь появляющемся диалоговом окне Наложение условия по списку (Рис. 4) выбрать определенное количество наибольших или наименьших элементов списка, которые необходимо отобразить;

Рис. 4. Наложение условия по списку

  • значения – будут выбраны только те записи, которые в данном столбце содержат указанное значение;
  • условие – выбираются записи по формируемому пользователем условию в диалоговом окне.

Условие для отбора записей по конкретным значениям в определенном столбце может состоять из двух самостоятельных частей, соединенных логической связкой И/ИЛИ (Рис. 5). Каждая часть условия включает один из операторов отношения:

  • равно;
  • не равно;
  • больше;
  • больше или равно;
  • меньше;
  • меньше или равно;
  • начинается с;
  • содержит значение, которое может выбираться из списка или содержать шаблонные символы “*”, “?” и т.п.

Рис. 5. Задание условия фильтрации

Примеры условий

Для поля Код предмета можно сформировать условия:

отобрать все записи, которые содержат код предмета, начинающийся с буквы п

отобрать все записи, которые не содержат кода предмета п1

4.4.5. Расширенный фильтр

Инструмент Расширенный фильтр позволяет задать условия отбора для нескольких столбцов независимо друг от друга и осуществить фильтрацию записей. Фильтрация выполняется по всем условиям одновременно. Все записи, не прошедшие через фильтр, будут скрыты.

Расширенный фильтр позволяет задать условия отбора двух типов критериев:

  • критерий сравнения;
  • вычисляемый критерий.

Если критерий фильтрации формируется в нескольких столбцах, его называют множественным критерием.

Технология использования расширенного фильтра состоит из двух этапов:

  • 1-й этап – формирование области условий;
  • 2-й этап – фильтрация записей списка.

Технология формирования области условий

  1. Скопировать имена столбцов и вставить их в свободной области листа.
  2. В ячейках под именами столбцов записать условия отбора на одной или нескольких строках.
  3. Неиспользуемые имена столбцов из диапазона условий можно удалить.

Правила формирования Критерия сравнения

  1. Имена столбцов области критериев должны полностью совпадать с именами столбцов исходного списка.
  2. Условие отбора по критерию сравнения может быть задано одним из следующих способов:
  • указать точное значение;
  • указать условие с помощью операторов отношения (>, =, 3

    2-й способ. Множественный критерий сравнения – условия (точные значения полей) записаны в двух строках (Таблица 3). Номер группы, код предмета и оценка заданы как точные значения. На одной строке указаны оценка «4», на другой – «5». Связка “ИЛИ”.

    Таблица 3. Задание множественного критерия. Связка “ИЛИ”

    Номер группы

    Код предмета

    Оценка

    Вычисляемый критерий представляет собой формулу в виде логического условия, которая возвращает логическое значение ИСТИНА или ЛОЖЬ. Формула обязательно содержит оператор отношения, который сравнивает некоторые вычисляемые выражения.

    Имя столбца, содержащего формулу вычисляемого критерия, должно отличаться от имени столбца в списке.

    Пример

    Из списка (Рис. 3) выбрать записи о студентах группы 133, получивших оценку ниже общего среднего балла или получивших оценку 5. Пример вычисляемого критерия представлен в таблице (Таблица 4). Столбец Номер группы имеет такое же имя как и столбец в исходном списке, потому что для отбора группы используется критерий сравнения. Имя столбца Оценка1 отличается от имени столбца в исходном списке, т.к. здесь используется вычисляемый критерий.

    Таблица 4. 1-й способ задания вычисляемого критерия

    Номер группы

    Оценка1

    Рис. 9. Исходная таблица для автостуктурирования

    По каждому виду начислений в строке Итого рассчитывается с помощью функции СУММ общая сумма по ячейкам столбца. Порядок следования исходных данных и результатов (итогов) – слева направо, сверху вниз, позволяет применить автоструктурирование таблицы (Рис. 10).

    После ввода в таблицу исходных данных и формул курсор устанавливается в произвольную ячейку списка и выполняется команда Данные/Группа и Структура/Создать структуру. Все структурные части таблицы создаются автоматически.

    Рис. 10. Таблица после автоструктурирования

    Структурирование таблицы с автоматическим подведением итогов

    В среде Excel существует инструмент структурирования с одновременным подведением итогов. Команда Данные/Итоги создает структуру таблицы и одновременно вставляет строки промежуточных и общих итогов для выбранных столбцов в соответствии с заданной функцией (Таблица 8).

    Примечание. Для получения итогов по группам следует заранее упорядочить строки списка с помощью команды Данные/Сортировка.

    Подведение итогов выполняется при изменении значений в столбце, который образует группы.

    Перед подведением итогов надо выполнить сортировку по одному или нескольким полям списка.

    Команда Данные/Итоги может выполняться для одного списка многократно. Созданные ранее промежуточные итоги могут как заменяться новыми, так и оставаться неизменными посредством установки или снятия флажка параметра Заменить текущие итоги (Рис. 11). Таким образом, имеется возможность подведения итогов различных уровней вложенности.

    Таблица 8. Функции для подведения автоматических итогов

    Операция

    Значение в строке итогов по группе

    Источник

    Читайте также:  Способы учреждения юридического лица
    Оцените статью
    Разные способы
Читайте также:
  1. A — Общие и связь для координации поиска и спасения
  2. A) обработки данных, вводимых в ЭВМ
  3. A) Правила организация передачи данных в сети
  4. A) прикладная программа, предназначенная для обработки структурированных в виде таблицы данных
  5. A) прикладная программа, предназначенная для обработки структурированных в виде таблицы данных
  6. A) Результат вычисления формулы на основе имеющихся данных
  7. A) Совокупность программных средств, с помощью которых создается база данных и поддерживается в процессе эксплуатации
  8. Quot;Бостонская резня», «Бостонское чаепитие», акция «Паблиус» -роль данных исторических событий в истории PR.
  9. Read uncommitted (чтение незафиксированных данных)
  10. URL (Uniform Resource Locator, унифицированный локатор ресурса) — адрес, используемый Web-браузером для поиска ресурса в Интернете. Предложен создателем WWW Тимом Бернерсом-Ли.