- Графические методы представления статистических данных
- Как визуализировать данные: типы графиков
- Столбчатая диаграмма (Bar Graph)
- Линейная диаграмма (Line Chart)
- Гистограмма с несколькими осями (Multi-Axis Charts)
- Гистограмма (Bar Histograms)
- Круговая диаграмма (Pie Charts)
- Диаграмма спагетти (Spaghetti Charts)
- Географическая диаграмма (Map Charts)
- Стрим-график или график потока (Stream Graph)
- Пузырьковая диаграмма (Bubble Charts)
- Лучевая диаграмма (Sunburts)
- Полярные часы (Polar Clock)
- Интерактивная кольцевая диаграмма (Donut Transitions)
- Инфографика
- Лекция «Графическое изображение статистических данных»
Графические методы представления статистических данных
Значение графического метода в анализе и обобщении данных велико. Графическое изображение, прежде всего, позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке.
Статистический график – это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Графический образ – это совокупность точек, линий и фигур, с помощью которых изображаются статистические данные. Вспомогательными элементами графика являются:
Поле графика – это часть плоскости, где расположены графические образы. Поле графика имеет определенные размеры, которые зависят от его назначения.
Пространственные ориентиры графика задаются в виде системы координатных сеток. Система координат необходима для размещения геометрических знаков в поле графика. Используются как прямоугольные, так и полярные системы координат.
Масштабные ориентиры используются для сопоставления графического отображения объекта и его реальных размеров. Задаются масштабные ориентиры системой масштабных шкал или масштабными знаками.
Экспликация графика состоит из объяснения предмета, изображаемого графиком (название), и смыслового значения каждого знака, применяемого на графике.
Статистические графики классифицируют по назначению (содержанию), способу построения и характеру графического образа (рис.1).
Рис.1. Классификация статистических графиков
По способу построения графических образов выделяют:
Диаграммы – графическое изображение статистических данных, наглядно показывающее соотношение между сравниваемыми величинами.
Различают следующие основные виды диаграмм: линейные, столбиковые, полосовые, секторные, квадратные, круговые, фигурные.
Линейные диаграммы применяются для характеристики динамики, т.е. оценки изменения явлений во времени. По оси абсцисс откладываются периоды времени или даты, а по оси ординат – уровни ряда динамики. На одном графике может быть размещено несколько диаграмм, что позволяет сравнивать динамику различных показателей, либо одного показателя по разным регионам или странам.
Рис.2. Динамика объема импорта легковых автомобилей в РФ
за 2006-1кв. 2010г.г.
Столбиковые диаграммы могут быть использованы:
для анализа динамики социально-экономических явлений;
оценки выполнения плана;
характеристики вариации в рядах распределений;
для пространственных сопоставлений (сравнения по территориям, странам, фирмам);
для изучения структуры явлений.
Столбики располагаются вплотную или раздельно на одинаковом расстоянии. Высота столбиков должна быть пропорциональна числовым значениям уровней признака.
Рис.3. Динамика удельного веса Белоруссии в товарообороте РФ со странами СНГ
Для характеристики структуры социально-экономических явлений широко используются секторные диаграммы. Для ее построения круг следует разделить на секторы пропорционально удельному весу частей в общем объеме. Сумма удельных весов равна 100%, что соответствует общему объему изучаемого явления.
Рис.4. Географическое распределение товарооборота РФ со странами СНГ
Полосовые диаграммы состоят из прямоугольников, расположенных горизонтально (полосами).
Иногда для сравнительного анализа по регионам, странам используют диаграммы фигур-знаков (диаграммы геометрических фигур). Данные диаграммы отражают размер изучаемого объекта в соответствии с размером своей площади.
Статистические карты применяются для оценки географического размещения явлений и сравнительного анализа по территориям.
Статистические карты включают картограммы и картодиаграммы. Различие между ними состоит в способах отображения статистических данных на картах.
Картограмма показывает территориальное распределение изучаемого признака по отдельным районам и используется для выявления закономерностей этого распределения. Картограммы делятся на фоновые и точечные. Фоновые картограммы разной густотой цветовой окраски характеризуют интенсивность какого-либо показателя в пределах территориальной единицы. На точечной картограмме уровень выбранного явления изображается с помощью точек.
Картодиаграмма – это сочетание географической карты или ее схемы с диаграммой. Она позволяет отразить специфику каждого района в распределении изучаемого явления, его структурные особенности.
В настоящее время разработаны различные пакеты прикладных программ компьютерной графики, например, Excel, Statgraf, Statistica.
Источник
Как визуализировать данные: типы графиков
Редактор Наталия Шергина специально для блога Нетологии адаптировала статью об эффективных способах визуализации данных.
Предположим, вы понимаете важность визуального представления данных, знаете, какие навыки для этого нужны и, более того, обладаете ими. Заодно представим, что у вас есть данные для визуализации, осталось только разобраться, какие виды графиков и диаграмм подойдут. В статье мы расскажем о самых эффективных способах визуализации данных — вам будет из чего выбрать.
Столбчатая диаграмма (Bar Graph)
Скорее всего, это был первый способ визуализации, с которым вы столкнулись. Вспомните школьные учебники, таких диаграмм там было много. Если вы думали, что столбчатые диаграммы вместе со школой остались позади — не спешите с ними прощаться. Многие виды данных удобно представлять с их помощью: информацию о пробках на дороге, увеличение клиентской базы, график продаж. Столбчатые диаграммы — один из самых наглядных видов представления статистики.
Линейная диаграмма (Line Chart)
Этот вид графиков напоминает вершины горного хребта, и это сравнение неслучайно. С помощью линейных диаграмм можно графически представить горы данных и извлечь столько же инсайтов. Подходят для представления колебаний акций, темпа роста компании, построения прибыльной системы.
Гистограмма с несколькими осями (Multi-Axis Charts)
Это сочетание столбчатой диаграммы и линейного графика. Подойдёт, если нужно представить два или более фактора для выявления параллелей или сравнения. Гистограммы с осями часто используют на заседании членов советов компании, чтобы сопоставить, например, рыночную цену и общую выручку.
Гистограмма (Bar Histograms)
Ещё один график из школьных учебников. Гистограммы используют для представления числовых данных одной категории и их изменения с течением времени. Пример — изменение численности населения страны за конкретный период.
Как и столбчатые диаграммы, гистограммы состоят из столбцов. Поэтому эти два вида графиков часто путают. Давайте разбираться.
- Есть расстояние между столбцами
- Нет расстояния между столбцами
- Применяются для сравнения категориальных данных
- Применяются для выявления зависимости качественных данных
- Если переставить местами столбцы, логика не нарушится. Венера и Земля — две категории, которые друг от друга не зависят.
- Если в гистограмме наблюдаемых температур переставить местами столбцы, нарушится логика, так как рассматривается одна величина (температура), а не разные категории
Круговая диаграмма (Pie Charts)
Кто работал с Экселем, тот наверняка знаком с круговыми диаграммами. Поставил её — и отчёт сразу выглядит презентабельнее, так? А если серьёзно, то круговые диаграммы — это отличный способ представить части одного целого. Например, долю компании на рынке, ваш вклад в общий проект или разработку секторов для инвестиционного плана.
Каждому из нас приходилось работать хотя бы с одной из перечисленных диаграмм. А если нет, то их названия вы точно слышали. На этом мейнстрим заканчивается. Далее — менее популярные графики.
Диаграмма спагетти (Spaghetti Charts)
К сожалению, это не совсем о еде. Диаграмма спагетти — очень необычный вид графиков, который только набирает популярность. Здесь без визуальной подсказки не объяснишь.
Помимо метеорологии, эти диаграммы подходят для визуализации взаимосвязей, что особенно полезно в юридических и судебных вопросах.
Географическая диаграмма (Map Charts)
Географические диаграммы специально разработаны для анализа географической информации, представления пространственных отношений и региональных данных. Используйте их, если нужно графически изобразить глобальную клиентуру, план расширения компании или план диверсификации производства. Эти диаграммы покажут, какие географические области развиваются, а каким нужно больше внимания. Также они помогают принимать решение — например, куда инвестировать или какие страны лучше для жизни.
Стрим-график или график потока (Stream Graph)
Даже если вы ни разу не видели землетрясения, то о сейсмографе слышали наверняка. Это машина, которая реагирует на сейсмическую активность и записывает сейсмоволны в виде графика.
Сейсмограф фиксирует толчки 24 часа 7 дней в неделю. Данные представляются графически в виде «потока» или «волн» вдоль центральной оси. Сейсмография — не единственная сфера применения графиков потока. Они особенно эффективны для графического изображения изменений за период времени.
Пузырьковая диаграмма (Bubble Charts)
Не очень серьёзное название, но суть не в нём. Сфера применения таких диаграмм в представлении и анализе данных огромна. Если говорить технически, пузырьковая диаграмма пригодится для визуализации анализа взаимодействий и распределения. А проще говоря, информация представлена в трёх измерениях или плоскостях. Допустим, у вас три вида данных: общее количество товаров, число каждого проданного продукта и выручка от продаж каждого продукта. Если вы хотите видеть взаимосвязь этих данных на одном графике, то пузырьковая диаграмма для вас.
Лучевая диаграмма (Sunburts)
Любители интернет-магазинов, эта информация для вас. Ваше поведение на сайте и то, на какие страницы вы заходите, заносится в историю, а админы магазинов могут легко представить эту информацию в виде лучевой диаграммы, чтобы понять, куда идёт основной трафик на сайте и какие страницы посещают реже всего. Такие диаграммы идеальны для представления иерархических данных.
Полярные часы (Polar Clock)
Ещё один интересный, но пока не самый популярный вид представления данных. График работает по принципу часов и каждую секунду показывает количество проделанной работы. Похоже на окно «копирование файлов», где зелёный индикатор показывал, сколько процентов данных уже скопировано. Представьте себе то же самое, только в форме круга — это и есть диаграмма полярные часы.
Интерактивная кольцевая диаграмма (Donut Transitions)
Это та же кольцевая диаграмма, только анимированная. Интерактивная кольцевая диаграмма — один из лучших способов для выявления закономерностей между несколькими параметрами. Эффективна для представления части целого и анализа зависимости величин. При изменении анализируемых параметров изменяются и пропорции диаграммы. Пригодится тем, кто следит за динамикой изменения — например, изменения стоимости акций в результате каких-либо действий компании.
Курс
Инфографика
- Научитесь превращать скучные цифры в наглядные визуальные истории
- Разберётесь в online-инструментах создания инфографики
- Поймёте, как работать с интерактивной и видеоинфографикой
Это одни из наиболее эффективных способов визуализации данных. Какие-то из них более привычны, о других пока мало кто знает. Новые виды графиков и диаграмм появляются вместе с новыми видами данных, что происходит непрерывно. Это значит, что скоро появятся более продвинутые способы визуализации.
Инфографика для СМИ
Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.
Источник
Лекция «Графическое изображение статистических данных»
20. Графическое изображение статистических данных
Статистические графики позволяют представить статистические данные более наглядно, облегчают их восприятие, помогают уяснить сущность изучаемых явлений, выявить закономерности и тенденции их развития.
Для построения графиков можно использовать системы статистического анализа данных, реализованные в ППП “STATISTICA”, “STATGRAPH”, ‘SPSS”, в системах электронных таблиц типа MSEXEL.
В практической деятельности используются самые разнообразные графики. Их выбор определяется целью построения, способом построения, глубиной отображения изучаемого материала и т. д.
Статистические графики должны соответствовать следующим требованиям:
Любой статистический график состоит из следующих элементов:
Графическим образом называются символические знаки, с помощью которых изображается статистическая информация.
Таким знаками могут быть точки, линии, плоские геометрические фигуры, объемные фигуры, негеометрические фигуры в виде изображения каких-либо предметов и т. д.
Полем графика называется часть пространства, в котором расположены графические образы. Поле графика должно иметь определенные размеры и пропорции.
Наилучшим образом зрительно воспринимаются статистические графики, выполненные на поле, формат которого соответствует правилу «золотого сечения». Это прямоугольное поле с соотношением сторон 1:1,5.
Пространственные ориентиры определяют расположение символических знаков в поле графика. Они задаются в виде системы координатных сеток или контурных линий, делящих поле графика на части.
На практике чаще всего используется система прямоугольных координат.
Масштабные ориентиры придают символическим знакам количественную определенность и задаются системой масштабных шкал или специальными масштабными знаками.
Масштабная шкала представляет из себя линию, отдельные точки которой рассматриваются как определенные числа. Масштабные шкалы применяются в координатных статистических графиках.
Масштабные знаки используются в статистических картах.
Экспликацией график а называется словесное описание его содержания. Она состоит из названия графика, надписей вдоль масштабных шкал и пояснительных текстов, которые могут находиться как в пределах графического образа, так и рядом с ним; либо могут выноситься за пределы графического поля.
Для решения разнообразных задач статистических исследований используются различные виды графиков.
Статистические графики можно классифицировать по следующим основаниям:
по назначению по способу построения,
по характеру графического образа.
По назначению различают статистические графики:
относительных величин (структуры, динамики, сравнения и т. д.),
графики вариационных рядов,
графики взаимосвязанных показателей,
графики размещения по территории.
По способу построения графики делятся на:
Диаграммы являются наиболее часто используемыми графиками, они относятся к графикам количественных соотношений. Среди них выделяются диаграммы сравнения, динамики, структурные диаграммы.
Статистические карты относятся к графикам количественного распределения по поверхности, представляют собой условные изображения статистических данных на контурных географических картах.
По характеру графического образа различают :
В точечных графиках графическими образами являются совокупности точек.
В линейных диаграммах графическими образами являются линии. Как правило, линейные диаграммы используются для представления статистических кривых.
В плоскостных диаграммах статистические данные изображаются в виде геометрических фигур.
Среди плоскостных диаграмм различают:
Столбиковые диаграммы обычно используются для сравнения одноименных показателей, характеризующих различные объекты или территории. Сравниваемые показатели изображаются в виде прямоугольных столбиков, имеющих одинаковую ширину и располагающихся на общей горизонтальной или вертикальной базовой линии.
В полосовых (ленточных) диаграммах базовая линия расположена вертикально, а столбики (полосы) — горизонтально.
В квадратных или круговых диаграммах величины представляемых показателей должны быть пропорциональны площадям квадратов или кругов, а квадратные корни из этих величин — линейным размерам этих фигур.
Квадратные и круговые диаграммы менее наглядны, чем столбиковые или полосовые. Это связано со сложностью зрительной оценки площадей указанных фигур.
Для графического представления структуры изучаемого явления часто используются секторные диаграммы . Основным геометрическим параметром удельных весов в секторных диаграммах является величина угла между радиусами. Она рассчитываются, исходя из следующего: Сумма всех углов, равная 360º соответствует 100%, а 1% на диаграмме принимается равным 3,6º.
Статистические графики представляют собой условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем.
На графике сразу видны пределы изменения показателя, сравнительная скорость изменения разных показателей, их колеблемость. Вместе с тем графики имеют определенные ограничения:
прежде всего график не может включить столько данных, сколько может войти в таблицу;
кроме того, на графике показываются всегда округленные данные — не точные, а приблизительные.
Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний минус — трудоемкость построения графиков. Но этот недостаток может быть преодолен использованием пакетов прикладных программ для компьютерной графики.
По способу построения графики делятся на —
Наиболее распространенным способом графического изображения данных являются диаграммы. Они бывают разных видов:
Вид диаграмм зависит от вида представляемых данных (одна переменная или один показатель, несколько переменных или показателей, количественные или неколичественные) и задачи построения графика. В любом случае график обязательно сопровождается заголовком — над или под полем графика. В заголовке указывается, какой показатель изображен, в каких единицах измерения, по какой территории и за какое время он определен.
Линейные графики используются для представления количественных переменных: характеристики вариации их значений, динамики, взаимосвязи между переменными. Вариация данных анализируется с помощью полигона распределения, кумуляты (кривой «меньше, чем») и огивы (кривой «больше, чем»). Все эти виды графиков мы с Вами рассматривали ранее.
Линейные графики целесообразно разделять на используемые для представления данных по одной переменной – одномерные, или по двум переменным — двумерные . Примером первого является полигон распределения, второго — линия регрессии. Но может быть такой случай, когда на графике представлено несколько переменных (показателей), а он все-таки не является многомерным.
Например, на рис. 1 представлена динамика объема продукции промышленного и сельскохозяйственного производства в России в 1990-1996 гг. Для того чтобы динамика двух и более показателей была сопоставимой, следует обеспечить их «единый старт», как это сделано на рис. 1, где объемы продукции 1990 г. приняты за 100%.
Рис. 1. Динамика объема продукции промышленного и сельскохозяйственного производства в России в 1990-1996 гг.
Динамика двух показателей на одном и том же графике может быть представлена и без приведения их к 100%, если эти показатели связаны каким-либо функциональным соотношением (например, представлена динамика общего показателя и показателя, который является одним из его составляющих).
Примером такого графика является рис. 2.
Рис. 2. Международная миграция России
При графическом изображении динамики по оси абсцисс показывается время (годы, кварталы, месяцы); по оси ординат — значения показателей или показателя. При этом ось ординат должна иметь начало в точке «нуль».
Иногда вместо нулевой точки в качестве начального уровня на оси ординат показывется уровень какого-либо года. Это делается в том случае, если изменения изображаемого показателя значительны — в 8-10 и более раз в течение рассматриваемого отрезка времени. Однако такой прием не рекомендуется. Правильнее указать нулевую точку, а затем (если нужно) «разорвать» ось ординат так, как это показано на рис. 3, б.
Рис 3. Включение нулевой точки при изображении динамики
Иногда при больших изменениях показателя прибегают к логарифмической шкале.
Предположим, значения показателя изменяются от 1 до 100 (в 100 раз); это может вызвать затруднения при построении графика. Если перейти к логарифмам, то их значения для минимальных-максимальных значений показателя будут различаться не так сильно: log 1= 0, log 100 = 2.
Среди плоскостных диаграмм по частоте использования выделяются столбиковые диаграммы, на которых показатель представляется в виде столбика, высота которого соответствует значению показателя.
Пример столбиковой диаграммы представлен на рис. 4.
Рис. 4. Общие показатели рождаемости, смертности и естественного прироста населения России
Часто на столбиковой диаграмме показываются относительные величины: при сравнении показателей по группам, по разным совокупностям, одна из которых может быть принята за 100%.
Пропорциональность площади той или иной геометрической фигуры величине показателя лежит в основе других видов плоскостных диаграмм: треугольных, квадратных, прямоугольных.
В треугольной диаграмме нужно так выбрать стороны и высоту треугольника, чтобы его площадь отвечала величине показателя. Для построения квадратной диаграммы нужно задать размер одной стороны, прямоугольной — двух сторон.
Можно использовать и сравнение площадей круга; в этом случае задается радиус окружности.
Ленточная диаграмма представляет показатели в виде горизонтально вытянутых прямоугольников.
Как столбиковые, так и ленточные диаграммы можно применять не только для сравнения самих величин, но и для сравнения их частей (рис.5 и рис. 6).
Рис. 5. Доля безработных в экономически активном населении Санкт-Петербурга
Рис. 6. Структура расходов центральных правительственных органов (в % к общим расходам федерального правительства)
Особый тип ленточных диаграмм применяется для представления данных с разным характером изменений: положительным и отрицательным (рис. 7).
Рис. 7. Изменение объема производства на предприятиях текстильной промышленности города (1996 г. по сравнению с 1995 г., в %)
Диаграмма вида представленного на рис. 7 может использоваться, например, для представления регионов с разной величиной и характером миграционного сальдо (положительным и отрицательным) предприятий, на которых повысилась и понизилась оплата труда, и т. д.
Из плоскостных диаграмм часто используется секторная диаграмма. Она применяется для иллюстрации структуры изучаемой совокупности. Вся совокупность принимается за 100%, ей соответствует общая площадь круга, площади секторов соответствует частям совокупности (рис. 8).
Рис. 8. Структура беженцев и вынужденных переселенцев в России в 1996 г.
Фигурные (или картинные) диаграммы усиливают наглядность изображения, так как включают рисунок изображаемого показателя. Размер рисунка соответствует размеру показателя (рис. 9).
Рис. 9. Потребление хлебных продуктов на душу населения в 1994 г.
КАРТОГРАММЫ И КАРТОДИАГРАММЫ
Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений. Они показывают размещение изучаемого явления, его интенсивность на определенной территории — в республике, области, экономическом или административном районе и т. д.
На картограмме распределение изучаемого признака по территории изображается условными знаками (точками, штриховкой, цветом и т. д.), соответствующими определенным интервалам значений величины этого признака.
Эти знаки покрывают контур каждого района. Картограмма применяется в тех случаях, когда возникает необходимость показать территориальное распределение какого-нибудь одного статистического признака между отдельными районами для выявления закономерностей этого распределения.
Картограммы бывают фоновы е и точечные .
На фоновых картограммах распределение изучаемого явления на территории изображается различными раскрасками территориальных единиц с разной густотой цвета. Часто вместо раскраски применяется штриховка различной интенсивности. Такие картограммы обычно используются для изображения уровня относительных и средних величин по территориям.
Например, имеются данные об урожайности зерновых по 10 районам области: урожайность до 20 ц/га имеют три смежных района, 20-30 ц/га — четыре смежных района, свыше 30 ц/га -три смежных района.
Соответствующая фоновая картограмма представлена на рис. 10.
Рис. 4.10. География распределения районов по урожайности зерновых
Чем более интенсивно явление, тем гуще штриховка (точки) или темнее окраска. Такая картограмма наглядно показывает географию урожайности зерновых культур по районам. Чем больше групп, тем точнее изображение, но большое число групп создает пестроту, снижает наглядность. Поэтому практически лучше всего применять не более четырех-пяти тонов градаций плотности штриховки.
На точечной картограмме символами графического изображения статистических данных являются точки, размещенные в пределах определенных территориальных границ.
Точечная картограмма применяется для размещения абсолютных величии. Каждой точке, нанесенной на картограмму, придается числовое значение, что позволяет использовать ее для прямого счета.
Например, имеются четыре района с добычей угля в 200, 50, 1000 и 1400 тыс. т в год. Для составления картограммы примем точку за 100 тыс. т и нанесем на контур каждого района соответствующее количество точек (рис. 11).
Рис. 11. Добыча угля по районам
Картодиаграмма — это сочетание диаграммы с географической картой. В качестве изобразительных знаков в картодиаграммах используются те или иные фигуры, которые размещаются на контуре географической карты.
Картодиаграммы дают возможность графически отразить боле сложные статистико-географические соотношения чем картограммы.
Так, при помощи картодиаграммы можно выразить пространственную специфику в структурах изучаемых статистических совокупностей, особенности каждого района как единого целого и т. д.
Например, структурная или секторная картодиаграмма, характеризующая порайонные различия в структуре посевных площадей. B качестве диаграммных знаков в картодиаграмме часто используют различные геометрические фигуры, особенно круги, которые наиболее просты и удобны для выражения сравниваемых количественных показателей на карте.
Кроме рассмотренных видов диаграмм, картограмм и картодиаграмм на практике встречаются и другие, более сложные графические изображения статистических данных.
Источник