Способ анализа полученных данных

Полезные статьи → Статистические методы анализа данных для решения практических задач (часть вторая)

Опрос сотрудников, клиентов, потребителей – не просто сбор информации, это полноценное исследование. А целью всякого исследования является научно- обоснованная интерпретация изученных фактов. Первичный материал необходимо обработать, а именно упорядочить и проанализировать.

Анализ данных исследования – ключевой этап. Он представляет собой совокупность приемов и методов, направленных на то, чтобы проверить, насколько были верны предположения и гипотезы, а также ответить на заданные вопросы. Данный этап является, пожалуй, наиболее сложным с точки зрения интеллектуальных усилий и профессиональной квалификации, однако позволяет получить максимум полезной информации из собранных данных.

Методы анализа данных многообразны. Выбор конкретного метода анализа данных зависит, в первую очередь, от того, на какие вопросы мы хотим получить ответ.

Можно выделить два класса процедур анализа данных:

  • одномерные (дескриптивные) и
  • многомерные.

Многомерные типы анализа данных

Многомерный анализ данных позволяет одновременно исследовать взаимоотношения двух и более переменных и проверять гипотезы о причинных связях между ними.

Техники многомерного анализа разнообразны. Мы рассмотрим следующие:

  1. Факторный анализ
  2. Кластерный анализ

Факторный анализ

Суть факторного анализа, состоит в том, чтобы имея большое число параметров, выделить малое число макропараметров, которыми и будут определяться различия между измеряемыми параметрами. Это позволит оптимизировать структуру анализируемых данных.

Применение факторного анализа преследует две цели:

  • сокращение числа переменных;
  • классификация данных.

Факторный анализ довольно полезен на практике. Приведем несколько примеров.

Перед вами стоит задача исследовать имидж компании. Клиенту предлагается оценить данную компанию по целому ряду критериев, общее число которых может превышать несколько десятков. Применение факторного анализа в данном случае позволяет снизить общее количество переменных путем распределения их в обобщенные пучки факторов, например, «материальные условия компании», «взаимодействие с персоналом», «удобство обслуживания».

Еще одним случаем применения данного метода может служить составление социально-психологических портретов потребителей. Респонденту необходимо выразить степень своего согласия/несогласия с перечнем высказываний о стиле жизни. В итоге, можно выделить, например, целевые группы потребителей: «новаторы», «прогрессисты» и «консерваторы».

Актуальным примером исследования в сфере банковского дела, может послужить, изучение уровня доверия клиента к банку, которое можно описать следующими факторами:

— надежность сделок (включающий такие параметры, как сохранность средств, возможность беспрепятственного их перевода);

— обслуживание клиентов (профессионализм сотрудников, их благожелательность) и

— качество обслуживания (точность выполнение операций, отсутствие ошибок) и др.

Кластерный анализ

Кластерный анализ (от англ. сluster – сгусток, пучок, гроздь) – это один из способов классификации объектов. Он позволяет рассматривать достаточно большой объем информации, сжимая его и делая компактными и наглядными.

Термин «кластерный анализ» был введен в 1939 году английским ученым Р. Трионом, предложившим соответствующий метод, который сводился к поиску групп с тесно коррелирующим признаком в каждой из них.

Целью кластерного анализа является выделение сравнительно небольшого числа групп объектов, как можно более схожих между собой внутри группы, и как можно более отличающихся в разных группах. В настоящее время разработано достаточно большое число алгоритмов кластерного анализа. Однако, попробуем объяснить его суть, не прибегая к строгому теоретизированию.

Допустим, вы планируете провести опрос потребителей, (а все потребители разные), и вам, соответственно, необходимы различные стратегии для их привлечения. Для решения данной задачи мы предлагаем сегментировать клиентов, прибегнув к методу кластеризации. Для этого выполняем следующие шаги:

  1. формируем выборку и проводим опрос клиентов,
  2. определяем переменные (характеристики), по которым будем оценивать респондентов в выборке,
  3. вычисляем значения меры сходства и различия между ответами респондентов,
  4. выбираем метод кластеризации (т.е. правила объединения респондентов в группы),
  5. определяем оптимальное число кластеров (групп).

В результате получаем таблицу следующего содержания:

Информация, представленная в таблице, позволяет нам составить портрет клиентов каждого кластера, которые впоследствии необходимо учитывать при составлении стратегии успешного продвижения продукта на рынке.

Кластерный анализ хорошо зарекомендовал себя, и на сегодняшний день применяется в различных прикладных областях:

  • В социологии: разделение респондентов на различные социально-демографические группы.
  • В маркетинге: сегментация рынка по группам потребителей, группировка конкурентов по факторам конкурентоспособности.
  • В менеджменте: выделение групп сотрудников с разным уровнем мотивации, выявление мотивирующих/демотивирующих факторов в организации, классификация конкурентоспособных отраслей и поставщиков, и др.
  • В медицине — классификация симптомов, признаков заболеваний, пациентов, препаратов для успешной терапии.
  • А также психиатрии, биологии, экологии, информатике и т.д.

Рассмотренные методики относятся к анализу данных, полученных в ходе проведения количественных исследований.

По вопросам расчета индексов:

Телефон: +7 (383) 203-49-99

Начало (часть первая) и продолжение (часть третья) статьи «Статистические методы анализа данных для решения практических задач».

Читайте также:  Способ наблюдения при котором углубленное исследование

Источник

5.1 Этапы анализа данных

В процессе подготовки и анализа данных, как правило, присутствуют следующие основные этапы:

1. Сбор первичных данных для анализа. Наблюдая и измеряя характеристики объекта, педагог-исследователь собирает первичный статистический материал. Дальнейшая задача состоит в выдвижении статистической гипотезы на основании темы и цели исследования.

2. Ввод данных в компьютер. Данные исследований необходимо ввести в компьютер и сохранить. Ввод данных может осуществляться ручным набором чисел с клавиатуры или же экспортом из файла в каком-либо формате. Введенные данные обычно отображаются в форме электронной таблицы или матрицы данных, где столбцы представляют различные переменные (рост, вес, цвет глаз), а строки – измерения значений этих переменных.

3. Преобразование данных. П роводится группировка данных, то есть распределение их на однородные группы в соответствии с интересующими исследователя признаками. Данные в каждой группе упорядочиваются — классифицируются, сортируются, структурируются, подсчитывается частота событий. Нередко также требуется удаление из введенных данных высокоамплитудных значений, которые могут быть результатом некорректных измерений или замена пропущенных (неизмеренных) значений.

4. Визуализация данных – наглядное представление данных. Для этого можно использовать как табличное представление, так и различ­ные формы графического изображения. Человек часто на­много более продуктивно и быстро воспринимает информацию в виде зрительных образов.

5. Статистический анализ — статистическая обработка полученных количественных данных, заключающаяся в вычислении некоторых статистических характеристик и оценок, позволяющих проверить нулевую гипотезу.

6. Интерпретация и представление результатов. В творчестве ученого, занимающегося проблемами педагогики, самой сложной считается задача интерпретации полученного и обработанного фактического материала. К сожалению, исследователи нередко избегают этап обсуждения фактов и переходят сразу к выводам.

Конечно, хорошо обра­ботанные материалы, упорядоченные и оформленные в таблицы, статистические изображения могут служить ба­зой для выводов. Однако без всестороннего обсуждения, с ходом которого должен быть ознакомлен читатель, выво­ды будут мало или вовсе необоснованными и неубедитель­ными, да и сам исследователь многое теряет. Из поля его зрения выпадают ценные характеристики фактиче­ского материала, которые невидимы, то есть визуально не просматриваются, но существенно влияют на выводы.

Основная цель интерпретации — выявление и фиксиро­вание комплекса характеристик обработанного материа­ла, на основе которых открывается возможность обнару­жить и объяснить основные тенденции и сформулировать выводы.

Отметим, что важнейшим условием объективного ис­толкования обработанных данных выступает научная ква­лификация исследователя: его эрудиция, способность к ассоциативным мыслительным действиям. Естественно, что, чем квалифицирован­нее в той области, где ведется поиск, исследователь, тем основательнее обсуждение и богаче его результаты.

5.2 Представление данных в наглядной форме

Большую роль при анализе данных играет владение некоторыми специальными способами представления полученных данных в наглядной — краткой и схематизированной — форме.

Табличный способ изображения данных позволяет представить качественные и количественные данные с кратким сопроводительным объясняющим текстом. Таким текстом служат название таблицы, раскрывающее связь между числовыми рядами, и внутренние заголовки таблицы (указывающие измеряемые признаки, место, время, единицы измерения и т. п.).

Матрица представляет собой разновидность таблицы со строками и рядами (столбцами), имеющими какие-либо функционально-логические связи. В результате в матрице обнаруживается наличие или отсутствие связи между различными факторам педагогического процесса.

Графики еще более наглядно, чем таблицы, отображают изменение экспериментальных данных. Графики строятся в прямоугольной системе координат, в которой на оси “X” отмечается значение выборки, а по оси “Y” — значение, порядок признака, частота события.

Композиция графика – это сочетание всех его элементов. График должен привлекать внимание, обеспечивая в то же время легкость его прочтения и усвоения. Немаловажной задачей композиции графика является художественная и эстетическая сторона его оформления.

Правила построения графиков:

1. Необходимо провести тщательный отбор из имеющегося цифрового статистического материала тех данных, которые будут изображены на графике (далеко не все полученные данные следует изображать графически).

2. Выбрать тот вид графика, который по мнению исследователя наиболее ярко будет отражать полученные данные.

3. Название графика должно быть ясным и полным, отражающим содержание и имеющим при необходимости особые пояснения.

4. Надписи и легенда располагаются, как правило, в нижней или правой части диаграммы.

5. Цифры шкалы следует наносить слева и снизу или вдоль осей. Горизонтальную шкалу (по оси абсцисс) необходимо строить слева направо, вертикальную (по оси ординат) — снизу вверх.

4. Если числовые данные не включены в диаграммы, желательно их представить рядом в табличной форме.

5. Густота координатной сетки должна быть оптимальной, не затрудняющей чтения графика.

6. Допускается количество различных цветов на графике не более трех.

7. Если графики отражают серию наблюдений, рекомендуется ясно обозначать все точки, соответствующие отдельным наблюдениям.

1. Линейный график – передает изменения в некоторых мерных числах, например, изменение средних оценок контрольных работ, проведенных в одном классе в течение учебного года.

2. Гистограмма представляет собой разновидность графика в котором по оси “Y” откладываются частотные (интервальные) значения какой-либо группировки, в результате чего график становится “ступенчатым”.

Читайте также:  Письмо как способ передачи мыслей

3. Полигон частот – на базе полигона частот строится гистограмма, разница между ними заключается в том, что в полигоне частота интервала сведена к его центру, а при гистограмме частоты изображают равномерно в пределах всего интервала.

4. Кумулятивный график частоты (накопляющее распределение частоты) – частота отдельных интервалов совокупности рассматривается кумулятивно, то есть к частоте каждого интервала прибавляются частоты всех предыдущих интервалов.

5. Диаграммы сопоставляют количественную информацию в виде площадей различных фигур (круг, прямоугольник, сектор, цилиндр, пузырьки и др.).

Графы — особый вид графического отображения данных результатов; это фигура, состоящая из точек (вершин), соединенных отрезками (ребрами). Вершины графа могут обозначать различные компоненты педагогического процесса, параметры, факторы, а ребра — отношения и связи между ними. Графы (как модели) часто применяются на этапе прогнозирования эксперимента, а на обобщающем этапе с ними сопоставляются результаты. Простейшим примером графа служит “дерево” целей.

Схема статистических графиков по форме графического представления

5.3 Педагогические измерения

Измерение – это процесс определения значения какого-либо признака. Значением может быть не только число, но и имя. Измерение выполняют путем непосредственного наблюдения измеряемого признака или при помощи аппаратуры.

Если в точных науках измерение сводится к сравнению данной величины с однородной ей величиной, принятой за единицу (эталоном), то для психолого-педагогических параметров таких эталонов не имеется. Более того, большинство психолого-педагогических параметров (признаки, качества, свойства, факторы) являются скрытыми (латентными), о которых можно судить лишь косвенно, по их проявлениям, т. е. весьма приближенно.

Педагогическое измерение — это операция присвоения чисел объектам и их свойствам в соответствии с определенными правилами.

Обычно измерение подразделяется на прямое и косвенное. Прямое измерение заключается в непо­средственном сравнении измеряемого объекта с ка­ким-нибудь нормативом, эталонным измерителем. В педагогических исследованиях оно встречается редко, например при определении физического развития учеников (полнота, рост).

Чаще всего исполь­зуется косвенное измерение. Уровень знаний или уме­ний учеников, их моральные качества, дисциплини­рованность и т. п. могут быть измерены только косвенно, на основе работы учеников, их ответов на воп­росы, решения проблемных задач, числа ошибок в диктанте, на основе разных проявлений в поведе­нии.

Задача фактиче­ ского измерения различных сторон педагогического явления на сегодняшний день остается неопределенной, так как в учебно-воспитательном процессе мы выделяем как педа­гога, так и обучаемого, которые могут описываться большим набором свойств.

5.4 Качественная и количественная информация

Основную проблему при сборе информации в психолого-педагогическом исследовании составляет количественная оценка качеств изучаемых объектов и процессов.

Психолого-педагогическая наука пока еще в основном остается описательной, эмпирической, поэтому основным видом информации в педагогическом эксперименте является качественная, содержательная.

Качеством какого-либо объекта (процесса) считаются его существенные, устойчивые свойства, благодаря которым он этим объектом и является. Таким образом, качественная информация об объекте выражает его сущность и содержание и совершенно необходима для его характеристики.

Качественными характеристиками (параметрами) описываются в педагогике все процессы и результаты обучения и воспитания, все виды деятельности, взаимоотношений участников педагогического процесса, все достижения в развитии личностей и коллективов. Основные закономерности и принципы педагогики имею качественную форму.

Количественная характеристика окружающего мира представляет более высокий уровень его познаний. Количество — это объективная определенность объекта познания, в силу которой его можно разделить на однородные части. Количественные характеристики позволяют гораздо глубже, чем описательно-логические проанализировать процессы, выявить наличие и оценить величину связи различных качеств, обнаружить закономерности.

Количество и качество тесно связаны: они диалектически взаимодополняют и превращаются друг в друга (закон перехода количества в качество). В любой качественной информации всегда содержится та или иная степень количественной.

К сожалению, проникновение в психолого-педагогическую науку и практику количественных методов затрудняется следующими обстоятельствами:

— неразработанностью и часто отсутствием адекватных методов и средств количественной оценки психолого-педагогических параметров;

— большой сложностью педагогических процессов.

5.5 Шкалирование

Шкала – это средство фиксации результатов измерения свойств объектов путем упорядочивания их в определенную числовую систему, в которой отношение между отдельными результатами выражено в соответствующих числах [1] . В процессе упорядочивания каждому элементу выборки ставится в соответствие определенный балл (шкальный индекс), устанавливающий положение наблюдаемого результата на шкале.

Шкалирование — это операция упорядочивания исходных эмпирических данных путем перевода их в шкальные оценки. Шкала дает возможность упорядочить наблю­даемые явления, при этом каждое из них получает количественную оценку (квантифицируется). Шкали­рование помогает определить низшую и высшую сту­пени исследуемого явления.

Например, при исследо­вании учебных интересов учеников мы устанавлива­ем их границы: очень большой интерес — очень сла­бый интерес. Между этими границами определяется ряд ступеней. В результате складывается следующая шкала учебных интересов: очень большой интерес (1); большой интерес (2); средний (3); слабый (4); очень слабый (5). Рекомендуется вводить и экстремальные обозначения крайних границ шкалы,.

В психолого-педагогических исследованиях применяют классификацию шкал, предложенную С.Стивенсоном (см. рис. 1), согласно которой четыре основных способа измерения, связанные с различными правилами, называют измерительными шкалами (номинальная, порядковая, интервальная и шкала отношений). [2]

Читайте также:  Три способа борьбы с безработицей егэ

Рис. 1. Классификация шкал по С.Стивенсу

1. Номинальная шкала (шкала наименований), которую правильнее было бы считать классификацией, а не измерением, делит все объекты на группы по какому-либо признаку (различию). Этим признакам присваиваются определенные числа (код), что создает удобства при дальнейшей обработке экспериментальных данных. Никакого количественного соотношения между объектами в номинальной шкале нет.

Учащиеся класса делятся на две категории и обозначаются: девочки — 01, мальчики — 02.

Группы нарушителей дисциплины и их обозначение (кодирование): на уроке — 1, на улице – 2, дома — 3.

В процессе проверки соответствия подготовки выпускников школ требованиям ГОС появляется группа аттестованных и не аттестованных учеников.

2. Шкала порядка (порядковая, ранговая, ординальная) предназначена для измерения (обозначения) степени различия какого-либо признака или свойства у разных объектов. Самым ярким примером порядковой шкалы является пятибалльная система оценки ЗУН учащихся. Для нее разработаны критерии и различные методы измерения. 3начительно труднее применять порядковую шкалу для количественных оценок других качеств личности (в воспитательном процессе). Имеется несколько разновидностей порядкового шкалирования (измерения):

· ранжирование (в ряд),

· группировка (ранжирование по группам),

· метод полярных профилей.

Ранжирование. Изучаемые объекты располагаются в ряд (упорядочиваются) по степени выраженности какого-либо качества. Первое место в этом ряду занимает объект с наиболее высоким уровнем данного качества, и ему присваивается наивысший балл (числовое значение выбирается произвольно). Затем каждому объекту ранжированного ряда присваиваются более низкие оценки, соответствующие занимаемым местам.

Группировка всей совокупности объектов наблюдения в несколько рангов, достаточно ясно отличающихся друг от друга по степени измеряемого признака.

Пример: учащиеся класса согласно пятибалльной системе оценки ЗУН делятся на отличников, хорошистов и т. д.

Парное сравнение. Учащиеся сопоставляются друг с. другом (каждый с каждым) по какому-либо качеству. Если они одинаковы, то каждый получает по баллу. Если у одного этого качества больше, чем у другого, первый получает два балла, второй – 0 (как при спортивных играх по круговой системе). Суммируя полученные каждым баллы, получаем количественное выражение уровня развития данного качества у каждого учащегося (его ранг).

Рейтинг. В этом приеме оценка объекта производится путем усреднения оценочных суждений группой компетентных экспертов. Имея общие критерии оценки (в порядковой шкале, в баллах), эксперты независимо друг от друга (в устной или письменной форме) выносят свои суждения. Усредненный результат экспертной оценки является достаточно объективным и называется рейтингом.

Метод полярных профилей. Этот прием предполагает применение для оценки условной шкалы, крайними точными которой являются противоположные значения признака (например, добрый — злой, теплый — холодный и т. п.). Промежуток между полюсами делится на произвольное количество частей (баллов).

Пример. Оценка степени доверия кандидату на выборную должность дается в полярной шкале:

(Доверяю полностью) 10 – 9 – 8 – 7 – 6 – 5 – 4 – 3 – 2 – 1 (Совсем не доверяю)

3. Интервальная шкала (интервальное намерение) — это такое присвоение чисел объектам, когда определено расстояние между объектами и предусмотрена общая для всех объектов постоянная единица измерения. Иначе говоря, в интервальной шкале вводится единица и масштаб измерения. Нулевая точка шкалы выбирается произвольно.

Примеры: температурные шкалы; шкалы стандартизированного тестирования интеллекта.

Интервальная шкала – количественная. В ней возможны все арифметические действия над числами, кроме операции деления. Таким образом, в интервальной шкале нельзя определить во сколько раз один объект больше или меньше другого. Например, если ученик ответил правильно на 10 заданий, то это не означает, что он знает вдвое больше ученика, ответившего на 5 заданий теста.

4. Шкала отношений отличается от интервальной только тем, что ее нулевая точка не произвольна, а указывает на полное отсутствие измеряемого свойства. Сюда относятся и все количественные данные, получаемые пересчетом объектов какого-либо множества (число учащихся, уроков и т. п.).

Уровни измерения и математические вычисления, используемые на данных уровнях, показаны в табл. 1. Из этой таблицы видно, что переход от одного уровня к другому сопровождается расширением класса допустимых математико-статистических операций. Как следует из таблицы, наилучшей является шкала отношений, которую на сегодняшний день удалось реализовать только в рамках физических измерений.

Математические и статистические величины, вычисление которых допустимо на данном уровне

Мода, процентные частоты, доли, корреляция

Мода, медиана, квартили, коэффициент корреляции, дисперсионный анализ

Мода, медиана, квартили, коэффициент корреляции, ранговые критерии, средняя, дисперсия, стандартное отклонение, коэффициент корреляции

Все арифметические операции, все понятия и методы математической статистики

[1] Челышкова М.Б. Теория и практика конструирования педагогических тестов. – М., 2001, стр. 359

[2] Ермолаев О.Ю. Математическая статистика для психологов: Учебник/О.Ю. Ермолаев. – 2-е изд., исп. – М.: Московский психолого-социальный институт: Флинта, 2003, стр. 122 с.

Источник

Оцените статью
Разные способы