- Классификация
- Материал из MachineLearning.
- Содержание
- Типология задач классификации
- Типы входных данных
- Типы классов
- Классификация: формальная постановка
- Вероятностная постановка задачи
- Признаковое пространство
- Примеры прикладных задач
- Задачи медицинской диагностики
- Предсказание месторождений полезных ископаемых
- Оценивание кредитоспособности заёмщиков
- Классификация задач
- Классификация и анализ задач по их условию
- Библиографическое описание:
Классификация
Материал из MachineLearning.
Классификация — один из разделов машинного обучения, посвященный решению следующей задачи. Имеется множество объектов (ситуаций), разделённых некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется обучающей выборкой. Классовая принадлежность остальных объектов не известна. Требуется построить алгоритм, способный классифицировать произвольный объект из исходного множества.
Классифицировать объект — значит, указать номер (или наименование класса), к которому относится данный объект.
Классификация объекта — номер или наименование класса, выдаваемый алгоритмом классификации в результате его применения к данному конкретному объекту.
В математической статистике задачи классификации называются также задачами дискриминантного анализа.
В машинном обучении задача классификации относится к разделу обучения с учителем. Существует также обучение без учителя, когда разделение объектов обучающей выборки на классы не задаётся, и требуется классифицировать объекты только на основе их сходства друг с другом. В этом случае принято говорить о задачах кластеризации или таксономии, и классы называть, соответственно, кластерами или таксонами.
Содержание
Типология задач классификации
Типы входных данных
- Признаковое описание — наиболее распространённый случай. Каждый объект описывается набором своих характеристик, называемых признаками. Признаки могут быть числовыми или нечисловыми.
- Матрица расстояний между объектами. Каждый объект описывается расстояниями до всех остальных объектов обучающей выборки. С этим типом входных данных работают немногие методы, в частности, метод ближайших соседей, метод парзеновского окна, метод потенциальных функций.
- Временной ряд или сигнал представляет собой последовательность измерений во времени. Каждое измерение может представляться числом, вектором, а в общем случае — признаковым описанием исследуемого объекта в данный момент времени.
- Изображение или видеоряд.
- Встречаются и более сложные случаи, когда входные данные представляются в виде графов, текстов, результатов запросов к базе данных, и т. д. Как правило, они приводятся к первому или второму случаю путём предварительной обработки данных и извлечения признаков.
Классификацию сигналов и изображений называют также распознаванием образов.
Типы классов
- Двухклассовая классификация. Наиболее простой в техническом отношении случай, который служит основой для решения более сложных задач.
- Многоклассовая классификация. Когда число классов достигает многих тысяч (например, при распознавании иероглифов или слитной речи), задача классификации становится существенно более трудной.
- Непересекающиеся классы.
- Пересекающиеся классы. Объект может относиться одновременно к нескольким классам.
- Нечёткие классы. Требуется определять степень принадлежности объекта каждому из классов, обычно это действительное число от 0 до 1.
Классификация: формальная постановка
Пусть — множество описаний объектов, — конечное множество номеров (имён, меток) классов. Существует неизвестная целевая зависимость — отображение , значения которой известны только на объектах конечной обучающей выборки . Требуется построить алгоритм , способный классифицировать произвольный объект .
Вероятностная постановка задачи
Более общей считается вероятностная постановка задачи. Предполагается, что множество пар «объект, класс» является вероятностным пространством с неизвестной вероятностной мерой . Имеется конечная обучающая выборка наблюдений , сгенерированная согласно вероятностной мере . Требуется построить алгоритм , способный классифицировать произвольный объект .
Признаковое пространство
Признаком называется отображение , где — множество допустимых значений признака. Если заданы признаки , то вектор называется признаковым описанием объекта . Признаковые описания допустимо отождествлять с самими объектами. При этом множество называют признаковым пространством.
В зависимости от множества признаки делятся на следующие типы:
- бинарный признак: ;
- номинальный признак: — конечное множество;
- порядковый признак: — конечное упорядоченное множество;
- количественный признак: — множество действительных чисел.
Часто встречаются прикладные задачи с разнотипными признаками, для их решения подходят далеко не все методы.
Примеры прикладных задач
Задачи медицинской диагностики
В роли объектов выступают пациенты. Признаки характеризуют результаты обследований, симптомы заболевания и применявшиеся методы лечения. Примеры бинарных признаков: пол, наличие головной боли, слабости. Порядковый признак — тяжесть состояния (удовлетворительное, средней тяжести, тяжёлое, крайне тяжёлое). Количественные признаки — возраст, пульс, артериальное давление, содержание гемоглобина в крови, доза препарата. Признаковое описание пациента является, по сути дела, формализованной историей болезни. Накопив достаточное количество прецедентов в электронном виде, можно решать различные задачи:
- классифицировать вид заболевания (дифференциальная диагностика);
- определять наиболее целесообразный способ лечения;
- предсказывать длительность и исход заболевания;
- оценивать риск осложнений;
- находить синдромы — наиболее характерные для данного заболевания совокупности симптомов.
Ценность такого рода систем в том, что они способны мгновенно анализировать и обобщать огромное количество прецедентов — возможность, недоступная специалисту-врачу.
Предсказание месторождений полезных ископаемых
Признаками являются данные геологической разведки. Наличие или отсутствие тех или иных пород на территории района кодируется бинарными признаками. Физико-химические свойства этих пород могут описываться как количественными, так и качественными признаками. Обучающая выборка составляется из прецедентов двух классов: районов известных месторождений и похожих районов, в которых интересующее ископаемое обнаружено не было. При поиске редких полезных ископаемых количество объектов может оказаться намного меньше, чем количество признаков. В этой ситуации плохо работают классические статистические методы. Задача решается путём поиска закономерностей в имеющемся массиве данных. В процессе решения выделяются короткие наборы признаков, обладающие наибольшей информативностью — способностью наилучшим образом разделять классы. По аналогии с медицинской задачей, можно сказать, что отыскиваются «синдромы» месторождений. Это важный побочный результат исследования, представляющий значительный интерес для геофизиков и геологов.
Оценивание кредитоспособности заёмщиков
Эта задача решается банками при выдаче кредитов. Потребность в автоматизации процедуры выдачи кредитов впервые возникла в период бума кредитных карт 60-70-х годов в США и других развитых странах. Объектами в данном случае являются физические или юридические лица, претендующие на получение кредита. В случае физических лиц признаковое описание состоит из анкеты, которую заполняет сам заёмщик, и, возможно, дополнительной информации, которую банк собирает о нём из собственных источников. Примеры бинарных признаков: пол, наличие телефона. Номинальные признаки — место проживания, профессия, работодатель. Порядковые признаки — образование, занимаемая должность. Количественные признаки — сумма кредита, возраст, стаж работы, доход семьи, размер задолженностей в других банках. Обучающая выборка составляется из заёмщиков с известной кредитной историей. В простейшем случае принятие решений сводится к классификации заёмщиков на два класса: «хороших» и «плохих». Кредиты выдаются только заёмщикам первого класса. В более сложном случае оценивается суммарное число баллов (score) заёмщика, набранных по совокупности информативных признаков. Чем выше оценка, тем более надёжным считается заёмщик. Отсюда и название — кредитный скоринг. На стадии обучения производится синтез и отбор информативных признаков и определяется, сколько баллов назначать за каждый признак, чтобы риск принимаемых решений был минимален. Следующая задача — решить, на каких условиях выдавать кредит: определить процентную ставку, срок погашения, и прочие параметры кредитного договора. Эта задача также может быть решения методами обучения по прецедентам.
Источник
Классификация задач
В современной методической и психологической литературе принята классификация задач. По характеру требования:
— задачи на доказательство;
— задачи на построение;
— задачи на вычисление.
По функциональному назначению:
— задачи с дидактическими функциями;
— задачи с познавательными функциями;
— задачи с развивающими функциями.
По величине проблемности:
По методам решения:
— задачи на геометрические преобразования;
— задачи на векторы и др.
По числу объектов в условии задачи и связей между ними:
По компонентам учебной деятельности:
Виды задач и их функции:
Следует выделить несколько видов задач по их обучающей роли.
1) Задачи для усвоения математических понятий.
2) Задачи для овладения математической символикой.
3) Задачи для обучения доказательствам. Обучение доказательствам — одна из важнейших целей обучения математике.
4) Задачи для формирования математических умений и навыков.
5) Обучающую роль играют и задачи, предваряющие изучение новых математических фактов, концентрирующие внимание учащихся на вновь изучаемых идеях, понятиях и методах математики, задачи, с помощью которых вводятся новые понятия и методы, задачи, создающие проблемную ситуацию с целью приобретения учащимися новых знаний.
В задаче выделяют основные компоненты:
1. Условие — начальное состояние;
2. Базис решения — теоретическое обоснование решения;
3. Решение — преобразование условия задачи для нахождения требуемого заключением искомого;
4. Заключение — конечное состояние.
Этапы решения задач:
Процесс решения учебной задачи можно разделить на 4 основные этапы: осмысление условия задачи (анализ условия), поиск и составление плана решения, осуществление плана решения, изучение (исследование) найденного решения.
Источник
Классификация и анализ задач по их условию
Дата публикации: 25.02.2015 2015-02-25
Статья просмотрена: 1357 раз
Библиографическое описание:
Романкова, А. А. Классификация и анализ задач по их условию / А. А. Романкова, Е. И. Титова. — Текст : непосредственный // Молодой ученый. — 2015. — № 5 (85). — С. 524-526. — URL: https://moluch.ru/archive/85/15906/ (дата обращения: 18.11.2021).
Существует множество различных классификаций задач, но одна из них почти не находит отражения в действующих учебниках за редкими исключениями. Речь идёт о классификации по характеру условия задачи — определённые, неопределённые и переопределённые.
Учащимся преимущественно предлагаются задачи определённые, т. е. задачи, содержащие в условии ровно столько данных, сколько их требуется для получения ответа, не больше и не меньше. На наш взгляд, это не совсем правильно. Целью любого педагога стоит научить работать с задачей, а это подразумевает:
1) Составлять математическую модель задачи исходя из различных условий;
2) выбирать необходимые для решения величины из множества данных и осуществлять вариативный поиск данных, недостающих для решения задачи;
3) решать полученную математическую задачу;
4) анализировать найденные решения, сравнивать их, выбирать наиболее экономичные;
5) дать правильный ответ согласно условию задачи, так сказать, выход из математической модели.
В основном в процессе обучения выполняется лишь третий пункт, выделенных нами умений. Ученики редко задумываются над всеми данными, а анализу результата вообще не уделяют времени. Например, если вспомнить о задачах неопределённых и переопределённых, то таких в современных учебниках насчитывается не более полупроцента, да и тех учителя чаще всего не замечают.
Приятным исключением из указанного правила является учебник Н. М. Рогановского «Геометрия 7–9». Его автор предлагает задачи под рубриками, среди которых есть и такие: «Все ли возможные случаи рассмотрены?», «Достаточно ли данных для решения задачи?», «Сколько решений имеет задача?» и т. п. Естественно, задачи, предлагаемые под этими рубриками, соответствуют поставленному вопросу, т. е. имеют несколько вариантов реализации условия, несколько возможных путей решения, и количество данных в условии не обязательно является необходимым и достаточным для получения ответа.
В большинстве случаев у авторов других учебников такие задачи не встречаются. Однако, многие известные педагоги — исследователи считают использование таких задач полезным и необходимым. Например, В. А. Крутецкий в своей книге «Психология математических способностей школьников» приводит такую классификацию:
1. Задачи с несформированным условием — задачи, в которых имеются все данные, но вопрос задачи лишь подразумевается.
2. Задачи с избыточным условием — задачи, в которых имеются лишние данные, не нужные для решения, а лишь маскирующие необходимые для решения задачи данные.
3. Задачи с неполным составом условия — задачи, в которых отсутствуют некоторые данные, необходимые для решения задачи, вследствие чего дать конкретный ответ на вопрос задачи не всегда представляется возможным.
4. Задачи с противоречивым условием — задачи, содержащие в условии противоречие между данными.
В. А. Крутецкий описывает исследование, которое он с группой исследователей проводил во многих школах в течение 12 лет с 1955 по 1966 годы. Исследователи использовали задачи различных типов, среди которых были и приведённые в этой классификации, в качестве тестовых заданий для выявления психологических аспектов математических способностей школьников. По результатам этого исследования получилось, что сильные ученики справляются с задачами указанных типов практически самостоятельно, быстро, практически без помощи испытателя. Ученики средних способностей также неплохо справляются с подобными заданиями, однако для их решения им требуется больше времени и иногда наводящий вопрос, наталкивающий на решение. Слабые ученики практически не могли самостоятельно провести решение этих задач, не видели связи между объектами задачи, и даже с подсказкой испытателя не могли справиться с заданием. Следует отметить, что именно с указанными типами задач исследователи связывали наибольшие надежды.
В книге Д. Пойа «Как решать задачу» приводится похожая классификация, отличающаяся лишь тем, что в ней отсутствуют задачи с несформированным составом условия. Более того, в своей таблице, направленной в помощь решателю, Д. Пойа первыми пунктами поставил вопросы: Возможно ли удовлетворить условию? Достаточно ли условие для определения неизвестного? или недостаточно? или чрезмерно? или противоречиво? Вроде бы Пойа предполагает решение самых обычных, школьных задач, однако он не исключает возможности наличия некоторых «аномалий» в условии задачи, к существованию которых ученики должны быть готовы.
П. М. Эрдниев в своей книге «Преподавание математики в школе» предлагает использовать в обучении математике задачи с неполным составом условия ещё с младших классов, причём он считает, что использование таких задач (деформированных примеров, как он их называет) позволяет проводить обучение опережающими темпами, с их помощью можно коренным образом изменить мыслительные процессы решающего, превратив их в более сложные, более содержательные и потому лучше развивающие способности ученика.
У Н. В. Метельского встречается такая классификация задач. Между условием задачи (А) и её требованием (X) может быть различное соотношение, определяющее число решений. Обычно школьная задача имеет одно или несколько определённых решений и потому называется определённой. Этот тип задачи условно можно изобразить формулой импликации А = > X, которую будем понимать так, что условие А содержит достаточно и только достаточно данных для выполнения требования X.
Если из условия А какое — либо данное опустить, то получим неопределённую задачу. Она имеет бесконечное множество решений, зависящих от бесконечного множества значений той величины (параметра), которой принадлежало значение, выброшенное из условия.
Наконец, условие может содержать, кроме А, некоторое дополнительное данное, и тогда задача называется переопределённой. В частном случае это «лишнее» данное может вытекать из тех, что уже имеются в задаче, и тогда задача оказывается определённой задачей.
В остальных случаях переопределённая задача не имеет решения, поскольку её данные противоречат друг другу, несовместимы.
Основные функции задач в обучении выполняют определённые задачи, однако известную пользу, по мнению Н. В. Метельского, приносит учащимся знакомство с неопределёнными и переопределёнными задачами. Задачи из рассматриваемой классификации полезны тем, что: они не обладают алгоритмичностью решения, они активизируют умственную деятельность учащихся, заставляют их искать нестандартные подходы к решению задач, а также допускают как несколько способов решения, так и несколько решений вообще.
В подтверждение этого мнения интересные факты приводит в своей статье «Остроугольный или тупоугольный?» И. Дегтянникова. Она пишет: «Решая задачу, часто даже не задумываемся о реальности её условия. Поэтому правы те авторы, которые включают в свои учебники задачи с нереальными условиями. Это заставляет проверять условия у всех задач. Кроме того, нереальные задачи — это готовая проблемная ситуация».
Отсутствие указанных задач в школьных учебниках приводит к тому, что и учителя не ориентируют свои умения на такие задачи, в результате чего их педагогическая подготовка содержит изъяны. В заметке В. З. Игнатенко пишет об ошибке, найденной в учебнике Л. С. Атанасяна «Геометрия 7–9». В этом учебнике на с. 135 приведена задача 536 (б). Вот её текст: «Отрезок ВD является биссектрисой треугольника АВС Найдите ОС, если АВ = 30, АD = 20, ВD= 16 и Ð ВDС = ÐС». Вроде бы ничего особенного в этой задаче нет. Однако автор, проведя решение двумя различными способами, заметил, что ответы в них не совпадают. Попытка смоделировать треугольник с данными, указанными в задаче, показала, что данные содержали противоречие. Оказывается, маститые авторы популярного учебника, включив противоречивую задачу в свой учебник, не заметили её противоречивости, как не замечали её и тысячи учителей, несколько лет работавших по этому учебнику.
Итак, анализ литературных источников выявляет важную для математического образования проблему: многие педагоги — исследователи указывают на целесообразность использования в обучении задач с «аномальными» условиями, а авторы учебников на это указание почти не реагируют.
1. Акимова И. В., Буркина В. А., Титова Е. И. Моделирование задач с аномальным условием и методика пути поиска их решения // Современные проблемы науки и образования. — № 1, 2014г.
2. Буркина В. А., Титова Е. И. Методика работы с аномальными задачами// Молодой ученый. 2014. № 2 (61). С. 740–741.
3. Титова Е. И., Чапрасова А. В. Различные трактовки понятия «задача» и методика их решения// Молодой ученый. 2014. № 6 (65). С. 760–762.
4. Титова Е. И., Романкова А. А. Неопределенные задачи в школьном курсе математики// Вестник магистратуры. 2014. № 6–1 (33). С. 128–129.
Источник