Методы классификации
Методом классификации называют совокупность приемов (способов) разделения множества объектов. Различают два метода классификации: иерархический и фасетный.
Иерархический метод классификации — последовательное деление заданного множества на подмножества так, что все подмножества составляют единую систему классификации распределяемого множества. Эта система фиксирует и сходство, и различие между объектами.
То есть каждая группировка в соответствии с выбранным признаком (основанием деления), делится на несколько других группировок, которые по другому признаку делятся еще на несколько подчиненных группировок. Так между классификационными группировками устанавливается отношение подчинения (иерархии).
Схема иерархической классификации
Построение иерархической классификации объектов происходит в следующей последовательности:
- определяется множество объектов, которое необходимо классифицировать (множество людей, предприятий, процессов и др.) для решения конкретных задач;
- выделяются основные признаки (свойства, характеристики, показатели, параметры и др.), по которым множество будет разделяться на подмножества;
- устанавливается оптимальное число признаков, ступеней и глубина классификации;
- выбирается порядок следования признаков — уровень деления и их количество.
Чаще всего классифицируют в следующей последовательности: класс — подкласс — группа — подгруппа — вид — подвид — разновидности.
Наиболее существенными и сложными вопросами, возникающими при построении иерархической классификации, считаются выбор системы признаков, используемых в качестве основания деления, и определение порядка их следования.
В основу иерархической классификации закладываются признаки, являющиеся необходимыми в решении задач, для которых она создается.
При этом последовательность признаков определяется от общего к частному, с учетом приоритетной вероятности обращений к разным уровням деления при решении конкретных задач.
Примером использования данного метода классификации является классификационная схема, используемая в Общероссийском классификаторе продукции по видам экономической деятельности (ОКПД 2).
Основные преимуществ иерархической классификации заключаются в ее логичности, последовательности и хорошей приспособленности для ручной обработки информации.
А ее недостаток — малая гибкость структуры, обусловленная фиксированностью признаков (оснований деления) и заранее установленным порядком их следования. Включение новых уровней деления по дополнительным признакам весьма затруднительно (если не предусмотрены резервные емкости).
Кроме того, иерархический метод не позволяет агрегировать объекты по необходимому для конкретных задач сочетанию признаков, что еще раз подтверждает его негибкость.
Фасетный метод классификации (фр. facette — грань отшлифованного камня) — параллельное разделение множества объектов по одному признаку на отдельные, независимые друг от друга подразделения — фасеты.
Схема классификации фасетным методом
На рис. каждый из фасетов характеризует одну из особенностей распределяемого множества потребительных свойств — социальных, функциональных, экономических и т. п.
Как видно из приведенной выше схемы, фасетный метод классификации характеризуется тем, что множество объектов разделяется на независимые подмножества (классификационные группировки), обладающие определенными заданными признаками, необходимыми для решения конкретных задач.
Последовательность действий при построении фасетной классификации практически такая же, как и при построении иерархической: определяется множество объектов, выделяются основные признаки и группы признаков этого множества и выбирается порядок следования групп признаков (фасетов) и признаков-характеристик.
Для вычленения из множества объектов конкретного подмножества, обладающего определенными признаками, нужно выделить основные признаки-характеристики, всесторонне характеризующие объект и обеспечивающие его идентификацию, сгруппировать их по принципу однородности в фасеты и присвоить им коды, определить фасетные формулы для образования подмножеств.
Особенность фасетного метода состоит в том, что подмножества формируются по принципу от частного к общему: на основе различных наборов конкретных характеристик объекта формируются конкретные подмножества.
Из сказанного следует, что особенностью фасетного метода является то, что разные признаки не связаны между собой.
Действительно, как каждая грань камня существует независимо от других граней, так и разные классификационные группировки при фасетном методе независимы и не подчиняются друг другу.
Примером фасетного метода классификации может служить классификация лекарственных средств по срокам годности. Количество признаков можно увеличивать многократно: по упаковке, по изготовителям и т. п.
Каждая разновидность методов классификации характеризуется определенными преимуществами и недостатками, знание которых позволяет рационально применять эти методы с учетом целевого назначения.
Преимущества и недостатки иерархического и фасетного методов классификации (по М.А. Николаевой)
Таким образом, преимущества одного метода классификации выступают в качестве недостатков другого, т. е. обе разновидности дополняют друг друга. Поэтому в ряде случаев их используют совместно. Здесь можно говорить о системе классификации как о совокупности методов и правил классификации.
Правила классификации предназначены для выбора разновидностей метода и признаков, по которым осуществляется деление множества на подмножества.
Важнейшим правилом для иерархического и фасетного методов является выбор разновидности метода классификации в зависимости от ее целевого назначения.
Правила классификации объектов при иерархическом методе:
- разделение множества объектов начинают с наиболее общих признаков;
- разделение множества на подмножества на каждом уровне производят только по одному признаку, имеющему принципиальное значение для этого этапа деления;
- получаемые в результате деления группировки на каждом уровне относят только к одной вышестоящей группировке и не пересекаются, т. е. не повторяются;
- разделение множества осуществляют без пропусков очередного или добавления промежуточного уровня деления;
- классификацию производят таким образом, чтобы сумма образованных подмножеств составляла делимое множество.
Правила классификации объектов при фасетном методе:
- признаки в различных фасетах не пересекаются, т. е. каждый признак отличается от другого по наименованию, значению и кодовому обозначению;
- из общего числа фасетов, характеризующих объекты, выбираются только те, которые необходимы для решения поставленных задач, и устанавливается их последовательность (фасетная формула).
Рассмотренные методы классификации широко используются в товароведении медицинских и фармацевтических товаров при делении множества товаров на системные категории: роды, классы, группы и т. п. Эти методы могут применяться как независимо друг от друга, так и совместно.
Источник
Классы, множества, группы, системы
Описание предметной области (создание ее онтологии) начинается с выделения объектов и их классификации, которая традиционно заключается в составлении дерева классов-подклассов и приписывании к ним индивидов. При этом термин «класс», по сути, используется в значении «множество»: отнесение объекта к классу мыслится как включение его в качестве элемента в соответствующее множество. Цель этого текста показать, что такой унифицированный подход к описанию структуры предметной области является сильным упрощением и не позволяет зафиксировать разнообразие семантических отношений объектов.
Давайте рассмотрим три варианта классификации индивида Жучка:
- Животное – собака – лайка – Жучка.
- Служебная – ездовая – Жучка.
- Псарня – упряжка собак – Жучка.
Первую последовательность соподчиненных сущностей однозначно принято описывать через задание классов и подклассов: Жучка является индивидом класса «лайка», класс «лайка» – подклассом собак, а тот подклассом класса «животное». При этом класс «животные» трактуется как множество всех животных, а класс «лайки», как подмножество множества «собаки». Однако, такое описание, несмотря на то, что оно достаточно наглядно, содержательно является тавтологичным, самореферентным: индивида Жучку мы называем лайкой, если она входит в множество лаек, а само множество лаек определяем как совокупность всех индивидов лаек – то есть включение в множество содержательно дублирует поименование. К тому же описание класса-множества полностью исчерпывается описанием индивида, подпадающего под задающее класс понятие. Также следует отметить, что оперирование подобными классами-множествами не зависит от количества элементов в них: лайка Жучка будет лайкой даже тогда, когда она останется единственной, последней лайкой на Земле. Более того, оперировать такими классами-множествами мы можем даже при отсутствии индивидов в них: можно построить онтологию уже вымерших динозавров, помыслить класс, в который только в будущем войдет проектируемое уникальное устройство или построить модель предметной области мифических животных, героев сказок, хотя при этом мощность всех классов-множеств будет равна нулю.
Итак, если говорить о содержательной стороне анализируемой классификации (животное – собака – лайка – Жучка), то она (содержательная сторона) никак не может быть выражена через отношение множеств и подмножеств. В данном случае мы имеем дело с концептуализацией – выделением понятий и установлением родо-видовых отношений между ними. При этом фактическое число элементов концептуального класса, то есть объем понятия, не фигурирует при его определении и упоминается (да и то не содержательно) только, когда одно понятие («лайка») подпадает под другое («собака»), то есть когда выступает как вид рода. Да, мы можем констатировать, что объем понятия «собака» больше, чем объем понятия «лайка», но реальное числовое соотношение этих множеств не имеет никакого онтологического смысла. Превышение объемом класса объема подкласса при родо-видовых отношениях отражает лишь то, что по определению рода в него должно входить несколько видов – в противном случае эта классификация становится бессмысленной. То есть в родо-видовой концептуальной классификации нас интересует именно содержание понятий – чем вид «собака» отличается от вида «кот» (которое также подпадает под родовое для них понятие «животное»), а не то, как соотносятся объемы множеств рода и вида и тем более объемы видовых понятий («собака» и «кошка»). И чтобы отличать концептуальные классы от действительно счетных множеств, правильнее было бы говорить о подпадании индивида под понятие, а не о включении его в класс/множество. Ясно, что в формальной записи утверждения «подпадает под понятие Х» и «является элементом класса Х» могут выглядеть одинаково, но непонимание существенной разницы между двумя этими описаниями может привести к серьезным ошибкам в построении онтологии.
Во втором варианте (служебная – ездовая – Жучка) нас также не интересует сопоставление понятию «ездовая» какого-либо множества: смысловое содержание утверждения «Жучка – ездовая» не зависит от того, является ли она единственной ездовой или таковых много. Казалось бы, мы и здесь имеем дело с родо-видовыми отношениями: понятие «ездовая» можно рассматривать как видовое относительно родового понятия «служебная». Но связь индивида «Жучка» с понятием «ездовая» существенно отличается от связи с понятием «лайка»: второе, концептуальное, понятие имманентно и неизменно присуще индивиду, а первое отражает локальную во времени специализацию. Жучка не родилась ездовой и возможно с возрастом может перестать быть ею и перейти в разряд сторожевых, а под старость вообще потерять всякую «профессию». То есть, говоря о специализации, мы всегда можем выделить события приобретения и утраты связи с тем или иным понятием. К примеру, Жучка могла быть признана абсолютным чемпионом породы, а потом утерять это звание, что принципиально невозможно с концептуальными понятиями: Жучка от рождения и до смерти, то есть на всем временном отрезке своего существования как индивида, является собакой и лайкой. Так и человек остается концептом «человек» всю жизнь, но ситуационно (от события до события) может подпадать под специализирующие понятия «школьник», «студент», «врач», «муж» и пр. И как уже отмечалось, связь с этими понятиями ничуть не означает включение в некоторое множество (хотя это и может так выглядеть) – приписывание специализирующего понятия всегда есть результат конкретного отношения индивида с другими индивидами: поступление в школу, ВУЗ, получение диплома, регистрация брака и пр. Поэтому специализирующие понятия можно назвать еще реляционными. Из приведенных примеров следует еще одно существенное отличие концептуальной классификации от специализации: индивид может обладать несколькими специализациями (Жучка являться ездовой и чемпионом породы, человек студентом и мужем), но не может одновременно входить более чем в одну концептуальную иерархию (Жучка не может быть и собакой, и кошкой).
И только в третьем варианте описания Жучки – как принадлежащей к некоторой псарне и как члена конкретной упряжки, тянущей нарты по тундре – просто необходимо упоминание множества. Только в этом случае мы имеем право говорить, что индивид является элементом конкретного множества со счетным количеством элементов, а не подпадает под понятие, которое может быть представлено как абстрактное множество, условно фиксирующее объем этого понятия. И здесь принципиально, что индивид является частью другого индивида, исходно определяемого как множество: псарня и упряжка – это обязательно непустое множество собак, и количество элементов этого множества непременно входит в их определения как индивидов. То есть в данном случае следует говорить об отношении часть-целое: Жучка является частью псарни и частью упряжки. Более того, вхождение или невхождение Жучки в конкретную упряжку меняет ее (упряжки) содержание: если у нас была упряжка-двойка, то после изъятия Жучки, упряжка превращается в одинарную. В таких случаях мы имеем дело не просто со счетным множеством (собаки в псарне), а с индивидом, сущность которого меняется при изменении состава его элементов, определяется этим составом, то есть с системой. Если псарня – это просто индивид-группа, описываемый через множество входящих в него элементов, то упряжка – это система, сущность которой зависит от числа и специфики ее частей.
Следовательно, при построении онтологии предметной области можно выделить действительные объекты-множества, определяемые именно как совокупность некоторого числа индивидов. Таковы: класс в школе, товары в ящике на складе, детали блока электронного устройства и пр. И эти множества могут быть подмножествами других реальных счетных множеств: всех учеников школы, всех товаров на складе, всех деталей устройства. При выделении этих множеств существенно то, что они (эти множества) выступают как самостоятельные индивиды (коллектив, партия товара, комплект деталей), основным атрибутом которых является именно число входящих в них элементов. Причем изменение этого атрибута может привести к смене статуса объекта, скажем, при росте количества элементов превратить квартет в квинтет или полк в бригаду. Важно также, что описание этих объектов-множеств, сложных объектов не сводится к описанию входящих в них индивидов, хотя может включать указание на допустимый тип последних (струнный квартет, упряжка лошадей). И такие отношения – не между абстрактными множествами, а между множествами, являющимися индивидами, сложными объектами – точнее описывать как отношения часть-целое, а не класс-подкласс.
Итак, традиционная классификация индивидов через приписывание их к тем или иным классам-множествам не может считаться однородной. Следует различать (1) включение индивидов как частей в сложный объект (целое), семантическая специфичность которого не сводится к описанию его элементов. При этом (1.1.) объект-целое может рассматриваться лишь как поименованное множество индивидов (детали в упаковке, коллекция картин), для которой, по сути, важно лишь количество частей. Такие объекты возможно называть группами (или коллекциями). Также (1.2.) объект-целое может содержательно (а не только количественно) определяться своими частями и, как следствие, обладать атрибутами, которыми не обладают части. Такие целостности традиционно называют системами, а части систем – элементами. Вторым вариантом описания объектов через приписывание их к классам-подклассам является (2) подпадание индивидов под понятие, что лишь формально, тавтологично может быть описано как включение индивидов в множество мощность которого равна мощности понятия. Понятийное описание индивидов в свою очередь можно классифицировать на (2.1) концептуальное, глобально фиксирующее тип индивида, и (2.2) специализирующее (реляционное), локально во времени и пространстве (событийно) связывающее индивид с другими объектами.
Приведенные рассуждения, прежде всего, ставят вопрос о достаточности, адекватности традиционного подхода к описанию предметной области с использованием классификации, основанной на теории множеств. И предлагается вывод: для фиксации в онтологиях всего разнообразия связей объектов нужны более дифференцированные инструменты классификации (группы, системы, концептуальные и специализирующие понятия). Формализм теории множеств может использоваться только как локальное упрощение для нужд логического вывода, а не как основной метод описания.
Источник