Методы свертывания информации
Описание презентации по отдельным слайдам:
Описание слайда:
Методы свертывания информации
Аничков лицей, 16.09.2008
Описание слайда:
Основные методы свертывания информации
Выписки – почти дословное (иногда дословно) воспроизведение текста (обычно заносятся на карточки)
Тезисы – краткий вывод, главная мысль прочитанного; определение сущности прочитанного своими словами
Цепочка тезисов – скелет денотатной карты текста
Описание слайда:
Денотатная карта текста
структурная карта предмета, представленная системой понятий
Языковой знак
— десигнат (означаемое, содержание)
— денотат (означающее, выражение)
— коннотат
Описание слайда:
Основные методы свертывания информации
Дайджест – краткое изложение какой-либо информации
главные мысли автора, наиболее важные сообщаемые им факты и цифры не подвергаются изменениям
Конспект – краткое, но связанное и последовательное изложение существующего содержания статьи, главы книги.
Описание слайда:
Описание слайда:
Конспект
Непосредственное конспектирование
Опосредованное конспектирование
Селективный конспект
Сводный конспект
Описание слайда:
Селективный конспект
Прочесть текст целиком
Отметить в процессе чтения все места, имеющие отношение к интересующей вас теме
Перечитать эти места внимательно и понять (т.о. понят общий состав текста, содержательные и логические взаимосвязи имеющейся информации)
Сделать денотатную карту текста
Описание слайда:
Сводный конспект
Сделать селективные конспекты по каждой теме
Сравнить их и выделить совпадения и различия
Свести в одну денотатные карты
Пользоваться
Описание слайда:
Аннотация – краткая характеристика книги или статьи, раскрывающая ее содержание, назначение и другие особенности
Стандартная схема:
предметная рубрика (выходные данные; область знания, к которой относится труд; тема или темы труда);
поглавная структура труда (или, то же самое, «краткое изложение оглавления»);
подробное, поглавное перечисление основных и дополнительных вопросов и проблем, затронутых в труде.
Описание слайда:
«Чичиков и Молчалин преуспевают, живут в свое, откладывают копеечки на черный день и в то же время обделывают свои дела так искусно и так осторожно, что черные дни никогда не являются. Но Чичиков и Молчалин по своей благоразумной скромности, вовсе не желают обращать на себя, с какой бы, то ни было стороны и по какому бы, то ни было случаю, внимание своих современников и сограждан. Чичиков и Молчалин любят оставаться в тени и в неизвестности, потому что их мелкие предприятия требуют для своего процветания мрака и тишины…»
…Внимательный наблюдатель может и должен узнавать своих старых знакомых, несмотря на их новые костюмы, манеры, разговоры…Молчалиным и Чичиковым следует признавать каждого человека, у которого нет в жизни никакой другой цели, кроме приобретения и упрочивания личного довольства и комфорта.
Описание слайда:
«Чичиков и Молчалин преуспевают, живут в свое, откладывают копеечки на черный день и в то же время обделывают свои дела так искусно и так осторожно, что черные дни никогда не являются. Но Чичиков и Молчалин по своей благоразумной скромности, вовсе не желают обращать на себя, с какой бы, то ни было стороны и по какому бы, то ни было случаю, внимание своих современников и сограждан. Чичиков и Молчалин любят оставаться в тени и в неизвестности, потому что их мелкие предприятия требуют для своего процветания мрака и тишины…»
…Внимательный наблюдатель может и должен узнавать своих старых знакомых, несмотря на их новые костюмы, манеры, разговоры…Молчалиным и Чичиковым следует признавать каждого человека, у которого нет в жизни никакой другой цели, кроме приобретения и упрочивания личного довольства и комфорта.
Описание слайда:
Писатель-фантаст Жюль Верн много часов в день тратил на изучение научной литературы, чем и объясняется «удивляющая» читателей осведомленность романиста в самых разнообразных областях науки и техники. Жюль Верн как бы представлял собой институт научной информации современных ему знаний. Составленной им картотеки из 20 тысяч карточек могло бы позавидовать и ученое общество.
Описание слайда:
Писатель -фантаст Жюль Верн много часов в день тратил на изучение научной литературы, чем и объясняется «удивляющая» читателей осведомленность романиста в самых разнообразных областях науки и техники. Жюль Верн как бы представлял собой институт научной информации современных ему знаний. Составленной им картотеки из 20 тысяч карточек могло бы позавидовать и ученое общество.
Описание слайда:
Каким образом птицы узнают друг друга? Важное значение имеет, конечно, зрение, но как показал ряд экспериментов, одного зрения мало.
Ведущую роль играет ритм звуковых сигналов, которыми обмениваются птицы (то, что мы называем пением).
У каждого вида свои песни. Отличаются они строением, структурой сигнала и не только самими звуками, но и их продолжительностью, чередованием, величиной интервалов между ними. У большинства видов решающая роль в опознании принадлежит первым двум нотам сигнала: они должны быть постоянными так же, как и интервалы между ними. Так обстоит дело у черных дроздов, зяблика, чайки.
Описание слайда:
Каким образом птицы узнают друг друга? Важное значение имеет, конечно, зрение, но как показал ряд экспериментов, одного зрения мало.
Ведущую роль играет ритм звуковых сигналов, которыми обмениваются птицы (то, что мы называем пением).
У каждого вида свои песни. Отличаются они строением, структурой сигнала и не только самими звуками, но и их продолжительностью, чередованием, величиной интервалов между ними. У большинства видов решающая роль в опознании принадлежит первым двум нотам сигнала: они должны быть постоянными так же, как и интервалы между ними. Так обстоит дело у черных дроздов, зяблика, чайки.
Описание слайда:
Каждая эпоха, каждое событие накладывает свою печать на выразительность художественной формы архитектурных сооружений, которые являются каменной летописью города, можно даже сказать — каменной летописью мира, так как архитектура говорит о развитии культуры прошлого не существующего уже народа.
Для того, чтобы получить необходимые сведения о древних зданиях, надо «разговорить» камни, из которых они построены. Ведь камни являются немыми свидетелями той эпохи, когда строилось здание. И вот для того, чтобы получить информацию, которую таят в себе строительные камни, надо уметь прочесть «непонятные» надписи, начертанные на них временем. А как? В этом нам помогут история, древнерусская архитектура, а также геология и палеонтология.
Описание слайда:
Каждая эпоха, каждое событие накладывает свою печать на выразительность художественной формы архитектурных сооружений, которые являются каменной летописью города, можно даже сказать — каменной летописью мира, так как архитектура говорит о развитии культуры прошлого не существующего уже народа.
Для того, чтобы получить необходимые сведения о древних зданиях, надо «разговорить» камни, из которых они построены. Ведь камни являются немыми свидетелями той эпохи, когда строилось здание. И вот для того, чтобы получить информацию, которую таят в себе строительные камни, надо уметь прочесть «непонятные» надписи, начертанные на них временем. А как? В этом нам помогут история, древнерусская архитектура, а также геология и палеонтология.
Если Вы считаете, что материал нарушает авторские права либо по каким-то другим причинам должен быть удален с сайта, Вы можете оставить жалобу на материал.
Источник
8. Свёртывание информации
В науке мы постоянно сталкиваемся с различными «свёртками» и «сгустками» информации. Это законы, теоремы, постулаты и прочие формы сконцентрированных знаний, являющиеся результатом обобщения («свёртывания») иногда огромного фактического материала.
Под свёртыванием (развёртыванием) информации понимается изменение физического объёма документа в результате аналитико-синтетической переработки, сопровождающееся уменьшением (увеличением) его информативности.
Подобно анализу и синтезу, свёртывание и развёртывание информации — это взаимозависимые и взаимопереходящие операции. Логично предположить, что эти операции в научной деятельности являются отражением процессов и явлений, наблюдаемых в природе: ассимиляция и диссимиляция, соединение атомов и их диссоциация и т. п. Поэтому обычно, употребляя понятие «свёртывание», подразумевают и «развёртывание». Можно предположить, что вся эволюция — это последовательное чередование свёртывания и развёртывания, с которыми человечество столкнулось на самых ранних этапах развития цивилизации. В попытках коротко и ясно выражать свои мысли часто для обозначения одной и той же сущности употребляют различные термины: «сжатие», «уплотнение», «компрессия», «конденсация», «кумуляция», «минимизация», «упрощение». Эти синонимические варианты не все полностью идентичны понятию «свёртывание».
В монографии [15] разновидности свёртывания представлены в виде следующей схемы (см. рис.1).
Из схемы видно, что свёртывание подразделяется на научное и инф ор м ационно е.
Кратко остановимся на научном свёртывании. Известно, что в развитии знания как системы наблюдается тенденция не только к увеличению его количества, но и к относительному уменьшению этого количества за счёт повышения информационной ёмкости научных сведений. Этот процесс называют уплотнением знания, он приводит к порождению новых семантических единиц, понятий, теорий, законов, принципов и др. Научное свёртывание связано с качественной стороной роста количества знаний, в отличие от количественной стороны этого роста, обусловливающего увеличение фактуального фонда знаний, что характерно для экстенсивного пути развития науки. «Экспликация» (в случае развёртывания) этих
семантических единиц, полученных в одной какой-либо области знаний, распространяется на другие области.
Свёртывание
Семантическое
Лексическое
в языке
в речи
переводом в иную систему понятий
Переводом в иную знаковую систему
Рис 1. Разновидности свёртывания
Устранение недостоверных фактов и ошибочных концепций (в результате практической деятельности в форме критических статей, рецензий, аналитических обзоров, научных дискуссий и т. п.) приводит к уменьшению объёма активного фонда науки, которое понимается как конденсация знаний. Если явление уплотнения знаний развивается преимущественно в недрах системы знаний, то конденсация знаний в значительной своей части протекает в системе научных коммуникаций, составляя основу концептографического информационного обслуживания.
8.1. Виды информационного свёртывания
Свёртывание (развёртывание) в сфере информационных коммуникаций рассматривается как информационное свёртывание, которое может быть семантическим и лексическим. Семантическое свёртывание связано с изменением информативности сообщения. Семантическое свёртывание в
языке — это стихийный процесс терминообразования, в ходе которого возникают понятия более краткие, чем нх синонимические предшественники. Например, электронно-вычислительная машина и компьютер. Семантическое свёртывание в речи связано или с изменением информативности путём обобщения или опущения некоторых деталей, подробностей, уточнений (случай 1), или с изменением информативности путём перевода в иную систему понятий (случай 2). Примером высокого уровня обобщения больших фрагментов текстов могут служить заголовки н подзаголовки в документах, фразы в аннотациях, тезисы к докладам н т. д. Пример свёртывания в случае 2:
Синонимы — снова, отличающиеся друг от друга звуковой формой, стилистической окраской, но совпадающие, сходные или очень близкие по значению, выражающие одно и то же понятие.
Синонимы -разные знаки, имеющие общий денотат.
При лексическом свёртывании производится преобразование знаковой формы сообщения с сохранением его информативности. Здесь необходимо сделать два уточнения. 1). Преобразование знаковой формы, дающее эффект сокращения числа используемых символов, может повысить ёмкость знания, что связано с семантическим свёртыванием. 2). В отдельных случаях в результате лексического свёртывания информативность может даже возрастать за счёт повышения «читабельности» текста (путём опущения неинформативных, паразитных слов, упрощения синтаксической конструкции и т. п.).
Различают следующие способы лексического свёртывания (с сохранением информации в полном объёме):
Опущение (исключение, отбрасывание) — пропуск слова или словосочетания без ущерба для смыслового содержания текста реферата. Пропуску подлежат сведения аргументирующего характера, поясняющие н иллюстрирующие основные положения первичного документа. Пропуску подлежат также слова типа «данная статья», «настоящая работа», «итак», «таким образом», «следовательно», «например», «в частности», «в том числе», «при этом» и т. п. (Пример: В котором часу начинается лекция ? — В первом);
Совмещение — операция, при которой два или несколько предложений, содержащих совпадающие (тождественные) элементы, накладываются друг на друга, образуя более короткую конструкцию, где тождественные компоненты называются только один раз. При этом все связи с нетождественными частями совмещённых предложений сохраняются.
Замещение — замена повторяющегося или неповторяющегося фрагмента текста (предложения, его части, словосочетания) более коротким, с сохранением в последнем необходимого уровня смысла первого (например, замена местоимением слова или выражения, применение более коротких синонимичных вариантов). Замещение обеспечивает ясность и понятность текста. Эта операция используется также в случаях, когда экстрагированное
предложение содержит слова типа «эти», «такие», «подобный», «вышеприведённый», «рассмотренный ранее» и т. п. Их значение следует непременно раскрыть, сделав «шаг назад» (то есть отыскать в тексте первичного документа соответствующий этим словам фрагмент). Рассматриваемый приём используется также и в том случае, когда маркированное предложение, включённое в реферат-экстракт, содержит сокращения или аббревиатуры, смысл которых может быть неясен читателю.
На этапе редактирования реферата могут использоваться одновременно все операции, то есть опущение, совмещение и замещение.
Использование операций опущения, замещения и совмещения при
редактировании предложений, подлежащих включению в реферат [1]
Предложения, включенные в реферат-экстракт
Проанализируем опыт работы с базами ВИНИТИ
Анализируется опыт работы с базами данных ВИНИТИ
Методика рассчитана на отработку навыков управления самолетом при СМУ
Методика рассчитана на отработку навыков управления самолётом при сложных метеорологических условиях
В данной работе предлагается количественный метод оценки информативности научных документов
Предлагается количественный метод оценки информативности научных документов
Таким образом, эксперимент, описанный в данной статье, показал, что больше половины информации, содержащейся в научных книгах, нельзя выявить из-за ограниченных поисковых возможностей каталогов
Эксперимент показал, что больше половины информации, содержащейся в научных книгах, нельзя выявить из-за ограниченных поисковых каталогов
Нами будут рассмотрены роль и место персональных ЭВМ в информационно — библиотечной технологии
Рассматривается роль и место персональных ЭВМ в информационно — библиотечной технологии
Предпринята попытка оценить творческую активность сотрудников НИИ, При этом, в качестве показателя творческой активности сотрудников НИИ использовалось отношение числа оригинальных публикаций к суммарному числу оригинальных и повторных публикаций
Предпринята попытка оценить творческую активность сотрудников НИИ, использовав в качестве её показателя отношение числа оригинальных публикаций к суммарному числу оригинальных и повторных публикаций
ЗАМЕЩЕНИЕ + ОПУЩЕНИЕ + СОВМЕЩЕНИЕ
В данной стать е авторы описывают способ раскроя круглого леса на доски резанием. Предлагаемый способ раскроя резанием отличается тем, что подлежащее раскрою бревно подают на неподвижный нож со скоростью, превышающей скорость расщепления древесины
Описывается способ раскроя круглого леса на доски резанием, при котором подлежащее раскрою бревно подают на неподвижный нож со скоростью, превышающей скорость расщепления древесины
К этим видам лексического свёртывания можно также добавить применение аббревиатур, условных сокращений и пр. Возможно, в качестве одной из форм лексического свёртывания можно рассматривать употребление метафор, но для научно-технической литературы этот приём не представляет большого интереса.
В общем случае информационное свёртывание направлено на экономию смысла и языковых средств, но при этом текст не просто сокращается, а «сворачивается», причём так, чтобы затем его можно было бы снова развернуть (на основе сохранённых «смысловых вех», «опорных пунктов», «следов»). Содержащаяся в квалифицированном реферате информация должна позволить потенциальному потребителю настолько развернуть в своём тезаурусе информацию, чтобы принять на этой основе правильное решение по вопросу использования первоисточника. Поэтому качество свёртывания определяется, главным образом, тем, насколько оно богато потенциальными возможностями развёртывания.
При свёртывании (развёртывании) документа мы получаем новый документ (в общем случае вторичный). Операция «свёртывание информации» при этом может быть не единственной операцией аналитико-синтетической переработки документа наряду с дословным извлечением (или опущением), сокращением или, наоборот, добавлением фраз (или фрагментов), изменением логической структуры документа и т. д. Например, при свёртывании документа из него могут быть извлечены отдельные фрагменты на «нулевом» уровне свёртывания информации. Нулевой уровень
свёртывания документа, видимо, невозможен (если не считать перевод документа, то есть преобразование его в иную знаковую систему).
8.2. Способы раскрытия содержания текста в процессе свёртывания
Развитие способов раскрытия содержания текстов в процессе свёртывания шло в основном в двух направлениях.
Первое, традиционно развиваемое библиографией, это поиски более совершенных способов «ручного» (интеллектуального) свёртывания. В русле этого направления возникли аспектные (или анкетные) методы реферирования, предусматривающие разбиение первоисточника на определённые содержательные аспекты. Были предложены многочисленные аспектные сетки (перечни аспектов) как универсального и отраслевого характера, так и рассчитанные на различные типы и виды документов. Примеры таких перечней рассмотрены в главе 7.
В некоторых методиках, основанных на использовании аспектных сеток, указывается важность тех или иных аспектов для включения их во вторичный документ, иногда — примерный уровень свёртывания. Иными словами, были сделаны попытки создания моделей вторичных документов для различных отраслей знания.
Применение аспектных методов свёртывания повысило качество вторичных документов. Положенный в их основу принцип анализа первоисточника оказался плодотворным и для разработки более совершенных формализованных методик свёртывания.
Однако эти методы имеют свои недостатки. С одной стороны в них имеет место постоянное обращение к интуиции референта с требованием выделить в первоисточнике «существенную информацию» — без разъяснения, что же это такое «существенная информация» и без каких-либо указаний на то, как её выделять. С другой стороны, наблюдается стремление сделать методики (и перечни аспектов) как можно более детальными, что постоянно наталкивается на сопротивление референтов, так как слишком детальные методики значительно усложняют процесс реферирования.
Другое направление в свёртывании, развиваемое в настоящее время преимущественно в сфере информатики, предусматривает разработку формализованных методов анализа содержания документов. В основе этого направления лежат попытки изыскания в плане выражения текстов (в его лексике, грамматике, логической структуре и т. п.) элементов, через которые можно было бы выразить план содержания данного текста, то есть его семантику. Эти методы открывают перспективы широкого внедрения в процессы аналитико-синтетической переработки информации электронно-вычислительной техники, что даёт возможность перевести некоторые виды
свёртывания «на рельсы» машинной технологии. Поэтому предлагаются более «жёсткие» алгоритмы (избирательное свёртывание текстов), в которых для каждого типа и жанра документа указывается своя процедура свёртывания. В результате в «свёртке» отражаются те элементы формальной и содержательной структуры исходного текста, которые играют активную роль в процессе информационного поиска.
Параллельно с разработкой алгоритмов, регламентирующих деятельность человека в процессах свёртывания, ведётся работа по автоматизации реферирования и аннотирования. Работы по автоматическому индексированию вышли на уровень «промышленной эксплуатации» уже в 1970 г., когда впервые в мире был применён метод пословного автоматического индексирования.
Источник