Контент анализ что это кратко

Обновлено: 29.06.2024

КОНТЕНТ-АНАЛИЗ, количественный анализа текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей.

Основная идея контент-анализа проста и интуитивно наглядна. При восприятии текста и особенно больших текстовых потоков мы достаточно хорошо ощущаем, что разные формальные и содержательные компоненты представлены в них в разной степени, причем эта степень по крайней мере отчасти поддается измерению: ее мерой служит то место, которое они занимают в общем объеме, и/или частота их встречаемости. Через все выступления X-а красной нитью проходит тема Y; X постоянно обращался в своей речи к проблеме Y; Он не упускал ни одного случая, чтобы не лягнуть Z-а; Ну, задудел в свою дуду, – все эти выражения, число которых можно легко увеличить, свидетельствуют об осознании нами такого феномена, как наличие в изливающемся на нас информационном потоке некоторых настойчиво повторяющихся тем, образов, ссылок на проблемы, оценок, утверждений (Карфаген должен быть разрушен или Российская экономика задыхается без инвестиций), аргументов, формальных конструкций, конкретных имен и т.д. Более того, подобно тому как в мире механики мы ощущаем не скорость, а ускорение, так и при восприятии текста мы особенно хорошо осознаем именно динамику содержания – те случаи, когда, например, кого-то вдруг перестают или начинают бранить или когда в текстах вдруг появляется какая-то новая тема.

С точки зрения лингвистов и специалистов по информатике, контент-анализ является типичным примером прикладного информационного анализа текста, сводящегося к извлечению из всего разнообразия имеющейся в нем информации каких-то специально интересующих исследователя компонентов и представлению их в удобной для восприятия и последующего анализа форме. Многочисленные конкретные варианты контент-анализа различаются в зависимости от того, каковы эти компоненты и что именно понимается под текстом.

Начиная с 1950-х годов контент-анализ как исследовательский метод активно используется практически во всех науках, так или иначе практикующих анализ текстовых источников – в теории массовой коммуникации, в социологии, политологии, истории и источниковедении, в культурологии, литературоведении, прикладной лингвистике, психологии и психиатрии. Разнообразие конкретных проектов, реализованных за примерно 70-летнюю историю интенсивного использования контент-анализа, очень велико. Среди интересных проектов, выполненных за последние годы в России, можно назвать исследование образов и метафор, использовавшихся в 1996–1997 в ходе развернутой тогда в российской прессе дискуссии о национальной идее, а также выполненный в тот же период анализ текстов левонационалистической оппозиции. Локальные контент-аналитические проекты периодически реализуются в ходе различного рода социологических мониторингов – общенациональных и региональных.

Наиболее широкое распространение контент-анализ получил в теории массовой коммуникации, политологии и социологии. Этим отчасти объясняется тот факт, что иногда этот термин используется как обобщающий для всех методов систематического и претендующего на объективность анализа политических текстов и текстов, циркулирующих в каналах массовой коммуникации. Однако такое расширительное понимание контент-анализа неправомерно, поскольку существует ряд исследовательских методов – либо специально разработанных для анализа политических текстов (например, метод когнитивного картирования), либо применимых и применяемых для этой цели (например, метод семантического дифференциала или различные подходы, предполагающие изучение структуры текста и механизмов его воздействия), – которые не могут быть сведены к стандартному контент-анализу даже при максимально широком его понимании.

ТИПЫ ИНФОРМАЦИОННЫХ МАССИВОВ И ЕДИНИЦЫ КОНТЕНТ-АНАЛИЗА

Основа контент-анализа – это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать; иными словами, определение единиц анализа.

Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано. Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова.

С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. – иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения.

Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.

Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, скажем, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Идентификация и подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко; подсчет, скажем, листовок или книг чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки, т.е. реально используются единицы других, характеризуемых ниже типов единиц – обычно концептуальных, пропозициональных или тематических.

Б. Структурно-семиотические единицы.

Под таковыми имеются в виду основные элементы семиотических систем (см. СЕМИОТИКА). В случае естественного языка это:

– лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и

– грамматические показатели (например, отрицательные частицы или показатели таких категорий, как, скажем, отглагольные имена).

Контент-анализ грамматических категорий представляет собой достаточно редкое исследовательское начинание, стимулом к которому является гипотеза (весьма правдоподобная) о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым (или, напротив, сложным) является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа всегда, никогда, всякий, которым противостоят квантификаторы типа иногда, некоторый и т.п.; категорические (вроде знаменитого однозначно) оценки истинности в противоположность осторожным возможно или не исключено, что; языковые средства дифференцированного рассмотрения ситуации наподобие с одной стороны. с другой стороны; упоминания взаимодействия, баланса, взаимозависимости, компромисса и т.д.

Известны и примеры контент-анализа чисто грамматических средств, например исследования соотношения глагольных форм, обозначающих, соответственно, процессы и результаты, исследование номинализованных (с отглагольными именами типа построение, усиление и т.п.) конструкций в языке партийных документов брежневского времени, отрицания в политическом тексте и др.

Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.

В. Понятийно-тематические единицы.

Г. Референциальные и квазиреференциальные единицы.

Д. Пропозициональные единицы и оценки.

Их примеры приводились выше – Карфаген должен быть разрушен или Россия задыхается без инвестиций. Собственно говоря, это примеры высказываний, в основе которых лежат пропозиции – описания конкретных положений дел (ситуаций) безотносительно к их модальности (в первом примере – требование, во втором – констатация). Наряду с пропозициями для контент-анализа могут представлять (и очень часто представляют) большой интерес оценки (Это очень опасное решение). С логической точки зрения они обладают важными отличиями от пропозиций, однако для целей контент-анализа как собственно пропозиция, так и оценка могут рассматриваться как результат связывания некоторого объекта с некоторым атрибутом. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, – весьма распространенный тип контент-аналитического исследования.

Е. Макроструктурные единицы.

Ж. Единицы, представляющие результаты концептуальных операций.

Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше.

Не менее диагностичным может быть исследование динамики примеров и аналогий – так, в российских политических текстах до недавнего времени настойчиво повторялась аналогия (принадлежащая В.Янову), в рамках которой Россия сравнивалась с Веймарской республикой.

Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности – например, каламбуров, аллитераций и т.п.

ЧАСТОТНЫЕ И СИСТЕМНЫЕ ХАРАКТЕРИСТИКИ В КОНТЕНТ-АНАЛИЗЕ

Единицы, категории и признаки.

При том, что контент-анализ является в своей основе количественным методом, в нем, как уже говорилось, почти всегда присутствует и значительная качественная составляющая. В принципе это верно уже постольку, поскольку единицы контент-анализа, как видно из предыдущего раздела, чаще всего все же являются содержательными и их выделение основывается на семантических (смысловых) критериях; многие из единиц представляют собой обобщенные категории (это относится прежде всего к темам и идеологемам). Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч.Осгудом шкалы абстрактности (фактически – трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателя или читателей, а какие-то могут представлять лишь досужий интерес). В сочетании с результатами собственно контент-анализа оценка использованных единиц анализа (тематических) по указанным шкалам дает трехмерную схему типа, например, той, что была предложена французским культурологом А.Молем. Очевидно, что при анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории.

Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него – об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки – традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент-анализа традиционными социологическими методами.

Рейдовый анализ, в противоположность фронтальному, ориентирован на решение частных и порой довольно экзотических задач, вытекающих, как правило, из каких-то скорее исследовательских, нежели прикладных интересов, и применительно к нему проблема выборки решается в связи формулировкой этих исследовательских целей и определением единиц анализа. Обоснование выборки при этом производится с учетом стандартных социологических критериев, но может допускать и их нарушение; важно лишь, чтобы факт этого нарушения осознавался и необходимость нарушения специальным образом обосновывалась.

Обработка, презентация и интерпретация результатов.

Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или, скажем, обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств – диаграмм, графиков и т.д., обеспечивающих наглядность.

Наглядность, следует заметить, важна не только для аналитика: наглядная диаграмма или впечатляющий график обладают большим потенциалом воздействия, особенно в обществе, привыкшем с почтением относиться к естественнонаучному инструментарию.

Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы.

Квантификация данных, естественно, создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Если при определении единиц контент-анализа и идентификации их в тексте добиться полной объективности возможно лишь в некоторых (как правило, не самых интересных) случаях, то при экспликации и обработке данных обеспечить следование строгим стандартам вполне возможно.

Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены политологической квалификацией и интуицией аналитиков.

Павел Паршин

Моль А. Социодинамика культуры. М., 1973
Мангейм Дж., Б. Рич Р.К. [и др.]. Политология: методы исследования. М., 1997
Дука А.В. Политический дискурс оппозиции в современной России. – Журнал социологии и социальной антропологии. 1998, т. 1
Серио П. Русский язык и анализ советского политического дискурса: анализ номинаций. – Квадратура смысла: французская школа анализа дискурса. М., 1999
Баранов А.Н. Введение в прикладную лингвистику. М., 2000

Включает в себя:

- выделение системы опорных понятий (категорий анализа);
- отыскание их индикаторов - слов, словосочетаний, суждений и т. п. - (единиц анализа);
- статистическую обработку данных.

Данный метод зародился в 20-е годы в американской журналистике как средство количественно-качественного изучения содержания прессы. В настоящее время активно применяется в социальной психологии, социологии, психодиагностике, политологии, психологии рекламы и пропаганды.

К числу его несомненных достоинств относятся возможность точной регистрации внешне неразличимых показателей в объемных массивах эмпирических данных, способность к выявлению скрытых тенденций и закономерностей, допустимость осуществления отсроченного по времени анализа событий и ситуаций, относительная объективность процедур и надёжность результатов, отсутствие проявлений эффекта воздействия исследователя на поведение испытуемых.

По сути, контент-анализ предполагает перевод качественно представленной информации на язык счета. Для этого необходимо, во-первых, иметь достаточно объемный и содержательно богатый текст, а во-вторых, обладать определенным уровнем исследовательской подготовленности, позволяющим эффективно реализовать потенциал данного метода.

Наряду с этим следует помнить, что контент-анализу присущи и некоторые ограничения. Так, известно, что характер информации во многом определяется замыслами ее автора и спецификой форм предъявления. Поэтому вполне возможно принятие исследователем вымысла за документальность или упущение каких-либо существенных данных вследствие недостаточной выраженности их в обрабатываемом материале. Искажения информации могут возникать и по вине исследователя, неспособного, к примеру, адекватно выделить категории анализа или учесть все имеющиеся варианты их словесного выражения. Кроме того, далеко не всякий материал поддается необходимой формализации. Предельно трудно было бы применить данный метод, скажем, к описанию поведения лирического героя поэтического произведения.

Описывая особенности применения контент-анализа, принято указывать меру устойчивости полученных сведений при замене кодировщиков (лиц, регистрирующих параметры и признаки) и давать характеристики, степени согласованности результатов этого метода с иными, собранными другими способами. Рассмотрим содержание основных этапов контент-анализа.

1. Подготовительный этап (разработка программы анализа материала)

Он включает постановку цели исследования, предварительную проверку адекватности избранного метода особенностям предстоящей работы, составление классификатора (опорной схемы для контент-анализа), подготовку инструкций для лиц, участвующих в реализации метода, пилотажное исследование, последующую коррекцию программы.

Особое внимание следует здесь обратить на составление классификатора, представляющего собой перечень категорий анализа, соответствующих им индикаторов, принятых единиц счета. Это основа алгоритма последующих действий, от качества которой зависит эффективность работы в целом.

Главное, чтобы список категорий был предельно исчерпывающим, а также давал возможность однозначного соотнесения той или иной части текста с конкретной категорией.

Единицы анализа или индикаторы, признаки выраженности смысловых единиц, представляют собой части текста, характеризующиеся принадлежностью к определенной категории. Это могут быть символы, слова, термины, сочетания слов различной протяженности, ситуации, суждения, реплики, интонации и т. д. Это тот материал, который позволяет судить о значении в тексте каждой категории.

Следует помнить, что одна и та же категория бывает выражена в тексте по-разному: от отдельных символов или слов до законченных суждений или абзацев. Поэтому выделение единиц анализа является непростым делом и требует от исследователя вдумчивости и проницательности.

Помимо того, необходимо учитывать, что категория может быть представлена в тексте различными по знаку единицами анализа. Например, в отрицательной (критической), нейтральной или же положительной форме. Разумеется, количество вариантов такого рода отношений бывает и более разнообразным.

Единицы счета - это количественные характеристики отношений категорий друг к другу или единиц анализа к категориям. В практике исследований обычно используют два их варианта:

- частоту проявлений в тексте категории или ее признака;
- пропорцию представленности категории (её признака) или, иначе, объём внимания, уделяемый ей автором текста.

Так, это может быть: сравнительное количество печатных знаков, площадь соответствующих частей текстов (в квадратных единицах или процентах), необходимое время произнесения и т.д.

Разработка классификатора завершается составлением инструкций кодировщику и подготовкой кодировочной матрицы.

Инструкции содержат предельно четкие указания на то, каковы все выделенные категории, какой набор признаков в тексте соответствует каждой из них, какого типа единицы счета при этом используются. Объективность результатов контент-анализа будет более полной, если исследователь письменно сформулирует инструкции даже в том случае, когда он сам является кодировщиком.

Пилотажное исследование, завершающее подготовительный этап контент-анализа, способствует выявлению недостающих категорий, упущенных из виду единиц анализа, неточностей инструкций.

2. Исполнительный этап

Кодировщики могут допускать здесь такие ошибки как:

- неверное соотнесение единиц анализа с категориями;
- пропуск тех или иных единиц анализа;
- фиксация того, чего нет на самом деле.

Все это нарушает устойчивость результатов контент-анализа. Причины низких показателей устойчивости следует искать в качестве инструкций, недостаточной умелости кодировщиков, в неподходящей обстановке их работы, наконец, в отсутствии внимательности, терпения или добросовестности.

3. Этап обработки данных

Содержание его определяется целью исследования. В зависимости от этого при обработке результатов (одной или нескольких кодировочных матриц) могут быть использованы частотные или процентные распределения, коэффициенты корреляции, сопоставительные таблицы и т.д.

В тех случаях, когда анализируется большой массив данных, иногда используются специальные математико-статистические способы, разработанные для нужд контент-анализа.

Факторный анализ применяется, когда возникает необходимость определить совокупность вероятных причинно-следственных связей между переменными, установить наличие феноменов, объясняющих существование взаимосвязи.

В последние десятилетия все чаще при обработке данных контент-анализа или корреляционного анализа используется особый метод математической статистики, позволяющий выявить скрытые от непосредственного восприятия дензнаки (факторы), а также уточнить степень их влияния на те или иные рассматриваемые характеристики.

Приведем пример - расчёт коэффициента Яниса, при помощи которого может быть установлено соотношение положительных и отрицательных оценок относительно определенных категорий. Данный коэффициент исчисляется по формуле:

Принципиальное отличие этих методов анализа заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних.

Сущность метода

Объект контент-анализа

Основные направления применения контент-анализа

Стадии разработки и применения контент-анализа

формулируются тема, задачи и гипотезы исследования
определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.

Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

Таким образом, категории анализа должны быть:

уместными, т.е. соответствовать решению исследовательских задач;
исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования;
взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме);
надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления.

За единицу анализа может быть принято:

слово,
предложение,
тема,
идея,
автор,
персонаж,
социальная ситуация,
часть текста, объединенная чем-то, что соответствует смыслу категории анализа.

Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

Важен выбор необходимых источников, подвергаемых контент-анализу.

Основные процедуры контент-анализа

Выявление смысловых единиц контент-анализа, которыми могут быть:

понятия, выраженные в отдельных терминах;
темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т.п.;
имена, фамилии людей;
события, факты и т.п.;
смысл апелляций к потенциальному адресату.

Единицы контент-анализа выделяются в зависимости от содержания, целей, задач и гипотез конкретного исследования.

Выделение единиц счета, которые могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м – исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:

физическая протяженность текстов;
площадь текста, заполненная смысловыми единицами;
число строк (абзацев, знаков, колонок текста);
длительность трансляции по радио или ТВ;
метраж пленки при аудио- и видеозаписях,
количество рисунков с определенным содержанием, сюжетом и пр.

Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Из них обязательными являются:

классификатор контент-анализа,
протокол итогов анализа, который имеет второе обозначение – бланк контент-анализа,
регистрационная карточка или кодировальная матрица,
инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета,
каталог (список) проанализированных документов.

Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны итогов контент-анализа, а исходя из желательности на одном листе бумаги уместить всю информацию о документе, чтобы удобнее было сопоставлять друг с другом итоги анализа разных документов. Если в исследовании осуществляется контент-анализ малого числа документов, то можно обойтись без кодирования и заполнять эти протоколы в открыто-содержательном виде.

Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующее единицы анализа. Протокол контент-анализа каждого конкретного документа заполняется на основе подсчета данных всех регистрационных карточек, относящихся к этому документу

Контент-ана́лиз (от англ.: contents - содержание, содержимое) или анализ содержания — стандартная методика исследования в области общественных наук, предметом анализа которой является содержание текстовых массивов и продуктов коммуникативной корреспонденции. В отечественной исследовательской традиции контент-анализ определяется как количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей. Контент-анализ применяется при изучении источников, инвариантных по структуре или существу содержания, но внешне бытующих, как не систематизированный, беспорядочно организованный текстовой материал. Философский смысл контент-анализа, как исследовательского метода, состоит в восхождении от многообразия текстового материала к абстрактной модели содержания текста. В указанном смысле, контент-анализ является одной из номотетических исследовательских процедур, используемых в сфере применения идиографических методов.

Выделяют два основных типа контент-анализа: количественный и качественный.

Содержание

История метода

Методика контент-анализа нашла широкое применение в информационную эпоху, однако история метода не ограничивается эрой автоматической обработки текста. Так первые примеры использования контент-анализа датированы XVIII веком, когда в Швеции частота появления в тексте книги определенных тем служила критерием её еретичности. [1] Однако, всерьёз говорить о применении контент-анализа как полноценной методики можно лишь начиная с 30-х годов XX века в США. [2] Термин content analysis впервые начали применять в конце XIX – нач. XX вв. американские журналисты Б.Мэттью, А.Тенни, Д.Спиид, Д.Уипкинс. У истоков становления методологии контент-анализа стоял также французский журналист Ж.Кайзер.

Использовался контент-анализ преимущественно в социологических исследованиях, в том числе при изучении рекламных и пропагандистских материалов.

Сфера применения

Круг дисциплин, в которых применяется контент-анализ, довольно широк. Помимо социологии и политологии данная методика находит применение в антропологии, управлении персоналом, психологии, литературоведении, истории, истории философии [3] . Оле Холсти приводит следующее распределение исследований в области контент-анализа по наукам: социология, антропология — 27,7 %, теория коммуникации — 25,9 %, политическая наука — 21,5 %. Следует также отметить применение контент-анализа в области исторических исследований [4] и связей с общественностью. [5]

Этапы применения контент-анализа

Необходимым условием применения методики анализа содержания является наличие материального носителя информации. Во всех случаях, когда существует или может быть воссоздан такой носитель, допустимо использование методики контент-анализа.

Первый этап

При необходимости можно использовать и другие критерии, однако перечисленные выше встречаются чаще всего. [6]

Второй этап

Третий этап

она должна быть достаточно большой, чтобы выражать значение;
она должна быть достаточно малой, чтобы не выражать много значений;
она должна легко идентифицироваться;
число единиц должно быть настолько велико, чтобы из них можно было делать выборку. [1]

Если в качестве единицы анализа избирается тема, то она также выделяется в соответствии с некоторыми правилами:

Тема не может выходить за пределы абзаца.

Новая тема возникает, если происходит смена:

воспринимающего,
действующего,
цели,
категории. [1]

Существуют также и специальные методики контент-анализа, адаптированные к нуждам исторических и историко-философских исследований.

Четвертый этап

Выделение единиц счета, которые могут совпадать со смысловыми единицами или носить специфический характер. В первом случае процедура анализа сводится к подсчету частоты упоминания выделенной смысловой единицы, во втором — исследователь на основе анализируемого материала и целей исследования сам выдвигает единицы счета, которыми могут быть:

физическая протяженность текстов;
площадь текста, заполненная смысловыми единицами;
число строк (абзацев, знаков, колонок текста);
длительность трансляции по радио или ТВ;
метраж пленки при аудио- и видеозаписях,
количество рисунков с определенным содержанием, сюжетом и прочее. [2]

В некоторых случаях исследователи используют и другие элементы счета. Принципиальное значение на этом этапе контент-анализа имеет строгое дефинирование его операторов.

Пятый этап

Непосредственно процедура подсчета. Она в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул, статистических расчетов. [2]

Обычно составляются таблицы вида:

Единицы анализа	Единицы анализа	Единицы счета	Единицы счета
Категории	Подкатегории	Частота упоминания абсолютная, раз	Частота упоминания относительная, %
1 Категория	01 подкатегория	15	25
02 подкатегория	7	14
03 подкатегория	25	61
Итого:	47	100

Шестой этап

Интерпретация полученных результатов в соответствии с целями и задачами конкретного исследования. Обычно на этом этапе выявляются и оцениваются такие характеристики текстового материала, которые позволяют делать заключения о том, что хотел подчеркнуть или скрыть его автор. Возможно выявление процента распространенности в обществе субъективных смыслов объекта или явления [7] .

Количественный контент-анализ

На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа исследователь должен создать своего рода словарь, в котором каждое наблюдение получит определение и будет отнесено к соответствующему классу. [8]

Метод Q-сортировки

При Q-сортировке используется шкала жесткого распределения из девяти пунктов: пункт 1 соответствует минимальной степени интенсивности измеряемого признака (например, наименьшей степени одобрения), а пункт 9 — максимальной степени интенсивности (например, наивысшей степени одобрения). Цель здесь состоит в том, чтобы просто ранжировать (упорядочить) все суждения вдоль единой оценочной оси. Арбитру дается определенная жесткая квота на каждую категорию шкалы (то есть ожидаемое число слов или фраз, которые должны быть им отнесены к данной категории), а затем ему предлагается распределить заданный набор терминов так, чтобы установленные квоты не нарушались. Квоты основаны на предположении (не обязательно верном), что колебания в интенсивности слов и фраз должны укладываться в рамки нормального распределения (когда изучаемые случаи максимально сосредоточены в средней части шкалы, а по мере продвижения к её полюсам их число равномерно убывает). Арбитры, таким образом, вынуждены давать относительные оценки конкретным словам и фразам (случаям), относя их к определенным категориям шкалы. [8]

После того как арбитры завершили свою работу, вычисляется средняя арифметическая оценка шкалы для каждого случая, а затем полученные средние оценки соответствующим образом ранжируются. Далее результаты этого ранжирования случаев по интенсивности используются для приписывания анализируемым текстам кодов, обусловленных встречаемостью в них слов или тем, получивших нашу оценку. Произвольность оценки одного исследователя компенсируется, таким образом, наличием других мнений. [8]

Шкалирование методом парного сравнения

Качественный контент-анализ

Например, может ставиться задача выяснить, сколько времени или печатного пространства уделено интересующему предмету в том или ином источнике или сколько слов или газетных столбцов было уделено каждому из кандидатов во время определенной избирательной кампании. [8]

Контент-анализ (англ. content analysis; от content — содержание) — формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью.

Сущность метода контент-анализа состоит в фиксации определенных единиц содержания, которое изучается, а также в квантификации полученных данных.

Контент-анализ начал использоваться в социальных науках начиная с 30-х гг XX в. в США. Впервые этот метод был применен в журналистике и литературоведении. Основные процедуры контент-анализа были разработаны американскими социологами X. Лассуэллом и Б. Берелсоном.

Г. Лассуэлл его использовал в конце 1930-х годов для исследований в сфере политики и пропаганды. Лассуэл модернизировал контент-анализ, ввел новые категории и процедуры, особое значение придавал квантификации данных.

Развитие средств массовой коммуникации вызвало увеличение контент-аналитических исследований в этой области. Во время второй мировой войны контент-анализ применялся некоторыми государственными учреждениями США и Англии для изучения эффективности пропаганды в разных странах, а также в разведывательных целях.

Западноевропейские исследователи в использовании метода контент-анализа опирались в основном на американский опыт. Тем не менее, здесь тоже появилось несколько оригинальных методик качественно-количественного анализа содержания (Ж. Клейзер, А. Моль).

Основные процедуры контент-анализа

В настоящее время к базовым процедурам контент-анализа относятся выявление смысловых единиц и выделение единиц счета.

1. Выявление смысловых единиц контент-анализа

Смысловыми единицами могут быть:

понятия, выраженные в отдельных терминах;
темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т. п.;
имена, фамилии людей;
события, факты и т. п.;
смысл апелляций к потенциальному адресату.

2. Выделение единиц счета

Единицы счета могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м — исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:

физическая протяженность текстов;
площадь текста, заполненная смысловыми единицами;
число строк (абзацев, знаков, колонок текста);
длительность трансляции по радио или ТВ;
метраж пленки при аудио- и видеозаписях,
количество рисунков с определенным содержанием, сюжетом и пр.

3. Процедура подсчета

Подобные методы используются также в исследованиях массовых коммуникаций, в маркетинговых и многих др. исследованиях.

Контент-анализ может использоваться для исследования большей части документальных источников, однако лучше всего он работает при относительно большом количестве однопорядковых данных.

Большой психологический словарь. Под общ. ред. Б.Г. Мещерякова, В.П. Зинченко. Москва, 2004.
Методологические и методические проблемы контент-анализа. Вып. 1-2. М., 1973;
Методы анализа документов в социологических исследованиях. М , 1985;

В продолжение темы:

Читайте также: