Подготовка эмпирических данных к обработке и анализу
Страница 1
Материалы и статьи » Методы анализа эмпирических данных » Подготовка эмпирических данных к обработке и анализу

Анализ получаемых в ходе социологического исследования данных начинается с контроля над качеством заполнения инструментария, исправления ошибок и отбраковки (выбраковки) некачественно заполненных анкет, бланков, карточек и т.п. Категории качества заполнения инструментария разнообразны, подходы здесь неоднозначны. Все зависит от условий работы анкетеров, интервьюеров, места опроса и других факторов.

Вначале проверяется правильность ответа на каждый вопрос и при необходимости исправляется. Например, на вопрос: «Знаете ли вы основные условия, заложенные в трудовом договоре?» чаще всего отвечают: «Да, знаю». Но далее в анкете стоит открытый контрольный вопрос: «Если знаете, назовите их, пожалуйста». Он остается незаполненным. В этом случае альтернативу «да, знаю» надо зачеркнуть и отметить другую, скорее всего «нет ответа», «затрудняюсь ответить» и т.п. Затем подсчитываются неправильные ответы. При исправлении каждого третьего ответа в анкете ее лучше не готовить к машинной обработке. В случае если респондент не ответил на 10-15% основных вопросов, против них контролер ставит отметку «нет ответа», и анкета идет на обработку на ЭВМ.

Более жесткие требования предъявляются к вопросам, касающимся социально-демографических характеристик (пол, возраст, образование), если нет ответов на эти вопросы, то инструментарий изымается из общего массива.

Допущенные к обработке документы нумеруются, в целях контроля за их прохождением. В дальнейшем массив передается кодировщикам. Но перед тем, как передать анкеты в руки операторов, надо закодировать открытые вопросы. На каждый открытый вопрос, как правило составляется не менее пяти шифров-кодов. Выше уже приводился один из открытых вопросов: «Если вы знаете, назовите, пожалуйста». Ответы могут быть самыми разнообразными: от полных, глубоких, обстоятельных, до ответов схем. Шифры-коды должны отражать шкалу интенсивности ответов на открытый вопрос. Обычно кодировка таких ответов проходит в два-три этапа. Сначала варианты ответов выписывают отдельно, подсчитывают число употреблений каждого варианта – частота его повторения. Затем варианты группируются по смысловой близости, совпадению. Таких групп, как показывает практика набирается четыре-пять, и каждой из них присваивается свой шифр или код.

Кодировка выступает связующим звеном между качественной и количественной информацией. На данной основе как раз и осуществляются числовые операции с информацией, введенной в память машины. Если во время кодировки произойдет сбой, замена или потеря кода, то информация окажется неправильной.

Сущность обработки первичной информации заключается в ее обобщении. Результаты обобщения называются социологической информацией. Решение о способе обработки инструментария принимается заранее. При опросе 60 – 70 человек обработку вполне можно провести вручную на микрокалькуляторе. Если анкета сравнительно невелика (содержит до 20 вопросов), то ручная обработка возможна при наличии 200-350 анкет. Но если в инструментарии более 20 вопросов, тогда предел для ручной обработки – 100-200 анкет. При обработке на ЭВМ результаты отражаются в виде табуляграмм, поэтому здесь нужна помощь программиста.

Каждый вопрос в анкете или бланке интервью представляет собой в определенной степени шкалу измерений. Единицами измерений выступают соответствующие альтернативы (позиции), варианты ответов. По эти позициям (вариантам ответов) проводится группировка респондентов. Кроме того, определенную шкалу измерений представляют объективные характеристики опрашиваемых, их субъективные оценки, предпочтения и пр.

Измерение производится с помощью различных шкал, которым соответствуют различные правила математического анализа данных. В социологических исследованиях применяются, как правило, шкалы трех основных типов: номинальная, ранговая (порядковая) и интервальная.

Простейшая шкала – номинальная. Чаще всего она фиксирует (отражает) дихотомичный ответ: «да» или «нет», «тепло» или «холодно». Применяя ранговую шкалу, можно зафиксировать более определенное состояние, определяющее ранжированное распределение типа «холодно» - «тепло» - «горячо». Но цифровые величины пока отсутствуют. Если же мы точку замерзания воды примем за нуль, а точку кипения (пар) за 100 и расстояние между этими точками разделим на 10 равных интервалов, то получим интервальную шкалу.

Страницы: 1 2


Рекомендуем к прочтению: