Описание исходных (вторичных) данных
Страница 1

Задачи эссе предполагают использование данных уровня домохозяйства для построения моделей. Такие данные собираются Госкомстатом России в рамках выборочных обследований, а также в рамках специальных проектов (например, «Российский мониторинг экономики и здоровья», RLMS). Данное исследование будет построено на данных выборочного опроса RLMS. Выборка репрезентирует население России.

Объем выборки 4711 домохозяйств. Данные собирались по формализованной анкете (опроснику). Данные содержат богатую базу для различного моделирования.

База данных, которая будет использоваться для моделирования, содержит много переменных. Наиболее интересующими для нас являются переменные, которые позволяют выявить наличие тех или иных ТДП, такие как наличие ПК, стиральной машины и т.д., а также переменные, которые могут влиять/определять наличие ТДП у домохозяйств. Доходы, количество человек в семье, число источников домохозяйства и проч.

Не все переменные будут представлены в анализе так, как они представлены в исходной базе данных. Дело в том, что некоторые переменные нуждаются в преобразовании, а некоторые – в вычислении заново. Так, например, данные о месте проживания домохозяйства я преобразовала в двоичную переменную город=1/село=0, тогда как исходная переменная содержала 4 градации (в части анализа это показано). Это выгодно, т.к. мне требовалось включить эту переменную в регрессионную модель, а это допускается лишь для количественных, или для двоичных переменных. А число источников доходов я вообще считала по нескольким переменным, где респонденту предлагался целый спектр источников доходов и предлагалось согласиться или не согласиться что очередной источник доходов используется семьей респондента.

Всего в вычислениях задействовано более 30 переменных. Это отражено в синтаксисе (см. приложение).

Пример самой базы данных представлен в следующей таблице:

Пример базы данных

Имя

перем. Номер семьи

iid_h

Ic9.1a

Ic9.1b

indexTDP1

1

10101

1

8

0,51

2

10102

1

20

0,72

3

10103

1

24

0,54

4

10105

2

0

5

10107

1

6

1,11

6

10112

99

0

Это фрагмент данный в том формате, который отображается в SPSS. По горизонтали – семьи, по вертикали – переменные (показатели). Например, переменная iid_h – код семьи в 13-й волне (2004 год), ic9.1a – показатель того, есть ли в домохозяйстве холодильник (код 1) , или нет (код 2), ic9.1b – содержит возраст холодильника, indexTDP1 – это уже рассчитанный мной индекс обеспеченности ТДП. Например, из тех семей, что есть в данном фрагменте, наиболее обеспеченной, вероятно, является семья №5.

Страницы: 1 2


Похожие статьи:

Этносы, нации, поколения
«Ясное понимание соблюдение твоего долга пред людьми - это твоя подлинная свобода. Чем человечнее, осознаннее ты соблюдаешь свой долг перед людьми, тем больше черпаешь ты из неисчерпаемого источника подлинного человеческого счастья – свобо ...

Правовые формы разграничения предметов ведения и полномочий. Договоры и соглашения
1. Федеральный закон «Об общих принципах организации законодательных (представительных) и исполнительных органов государственной власти субъектов Российской Федерации» в качестве таких правовых форм называет договоры и соглашения[8]. Закон ...

Практические задания
1. Почему современные семьи предпочитают иметь меньше детей, чем раньше Современные семьи предпочитают иметь меньше детей, чем раньше, как мне кажется, по нескольким причинам. Чаще всего это причины материально-бытового характера: - прежде ...