Описание исходных (вторичных) данных
Страница 1

Задачи эссе предполагают использование данных уровня домохозяйства для построения моделей. Такие данные собираются Госкомстатом России в рамках выборочных обследований, а также в рамках специальных проектов (например, «Российский мониторинг экономики и здоровья», RLMS). Данное исследование будет построено на данных выборочного опроса RLMS. Выборка репрезентирует население России.

Объем выборки 4711 домохозяйств. Данные собирались по формализованной анкете (опроснику). Данные содержат богатую базу для различного моделирования.

База данных, которая будет использоваться для моделирования, содержит много переменных. Наиболее интересующими для нас являются переменные, которые позволяют выявить наличие тех или иных ТДП, такие как наличие ПК, стиральной машины и т.д., а также переменные, которые могут влиять/определять наличие ТДП у домохозяйств. Доходы, количество человек в семье, число источников домохозяйства и проч.

Не все переменные будут представлены в анализе так, как они представлены в исходной базе данных. Дело в том, что некоторые переменные нуждаются в преобразовании, а некоторые – в вычислении заново. Так, например, данные о месте проживания домохозяйства я преобразовала в двоичную переменную город=1/село=0, тогда как исходная переменная содержала 4 градации (в части анализа это показано). Это выгодно, т.к. мне требовалось включить эту переменную в регрессионную модель, а это допускается лишь для количественных, или для двоичных переменных. А число источников доходов я вообще считала по нескольким переменным, где респонденту предлагался целый спектр источников доходов и предлагалось согласиться или не согласиться что очередной источник доходов используется семьей респондента.

Всего в вычислениях задействовано более 30 переменных. Это отражено в синтаксисе (см. приложение).

Пример самой базы данных представлен в следующей таблице:

Пример базы данных

Имя

перем. Номер семьи

iid_h

Ic9.1a

Ic9.1b

indexTDP1

1

10101

1

8

0,51

2

10102

1

20

0,72

3

10103

1

24

0,54

4

10105

2

0

5

10107

1

6

1,11

6

10112

99

0

Это фрагмент данный в том формате, который отображается в SPSS. По горизонтали – семьи, по вертикали – переменные (показатели). Например, переменная iid_h – код семьи в 13-й волне (2004 год), ic9.1a – показатель того, есть ли в домохозяйстве холодильник (код 1) , или нет (код 2), ic9.1b – содержит возраст холодильника, indexTDP1 – это уже рассчитанный мной индекс обеспеченности ТДП. Например, из тех семей, что есть в данном фрагменте, наиболее обеспеченной, вероятно, является семья №5.

Страницы: 1 2


Похожие статьи:

Экономические аспекты
Экономические аспекты необходимости преодоления депопуляции обусловлены, прежде всего, потребностью России в трудоспособном населении. При дальнейшем нарастании негативных тенденций в рождаемости и смертности, численность экономически акти ...

Выводы
Целью данной работы являлось сформировать общую картину развития социального страхования в Российской Федерации и других странах. Задачи: 1. Проследить историю появления и развития системы социального страхования в России. Первые законы о ...

Понятие бедности. История изучения бедности.
Бедность – характеристика экономического положения индивида или группы, при котором они не могут сами оплатить стоимость необходимых благ[1]. Бедность – неспособность поддерживать определенный приемлемый уровень жизни.[2] Бедность - это со ...