Hello,
I have a somewhat general question - I am working with survey data which are provided both at household and person level. The weights however are available at family unit level from 1960 to 1990 and at household level from 1990 onwards. In the survey pdfs, they suggest obtaining family unit weights for the post 1990 period by multiplying the household weight with the number of family units in the household.
When using data at individual level (e.g. to compute the income percentiles), does it make sense to use as the weight the family unit weight multiplied with the number of individuals in the family?
I would appreciate any suggestion!
I have a somewhat general question - I am working with survey data which are provided both at household and person level. The weights however are available at family unit level from 1960 to 1990 and at household level from 1990 onwards. In the survey pdfs, they suggest obtaining family unit weights for the post 1990 period by multiplying the household weight with the number of family units in the household.
Code:
* Example generated by -dataex-. For more info, type help dataex clear input float year long household_id byte(person_id famUnit_id) float fu_members double(p153 p053) float weight_fu 1968 1 1 1 2 .9666666666666667 20.975833333333334 3030 1968 1 2 1 2 8.895833333333334 .025833333333333333 3030 1968 2 1 1 2 3.38125 24.85 3030 1968 2 2 1 2 10.533333333333333 .0575 3030 1968 2 3 2 1 2.7645833333333334 7.866666666666666 2773 1968 3 1 1 2 3.0854166666666667 20.859583333333333 3030 1968 3 2 1 2 10.483333333333333 .14416666666666667 3030 1968 4 1 1 2 4.979166666666667 9.55 3030 1968 4 2 1 2 1.75 0 3030 1968 5 1 1 1 3.1729166666666666 6.1775 2703 1968 6 1 1 1 3.216666666666667 9.812916666666666 2423 1968 6 2 2 1 4.95625 4.5 2703 1968 7 1 1 1 7.191666666666666 18.766666666666666 2706 1968 8 2 1 4 6.185416666666667 .50375 2364 1968 8 1 1 4 4.322916666666667 18.916666666666668 2364 1968 8 4 1 4 0 0 2364 1968 8 3 1 4 0 0 2364 1968 9 2 1 4 14.658333333333333 4.982916666666667 2364 1968 9 4 1 4 1.5833333333333333 1 2364 1968 9 5 1 4 0 0 2364 1968 9 1 1 4 9.933333333333334 19.791666666666668 2364 1968 9 3 2 1 3.527083333333333 8.683333333333334 2768 1968 10 2 1 2 6.614583333333333 .06375 3030 1968 10 1 1 2 2.2416666666666667 14.383333333333333 3030 1968 11 1 1 1 4.6875 6.880833333333333 2535 1968 12 1 1 2 1.15 5.172916666666667 3030 1968 12 2 1 2 5.945833333333334 0 3030 1968 13 3 1 3 0 0 2823 1968 13 1 1 3 6.960416666666666 9.7 2823 1968 13 2 1 3 0 0 2823 1968 14 6 1 4 0 0 3122 1968 14 4 1 4 0 0 3122 1968 14 1 1 4 9.720833333333333 10.35 3122 1968 14 5 1 4 0 0 3122 1968 14 2 2 1 1.8666666666666667 3.55 2773 1968 14 3 3 1 6.029166666666667 13.141666666666668 2773 end
When using data at individual level (e.g. to compute the income percentiles), does it make sense to use as the weight the family unit weight multiplied with the number of individuals in the family?
I would appreciate any suggestion!
Comment