Acessibilidade / Reportar erro

Indicador econômico para o Brasil baseado no censo demográfico de 2000

Resumos

OBJETIVO: Propor um indicador econômico para o Brasil baseado em bens de consumo usando variáveis presentes no censo demográfico de 2000. MÉTODOS: O indicador, denominado Indicador Econômico Nacional (IEN), foi desenvolvido a partir de 12 bens e a escolaridade do chefe de família, por meio de análise de componentes principais. Dados da amostra do Censo Demográfico Brasileiro de 2000, realizado pelo Instituto Brasileiro de Geografia e Estatística, foram usados para gerar o indicador e para o cálculo dos pontos de corte dos decis de referência. RESULTADOS: O indicador, primeiro componente obtido da análise, reteve 38% da variabilidade total e apresentou correlação de Spearman de 0,74 com a renda total do domicílio e de 0,67 com a renda per capita. Os coeficientes necessários para calcular o indicador são apresentados, assim como as distribuições de referência para 27 capitais e Estados, as cinco regiões e o País. Apresenta-se um exemplo de como se usa o indicador. CONCLUSÕES: Diferentemente de outros indicadores econômicos disponíveis, o IEN tem as distribuições de referência publicadas, para capitais, Estados, Regiões, bem como a distribuição nacional. Torna-se possível, portanto, comparar a amostra estudada à distribuição municipal, estadual ou nacional. O número reduzido de variáveis torna fácil o cálculo do Indicador Econômico Nacional para investigadores envolvidos em pesquisas onde é importante a classificação econômica.

Enquete socioeconômica; Censos; Classe social; Renda; Pobreza


OBJECTIVE: To propose an asset based indicator of wealth for Brazil using variables present in the demographic census. METHODS: The indicator, named IEN (Indicador Econômico Nacional/ National Wealth Score), was developed using 12 assets and the schooling of the household head, through principal component analysis. Data from the 2000 Brazilian Demographic sample was used for deriving the score and for the calculation of decile cut-off points. RESULTS: The indicator, first component obtained from the analysis with the 13 variables, retained 38% of the total variability, and presented a Spearman correlation of 0,74 with total family income and of 0,67with per capita income. The necessary scores to calculate the indicator are presented, as well as reference distributions for the 27 states and their capitals, the five major regions as for the whole country. An example of use of indicator is presented. CONCLUSIONS: Differently from other economic indicators, the Indicador Econômico Nacional has local reference distributions available, along with the national distribution. It is therefore possible to compare a study sample to the municipal, state or country distribution. The small number of variables allow investigators to calculate the Indicador Econômico Nacional in research studies where economic classification is of interest.

Socio-economic survey; Censuses; Social class; Income; Poverty; Brazil


ARTIGOS ORIGINAIS

Indicador econômico para o Brasil baseado no censo demográfico de 2000

Aluísio J D Barros; Cesar G Victora

Centro de Pesquisas Epidemiológicas. Universidade Federal de Pelotas. Pelotas, RS, Brasil

Endereço para correspondência Endereço para correspondência Aluísio J D Barros Centro de Pesquisas Epidemiológicas - UFPel Caixa Postal 464 96001-970 Pelotas, RS, Brasil E-mail: abarros@epidemio-ufpel.org.br

RESUMO

OBJETIVO: Propor um indicador econômico para o Brasil baseado em bens de consumo usando variáveis presentes no censo demográfico de 2000.

MÉTODOS: O indicador, denominado Indicador Econômico Nacional (IEN), foi desenvolvido a partir de 12 bens e a escolaridade do chefe de família, por meio de análise de componentes principais. Dados da amostra do Censo Demográfico Brasileiro de 2000, realizado pelo Instituto Brasileiro de Geografia e Estatística, foram usados para gerar o indicador e para o cálculo dos pontos de corte dos decis de referência.

RESULTADOS: O indicador, primeiro componente obtido da análise, reteve 38% da variabilidade total e apresentou correlação de Spearman de 0,74 com a renda total do domicílio e de 0,67 com a renda per capita. Os coeficientes necessários para calcular o indicador são apresentados, assim como as distribuições de referência para 27 capitais e Estados, as cinco regiões e o País. Apresenta-se um exemplo de como se usa o indicador.

CONCLUSÕES: Diferentemente de outros indicadores econômicos disponíveis, o IEN tem as distribuições de referência publicadas, para capitais, Estados, Regiões, bem como a distribuição nacional. Torna-se possível, portanto, comparar a amostra estudada à distribuição municipal, estadual ou nacional. O número reduzido de variáveis torna fácil o cálculo do Indicador Econômico Nacional para investigadores envolvidos em pesquisas onde é importante a classificação econômica.

Descritores: Enquete socioeconômica. Censos. Classe social. Renda. Pobreza.

INTRODUÇÃO

A pesquisa em saúde pública tem a tradição de investigar não apenas os determinantes biológicos das doenças, mas também os socioeconômicos. Na América Latina, estudos sobre a importância das condições socioeconômicas no estado de saúde vêm sendo conduzidos há bastante tempo.1 Tal enfoque requer um indicador socioeconômico que classifique os indivíduos que estão sendo estudados. A escolaridade do chefe de família e a renda têm sido freqüentemente usadas para esse fim, apesar das dificuldades relacionadas à coleta de dados de boa qualidade, conforme explicado por Ferguson et al.3

O conceito marxista de classe social tem sido igualmente usado com sucesso, depois que uma definição operacional foi proposta no fim da década de 80 no Brasil.2,7 Esse método classifica os indivíduos em seis grupos: sub-proletariado, proletariado típico e atípico; pequena burguesia, nova pequena burguesia e burguesia tradicional. A despeito de ser teoricamente atraente, essa classificação tem se mostrado difícil de usar, sobretudo porque requer que a classificação seja feita manualmente, uma vez que não se logrou transformar os critérios em algoritmo programável.

Uma alternativa prática é a construção de um indicador econômico baseado nos bens de consumo da família. No Brasil, o primeiro critério para classificação econômica baseado em bens domésticos foi proposto em 1970 pela Associação Brasileira de Anunciantes (ABA). Quatro classes, rotuladas de A (mais rica) a D (mais pobre), foram usadas na classificação que era baseada em oito bens, na presença de empregados domésticos e no grau de escolaridade do chefe de família. Essa classificação foi modificada em 1976 e totalmente revista em 1978. Dessa vez, foram utilizados seis bens, empregados domésticos e o grau de instrução do chefe de família para classificar a população em cinco grupos, rotulados de A a E.8 Outras duas modificações foram realizadas desde então. Em 1996, uma revisão efetivada pela Associação Nacional de Empresas de Pesquisa1 1 Disponível em: htttp://www.anep.org.br [24 nov 2004] (ANEP) atualizou a classificação usando indicadores ligeiramente diferentes, mas a idéia geral permaneceu a mesma. A última atualização foi concretizada em 2000, com o uso de dados de um inquérito cobrindo nove regiões metropolitanas. Os critérios anteriores foram mantidos exceto pela inclusão de aparelhos de DVD como uma alternativa aos videocassetes.2 2 Disponível em: http://www.anep.org.br/codigosguias/CCEB.pdf [24 nov 2004] Desde o início, a metodologia usada visava criar um indicador que substituísse a renda familiar.

Uma dificuldade desse critério é que não é possível desagregar a distribuição original do indicador, válida para as regiões metropolitanas pesquisadas, para áreas geográficas menores. A razão é que as distribuições desagregadas não foram publicadas, e nem os microdados foram colocados à disposição para os interessados. Outra razão é que o inquérito não cobre a totalidade do País. Conseqüentemente, não é possível determinar a distribuição específica do indicador proposto para áreas geográficas mais limitadas. Por exemplo, considere-se um estudo em domicílios cobertos pelo Programa de Saúde da Família na cidade de Porto Alegre, RS. Para comparar essa população com a totalidade da capital é necessário conhecer a distribuição do indicador econômico para a cidade, que é completamente diferente da distribuição nacional.

O uso de dados coletados pelo Censo Demográfico Brasileiro de 2000 do Instituto Brasileiro de Geografia e Estatística (IBGE) pode resolver esse problema específico e oferece também uma solução geral para os investigadores brasileiros. Isso porque um indicador derivado de dados de uma amostra do Censo pode ser calculado para cada município do País, bem como para áreas geográficas maiores, como Estados e Regiões.

Decidiu-se então usar dados do Censo referentes a bens e ao grau de instrução do chefe de família a fim de obter um indicador econômico por meio da análise de componentes principais, conforme proposto por Filmer & Pritchett.4 Um dos objetivos foi o de limitar o número de variáveis ao menor possível, de tal forma que fosse fácil coletá-las em inquéritos populacionais ou em estudos epidemiológicos. Distribuições do indicador econômico em nível nacional, regional, estadual e local foram geradas para servir de referência possibilitando situar outras amostras de estudos em termos econômicos em relação ao grupo de comparação desejado. O uso do indicador proposto torna possível comparar determinada amostra com a distribuição do indicador econômico em vários níveis geográficos distintos, assim como estimar a proporção dos pobres (ou dos ricos) que ela inclui.

MÉTODOS

O Censo Demográfico Brasileiro de 2000 coletou um número limitado de variáveis de cada domicílio no País. Um questionário mais detalhado foi aplicado em amostra de domicílios escolhidos ao acaso em cada município, por meio de amostragem sistemática dentro de cada setor censitário. A fração de amostragem foi de 10% nos municípios com população estimada de mais de 15.000 pessoas e 20% nos outros. O total de 5.304.711 domicílios foram incluídos na amostra, resultando em fração média de amostragem de 11,7%. Os pesos finais foram calculados pelo IBGE usando uma técnica de calibragem em relação a um conjunto de variáveis para as quais os totais da população são conhecidos (obtidos do universo do Censo). Detalhes sobre a metodologia da amostra do Censo estão descritos no site do IBGE.3 3 Disponível em: http://www.ibge.gov.br/censo/text_amostragem.shtm. [24 nov 2004]

Usar mais de cinco milhões de domicílios para estimar um indicador de saúde não é apenas impraticável, mas também desnecessário. Os dados disponíveis foram re-amostrados usando uma fração de 10%. Isso foi feito por Estado, usando o comando sample do Stata, e variando o gerador de números pseudo-aleatórios para cada estado de acordo com a hora (hh:mm:ss) em que o procedimento havia começado. Uma fração de amostragem fixa foi escolhida de forma que os pesos originais calculados pelo IBGE pudessem ser usados simplesmente multiplicando-os por 10, caso fosse necessário o cálculo dos totais populacionais.

O indicador foi desenvolvido exclusivamente para as áreas urbanas. As áreas rurais são consideravelmente diferentes de áreas urbanas em termos de infra-estrutura e modo de vida, o que já justificaria separar os indicadores. Uma vez que a maior parte da pesquisa é realizada em áreas urbanas, essa foi a área selecionada para o presente trabalho. É perfeitamente possível desenvolver um indicador similar para áreas rurais, caso seja necessário. O tamanho da subamostra foi de 418.032 domicílios, sendo que o maior Estado contribuiu com 104.348 e o menor com 690 domicílios.

A análise de componentes principais (ACP) foi o método escolhido por várias razões. Não há nenhuma necessidade de que as variáveis usadas com ACP sejam de algum tipo particular ou tenham alguma distribuição específica. Seu principal objetivo – sintetizar a variância de um conjunto de variáveis – pode ser atingido com qualquer tipo de dado.6 O método dispensa dados de renda ou de consumo que, além de difíceis de obter, são freqüentemente de qualidade questionável.3 Finalmente, o indicador derivado não é arbitrário, o primeiro componente gerado pela ACP capta a maior quantidade possível de variabilidade de dados com única combinação linear. A ACP já foi avaliada4 e usada com esse propósito em muitas situações, tais como na série "Country Reports on Health, Nutrition, Population, and Poverty" publicada pelo Banco Mundial.4 4 Disponível em: http://www.worldbank.org/poverty/health/data/index.htm [19 nov 2004]

A ACP pode ser realizada com as matrizes de covariância ou de correlação das variáveis selecionadas, sendo a última opção equivalente ao uso de variáveis padronizadas. Os resultados obtidos em cada caso não são nem os mesmos nem uma mera função um do outro. A diferença entre os resultados será mais marcante quando as variâncias das variáveis usadas forem muito diferentes, por exemplo, quando as variáveis são medidas em escalas diferentes. Em tais casos, variáveis com grandes variâncias dominarão a primeira componente principal.5 No presente caso, a maior parte das variáveis são binárias, indicando a presença de um bem, algumas são contagens (por exemplo, o número de aparelhos de TV), e uma é categórica (escolaridade). O uso de variáveis padronizadas (ou a matriz de correlação) ajuda a minimizar as diferenças consideráveis na variância que são observáveis nesse caso. Quando essa estratégia é usada, há pouca diferença entre o uso das variáveis originais ou de um conjunto de variáveis indicadoras para as variáveis politômicas. Os coeficientes de correlação entre os indicadores gerados pelas duas alternativas foram tipicamente maiores a 95%.

Para obter um indicador econômico válido é necessário trabalhar com um número razoável de variáveis. Por outro lado, um número excessivo de bens poderia tornar o indicador impraticável para uso em estudos de pequena escala. Selecionou-se da amostra do Censo 12 variáveis relacionadas a bens domésticos e ao tamanho do domicílio, além do nível de escolaridade do chefe da família. As variáveis usadas e a maneira como foram codificadas são apresentadas na Tabela 1. Os pontos de corte superiores para as variáveis de contagem foram escolhidos com base em sua distribuição, deixando ao menos 5% dos domicílios nos últimos grupos.

Em síntese, a análise de componentes principais foi realizada usando a matriz de covariância de 13 variáveis, e empregando os pesos da amostra calculados e fornecidos pelo IBGE. Os coeficientes foram calculados arredondando a expressão carga /d.p.x100 para o inteiro mais próximo, e os indicadores individuais foram obtidos por meio da expressão Scivi onde ci é o coeficiente e vi o valor codificado da iésima variável. Essa estratégia produziu um indicador que é diferente do indicador padrão da APC por uma quantidade fixa Sici

i onde vi é a média de i, com a vantagem prática de que todos os indicadores são positivos.

Depois de derivado o indicador econômico, foram calculados os decis de sua distribuição para o País, Regiões geográficas, Estados e suas capitais. A amostra inteira do Censo foi usada para calcular os decis para as capitais de Estados, enquanto que a subamostra foi usada para outros níveis. Todas as análises foram realizadas com o Stata 8.

RESULTADOS

A primeira componente principal foi extraída com base nas 13 variáveis apresentadas na Tabela 1, com os códigos numéricos correspondentes. Os resultados estão sintetizados na mesma tabela, onde as cargas das variáveis, desvios-padrão e os coeficientes finais do indicador (carga/ desvio-padrão x 100, arredondado para o inteiro mais próximo) são apresentados. A primeira componente reteve 38% da variabilidade total dos dados, enquanto que a segunda componente reteve apenas 9%.

Para a amostra nacional, o valor mínimo para o indicador foi 20, o máximo 1.086, a média 412 e a mediana 358. A distribuição de freqüência era desviada para a direita, sendo menos assimétrica, no entanto, do que as distribuições de renda costumam ser. Diagramas de caixa mostrando a distribuição da renda per capita do domicílio para cada quintil populacional do indicador econômico são mostrados na Figura 1. Houve aumento evidente nos valores da média e da mediana da renda per capita, assim como na sua dispersão, do primeiro até o último quintil.


Correlações (Pearson) foram calculadas entre o indicador econômico e a renda total do domicílio e a renda per capita, com valores de 0,40 e 0,38, respectivamente. As correlações com os seus logaritmos foram consideravelmente mais altas: 0,76 para o log de renda total e 0,68 para o log de renda per capita. As correlações de Spearman também foram calculadas: 0,74 com a renda total do domicílio, 0,67 com a renda per capita, e 0,75 e 0,68 com seus respectivos logaritmos. Em função do tamanho da amostra (408.976 domicílios), todos os valores-p foram virtualmente zero.

Pontos de corte dos decis para o País inteiro, cinco Regiões geográficas e 26 Estados mais Distrito Federal (calculado usando a sub-amostra do estudo) aparecem na Tabela 2, onde se observa que as diferenças entre Estados e Regiões são óbvias. O Distrito Federal apresentou a mediana mais alta do indicador (484). São Paulo, o Estado mais industrializado do Brasil, aparece na segunda posição com mediana do indicador de 463, seguido por Santa Catarina, Rio de Janeiro e Rio Grande do Sul, todos localizados no Sul e Sudeste. No extremo oposto, os Estados mais pobres foram Piauí, Alagoas, Tocantins e Maranhão, localizados no Nordeste e Norte do País. Os escores medianos dessas Regiões variaram de 258 a 218, respectivamente. As diferenças são tão marcantes que a mediana para o Maranhão é inferior ao ponto de corte do primeiro decil para São Paulo.

Os decis do indicador para as 26 capitais estaduais mais a capital federal (usando a amostra completa do Censo) são mostrados na Tabela 3. Pessoas morando nas capitais estaduais estão evidentemente em melhor situação financeira do que a população do Estado. Também fica claro que os Estados mais ricos não são aqueles cujas capitais são mais ricas. Entre as capitais, Florianópolis (SC), aparece em primeiro lugar, seguida de Porto Alegre (RS) e Curitiba (PR). A cidade de São Paulo é apenas a quinta colocada em termos da mediana do indicador. Novamente, no extremo inferior da classificação estão as capitais localizadas no Norte e Nordeste. Palmas (TO), Rio Branco (AC) e São Luís (MA) são as três que apresentam as medianas mais baixas do indicador.

Como exercício de aplicação prática do indicador, usou-se uma amostra de aproximadamente 3.000 indivíduos colhida em áreas atendidas pelo Programa de Saúde da Família na cidade de Porto Alegre, RS. O indicador foi calculado e comparado às distribuições para Porto Alegre e para o Brasil. Se a amostra fosse similar à população da cidade, um histograma mostrando cinco barras próximas de 20% teria sido observado. Em vez disso, a Figura 2 (histograma esquerdo) mostra que a amostra do estudo está concentrada nos quintis de referência mais baixos, o que significa que a população atendida pelo Programa de Saúde da Família vem de um grupo muito mais pobre. Quase 40% da amostra fica abaixo do ponto de corte do primeiro quintil para Porto Alegre. No outro extremo, menos de 5% da amostra está dentro da faixa do quinto quintil de referência.


Um quadro diferente emerge quando comparamos a amostra aqui descrita à distribuição do indicador do País inteiro (Figura 2 direita). A amostra está agora concentrada no 3º e 4º quintis de referência. Ou seja, essa população comparada à referência brasileira não está mais concentrada no lado pobre, mas sobretudo no meio da distribuição.

DISCUSSÃO

A disponibilidade de dados do Censo relativos à renda e aos bens domésticos fornece oportunidade única de desenvolver um indicador econômico baseado numa grande amostra e com representatividade nacional, regional e local. Diferentemente de outros indicadores econômicos disponíveis atualmente, que têm apenas a distribuição de referência nacional, o indicador proposto pode ser comparado com diferentes níveis de agregação regional, conforme o exemplo apresentado.

O número de variáveis para compor o indicador foi mantido em nível manejável para inquéritos de pequena escala e estudos epidemiológicos. As 13 variáveis que compõem o indicador são fáceis de coletar e codificar. Outras variáveis possíveis que fazem parte do conjunto de dados do Censo, tais como tipo de materiais de construção ou atendimento por serviços públicos não foram incluídas. A principal razão foi que elas não acrescentavam informação de forma importante para o indicador (resultados não mostrados). Além disso, um dos objetivos era manter o número de variáveis reduzido e algumas destas últimas são difíceis de coletar. Especificamente, a propriedade da casa não foi incluída porque, ao contrário do que esperávamos, a propriedade foi mais freqüente entre os pobres do que entre os mais ricos. Também se trata de uma variável difícil de coletar, já que muitas situações peculiares são freqüentes. Por exemplo, os pobres muitas vezes são proprietários do casebre, mas não do terreno onde ele se localiza.

O conjunto de variáveis selecionado produziu um indicador econômico válido conforme sugere o comportamento da renda familiar ao longo dos quintis do indicador. A percentagem da variabilidade total explicada pelo primeiro componente da APC foi superior aos 26% obtidos por Filmer et al,4 e a correlação de Spearman superior àquelas encontradas por Ferguson et al3 para indicador de APC de renda permanente: 0,49 para o Paquistão (38 variáveis do indicador), 0,68 para a Grécia (24 variáveis) e 0,73 para o Peru (28 variáveis). Usando o exemplo dos dados de Porto Alegre, a distribuição de renda domiciliar mostrou o aumento esperado nos valores da mediana pelo quintil do indicador. Infelizmente, outras variáveis relacionadas à saúde não estavam disponíveis nesse conjunto de dados de tal forma que se pudesse validar ainda mais o indicador, onde o déficit de altura para idade teria sido opção interessante.

Coeficientes de correlação mais altos foram encontrados entre o indicador e a renda total do domicílio, sugerindo que se trata de uma proxy melhor para essa medida do que para a renda per capita. Isso não é surpreendente uma vez que o indicador não é ajustado para o número de pessoas no domicílio. Como conseqüência, domicílios com mais pessoas tendem a ter valor indicador maior, dado que um número maior de indivíduos contribuem em termos econômicos. No entanto, a simples divisão pelo número de pessoas não é uma opção razoável, visto que economias de escala não serão levadas em consideração. É óbvio que o número de aparelhos de TV ou carros não aumentarão linearmente com o número de pessoas morando em um domicílio. Alternativas para corrigir esse indicador para o tamanho do domicílio estão atualmente sendo investigadas.

Em conclusão, foi apresentado aqui um indicador econômico válido, baseado em dados acessíveis e de boa qualidade que podem ser usados para classificação econômica de subamostras de dados do censo ou para novos estudos que incluem informações relativas às 13 variáveis usadas. Dada a disponibilidade das distribuições de referência para vários níveis geográficos de agregação, é possível não apenas usar o indicador para realizar uma classificação econômica interna à amostra, mas também para comparar a amostra com a distribuição do município, do Estado e do País. Foi dado a esse indicador o nome de IEN, sigla de "Indicador Econômico Nacional".

Recebido em 1/12/2004. Aprovado em 7/4/2005.

Financiado pelo Banco Mundial, Programa "Reach the Poor" (Processo n. 7122804).

Apresentado no VI Congresso Brasileiro de Epidemiologia, Recife, junho de 2004, e na V Conferência Européia sobre Economia da Saúde, Londres, setembro de 2004.

  • 1. Almeida-Filho N, Kawachi I, Pellegrini-Filho AP, Dachs JN. Research on health inequalities in Latin America and the Caribbean: bibliometric analysis (1971-2000) and descriptive content analysis (1971-1995). Am J Public Health 2003;93:2037-43.
  • 2. Barros MB. A utilização do conceito de classe social nos estudos dos perfis epidemiológicos: uma proposta. Rev Saúde Pública 1986;20:269-73.
  • 3. Ferguson B, Tandon E, Gakidou E, Murray CJL. Estimating permanent Income using Indicator variables. Geneva: World Health Organization; 2002.
  • 4. Filmer D, Pritchett LH. Estimating wealth effects without expenditure data-or tears: an application to educational enrollments in states of India. Demography 2001;38(1):115-32.
  • 5. Johnson RA, Wichern DW. Applied multivariate statistical analysis. Englewood Cliffs, NJ: Prentice-Hall, Inc.; 1982.
  • 6. Jolliffe IT. Principal Component Analysis. New York: Springer; 2002.
  • 7. Lombardi C, Bronfman M, Facchini LA, Victora CG, Barros FC, Béria JV et al. Operacionalização do conceito de classe social em estudos epidemiológicos. Rev Saúde Pública 1988;22:253-65.
  • 8. Mattar FN. Análise crítica dos estudos de estratificação socioeconômica de ABA-Abipeme. Rev Adm 1995;30(1):57-74.
  • Endereço para correspondência

    Aluísio J D Barros
    Centro de Pesquisas Epidemiológicas - UFPel
    Caixa Postal 464
    96001-970 Pelotas, RS, Brasil
    E-mail:
  • 1
    Disponível em:
    htttp://www.anep.org.br [24 nov 2004]
  • 2
    Disponível em:
  • 3
    Disponível em:
  • 4
    Disponível em:
  • Datas de Publicação

    • Publicação nesta coleção
      10 Out 2005
    • Data do Fascículo
      Ago 2005

    Histórico

    • Aceito
      07 Abr 2005
    • Recebido
      01 Dez 2004
    Faculdade de Saúde Pública da Universidade de São Paulo Avenida Dr. Arnaldo, 715, 01246-904 São Paulo SP Brazil, Tel./Fax: +55 11 3061-7985 - São Paulo - SP - Brazil
    E-mail: revsp@usp.br