Fichamento: Estimação de meses exatos para os microdados e as séries por trimestre móvel da PNAD Contínua
Hecksher, M. & Barbosa, R. J. (2025) — SocArXiv preprint / REBEP
Hecksher, M., & Barbosa, R. J. (2025). Estimação de meses exatos para os microdados e as séries por trimestre móvel da PNAD Contínua [Estimation of exact months for the microdata and rolling quarter series from PNAD Contínua]. SocArXiv. https://doi.org/10.31235/osf.io/[preprint]
Última atualização: 2026-05-08
Modelo: Claude Sonnet 4.6
Prompt Version: v17.2 2026-05-08 | Ficha antes do fichamento
Gerado em: 2026-05-08T00:00:00-03:00
Ocasião da Leitura: Publicação de novo pacote por Hecksher-Barbosa2025
Ficha Analítica Crítica
Esta seção segue o formato IA Planilhando Textos v17.2.
1 Introdução (pp. 1–5)
1.1 O problema da temporalidade na PNADC [§1–§4]
O artigo abre identificando um problema estrutural de mensuração: fenômenos sociais e econômicos operam em tempo contínuo, mas a PNADC — principal pesquisa domiciliar brasileira — publica seus indicadores exclusivamente como trimestres móveis, ocultando a magnitude e o momento exato de choques econômicos. Hecksher e Barbosa inserem esse problema em um debate metodológico internacional mais amplo, citando Giannone, Reichlin e Small (2008) sobre as perdas de conteúdo em tempo real introduzidas por defasagens de publicação, e Choi e Varian (2012) sobre o uso de fontes de alta frequência (como Google Trends) para contornar essas limitações.
A relevância do ponto temporal é reforçada por um argumento econométrico: estimadores de diferenças-em-diferenças podem atribuir pesos negativos a efeitos individuais quando o timing do tratamento é heterogêneo — o que pode inverter o sinal estimado mesmo quando todas as unidades respondem positivamente à política (Chaisemartin & D’Haultfœuille, 2020). Arcabouços que tratam rigorosamente essa heterogeneidade, como o de Callaway e Sant’Anna (2021), exigem precisamente a identificação do mês em que cada unidade passa a ser tratada. A imprecisão temporal da PNADC, portanto, não é apenas um inconveniente prático, mas uma limitação com implicações diretas para a validade da avaliação de políticas.
Questão central: Como recuperar estimativas mensais genuínas a partir de uma pesquisa estruturalmente divulgada em trimestres móveis, sem recorrer a modelos estatísticos, interpolação ou fontes externas?
1.2 A distorção introduzida pelos trimestres móveis [§5–§7]
Os autores formalizam matematicamente a distorção produzida pelos trimestres móveis. A fórmula básica para estoques populacionais e massas de rendimentos é: \(x_t = (y_{t-2} + y_{t-1} + y_t)/3\), onde \(y_t\) é o valor mensal verdadeiro. Se a população ocupada for 103, 103 e 100 milhões em três meses consecutivos, o trimestre móvel reportará 102 milhões — subestimando o choque real em dois terços de sua magnitude. Além da atenuação, os trimestres móveis consecutivos geram defasagem e autocorrelação espúria, distorções especialmente problemáticas para avaliação de políticas, comparação internacional e o trabalho do Comitê de Datação de Ciclos Econômicos (Codace).
1.3 Contexto histórico e lacuna comparativa [§8–§10]
Os autores situam a limitação brasileira em perspectiva comparada: Estados Unidos (CPS, desde 1940), União Europeia (cerca de dez países com dados mensais de LFS), Japão, Canadá e Austrália produzem estimativas mensais do mercado de trabalho. No Brasil, a Pesquisa Mensal de Emprego (PME) publicou indicadores mensais por 36 anos (1980–2016). Ao migrar para a PNADC, o IBGE ampliou e nacionalizou as amostras, mas optou por suprimir a divulgação mensal, fundamentando-se em evidências de que oscilações mensais frequentemente não eram estatisticamente significativas (IBGE, 2015; Lila & Freitas, 2007). A urgência da questão é exemplificada pela pandemia de COVID-19: estimativas não oficiais para meses exatos, publicadas em junho de 2020, foram fundamentais para revelar que — pela primeira vez na história estatística do país — a maioria absoluta da população em idade de trabalhar estava sem trabalho algum (Hecksher, 2020a).
1.4 As duas estratégias propostas e contribuições do artigo [§11–§14]
O artigo apresenta duas estratégias complementares de mensalização da PNADC. A primeira opera sobre os microdados: explorando o desenho de painel rotativo e as datas de nascimento dos respondentes, desenvolve um algoritmo determinístico que identifica o mês de cada observação sem interpolações estatísticas, indicadores externos ou hipóteses sobre a estrutura temporal das séries. A segunda opera sobre os agregados do SIDRA: inverte matematicamente a fórmula da média móvel trimestral a partir da relação exata entre trimestres móveis consecutivos.
O artigo reúne cinco contribuições em relação à versão preliminar (Hecksher, 2020b, que havia obtido ~40% de determinação para 28 indicadores sem propagação inter-trimestres): (i) formalização de um algoritmo aperfeiçoado que alcança 97% de determinação em 28,4 milhões de observações (2012–2025); (ii) método de inversão de trimestres móveis para mais de 80 séries do SIDRA; (iii) validação empírica via transições do salário mínimo; (iv) aplicações em pobreza mensal e resolução semanal; (v) implementação como pacote R {PNADCperiods}, de código aberto e aprovado no CRAN.
2 Identificação de períodos nos microdados (pp. 6–15)
2.1 O painel rotativo como recurso: os três fatos estruturais [§15–§19]
A PNADC emprega amostragem por conglomerados em dois estágios: Unidades Primárias de Amostragem (UPAs — setores censitários ou agregados de setores) no primeiro estágio, e domicílios selecionados dentro de cada UPA no segundo. Cada UPA contém oito grupos de rotação, indexados pela variável \(V1014 \in \{1,2,...,8\}\). A cada trimestre, um grupo entra na amostra pela primeira vez e outro a deixa definitivamente. Cada grupo permanece na amostra por cinco trimestres consecutivos.
O algoritmo se fundamenta em três fatos estruturais do desenho operacional da PNADC:
O Fato 1 permite usar informações individuais de moradores para restringir o escopo de datas da entrevista do domicílio. O Fato 2 permite cruzar informação entre domicílios do mesmo grupo de rotação, restringindo ainda mais os meses possíveis. O Fato 3 — a propagação inter-trimestres — é descrito pelos autores como a principal fonte de poder do algoritmo: uma restrição informativa em qualquer dos até cinco trimestres de presença do grupo é suficiente para resolver a ambiguidade em todos os demais. É esse mecanismo que eleva a taxa de determinação de ~40% (Hecksher, 2020b, sem propagação) para ~97% com o histórico completo de 55 trimestres.
2.2 Semanas de referência e a regra da Parada Técnica [§20–§24]
A coleta da PNADC é organizada em semanas de referência de domingo a sábado. A regra geral de classificação determina que uma semana pertence ao mês \(m\) se possuir pelo menos 4 dias dentro de \(m\). Cada semana é identificada pelo sábado que a encerra (a data de referência). Se o primeiro sábado do mês civil cair no dia 4 ou posterior, a semana que termina nesse sábado é a primeira do mês de referência; se cair nos dias 1, 2 ou 3, a primeira semana de referência é a seguinte.
Cada mês de referência do IBGE compreende exatamente quatro semanas consecutivas — sempre 28 dias — raramente coincidindo com o mês civil. Os períodos entre dois meses de referência são chamados de Parada Técnica: nesses intervalos, não há coleta, e os sábados correspondentes não são utilizados como datas de referência.
O sistema de coleta usa um dispositivo móvel (DMC) que calcula automaticamente a idade dos moradores na data de referência (o sábado final da semana de referência), desde que datas de nascimento exatas tenham sido informadas. Apenas quando não se obtém a data de nascimento de alguma pessoa é que a idade é perguntada diretamente ou estimada. O primeiro passo do algoritmo consiste em identificar os sábados válidos dentro de cada trimestre — excluindo os de Parada Técnica — e usar as idades calculadas e as datas de aniversário para restringir as datas possíveis de cada entrevista.
2.3 O algoritmo de identificação: três passos encadeados [§25–§32]
O algoritmo opera em três mecanismos encadeados:
Passo 1 — Restrições de aniversário. Para cada morador \(i\) com data de nascimento conhecida, calcula-se:
\[b_i = (\text{Ano} - \text{AnoNasc}_i) - \text{Idade}_i\]
Se \(b_i = 0\), a entrevista ocorreu após o aniversário: a data mínima possível é deslocada para o primeiro sábado válido em ou após o aniversário. Se \(b_i = 1\), a entrevista ocorreu antes do aniversário: a data máxima possível é restringida ao sábado imediatamente anterior.
Os autores ilustram com dois exemplos concretos para o 1º trimestre de 2023:
- Exemplo 1: pessoa nascida em 15/03/1990 com idade 33. Como \(2023 - 1990 = 33\), \(b_i = 0\): a entrevista ocorreu após 15 de março, restringindo-a ao mês 3.
- Exemplo 2: pessoa nascida em 17/02/1990 com idade 32 no mesmo trimestre. Como \(2023 - 1990 = 33 \neq 32\), \(b_i = 1\): a entrevista ocorreu antes de 17 de fevereiro, restringindo-a a janeiro ou início de fevereiro.
A interseção das restrições de múltiplos moradores pode determinar o mês mesmo quando nenhuma restrição individual é suficiente. Se três moradores do mesmo grupo de rotação têm intervalos Jan–Fev, Jan–Mar e Fev–Mar, a interseção \([\max(1,1,2) = 2, \min(2,3,3) = 2]\) identifica fevereiro como único mês compatível.
Passo 2 — Agregação intratrimestre. A interseção dos intervalos de todos os indivíduos do mesmo grupo \((UPA, V1014)\) dentro do trimestre é computada. Pelo Fato 2, todos os domicílios compartilham o mesmo mês; pelo Fato 1, todos os moradores de cada domicílio compartilham a mesma semana. O mês verdadeiro deve satisfazer simultaneamente todas as restrições individuais.
Passo 3 — Propagação inter-trimestres. Pelo Fato 3, a posição mensal relativa é invariante entre visitas, de modo que as restrições de todos os trimestres em que o grupo aparece podem ser combinadas. Uma restrição informativa em qualquer um dos cinco trimestres de presença é suficiente para resolver a ambiguidade nos demais. Por exemplo: se um indivíduo é identificado como entrevistado em setembro de 2022 (terceiro mês relativo), isso determina automaticamente o mês de todos os domicílios da mesma UPA-painel em todos os cinco trimestres: setembro em T3/2022, dezembro em T4/2022, março em T1/2023, e assim por diante.
A taxa de determinação cresce com o número de trimestres empilhados: ~72% com um trimestre, ~95% com oito, e ~97% com o histórico completo de 55 trimestres (2012–2025, 28,4 milhões de observações). Cada trimestre específico esgota suas possibilidades de determinação quando o processo inclui microdados dos quatro trimestres anteriores e dos quatro posteriores — cobrindo a janela completa das cinco visitas possíveis ao mesmo grupo.
2.4 Exceções à regra da Parada Técnica [§33–§36]
Em seis trimestres entre 2012 e 2025 (2016-T3, 2016-T4, 2017-T2, 2022-T3, 2023-T2 e 2024-T1), a regra padrão (mínimo de 4 dias no mês) produz impossibilidades lógicas: as restrições de aniversário de indivíduos do mesmo grupo se tornam mutuamente incompatíveis, gerando intervalos vazios. Esses conflitos surgem em meses cujo primeiro sábado cai exatamente no dia 4 — posição limítrofe em que a classificação da semana como pertencente ao mês corrente ou ao anterior afeta encadeadamente todas as restrições do grupo.
A solução é relaxar o critério para um mínimo de 3 dias (\(k = 3\) em vez de \(k = 4\)), reclassificando a semana ambígua e restaurando a compatibilidade. O algoritmo detecta essas situações automaticamente: quando a regra geral implica impossibilidade em qualquer grupo, o trimestre é recalculado com o critério permissivo. Em todos os seis casos detectados, a exceção afeta apenas um dos três meses do trimestre.
Nota 1: A documentação do IBGE admite explicitamente essa tolerância: “existe uma tolerância de que [o dia 1º] esteja até quarta-feira ou no limite na quinta-feira, desta forma garantimos que pelo menos 3 ou 4 dias da 1ª semana de referência do mês estejam dentro do mês corrente” (IBGE, 2018, p. 32). [nota incluída por relevância argumentativa — confirma a base documental das exceções detectadas pelo algoritmo]
2.5 Identificação de quinzenas e semanas [§37–§40]
O algoritmo se estende para granularidades submensais com a mesma lógica, mas com uma diferença estrutural decisiva: a agregação opera no nível do domicílio \((Ano, Trimestre, UPA, V1008)\), não no nível do grupo de rotação \((UPA, V1014)\) entre trimestres. Isso ocorre porque a posição quinzenal e semanal relativa dentro do mês pode variar entre visitas — ao contrário da posição mensal (Fato 3). Sem a propagação inter-trimestres, as taxas de determinação caem drasticamente: ~9% para quinzenas e ~3% para semanas pelo algoritmo estrito.
Os autores recomendam cautela nessas extensões: exceto em choques de magnitude excepcional (como a COVID-19) ou em análises de eventos semanais/quinzenais repetidos ao longo de múltiplos anos (como o carnaval), a imprecisão das estimativas submensais limita sua utilidade. Imputações probabilísticas — descartadas como desnecessárias no caso mensal — são apontadas como alternativa razoável para análises submensais.
2.6 Calibragem dos pesos amostrais [§41–§46]
Os pesos amostrais originais do IBGE (\(V1028\) para dados trimestrais, \(V1032\) para dados anuais) são calibrados para reproduzir totais populacionais trimestrais ou anuais. Para produzir estimativas mensais válidas, é necessário redistribuir esses pesos de modo que a subamostra mensal represente corretamente a população.
O procedimento aplica um ajuste hierárquico em quatro níveis progressivamente mais finos: (i) faixa etária (0–13, 14–29, 30–59, 60+); (ii) pós-estrato geográfico agrupado; (iii) unidade da federação; (iv) pós-estrato detalhado. Em cada nível, para cada célula demográfico-geográfica e subperíodo, aplica-se um fator multiplicativo que garante que a composição da subamostra mensal reproduza proporcionalmente a do período-âncora (trimestre ou ano). Quando uma célula tem observações insuficientes, o ajuste se interrompe naquele nível. Ao final, os pesos são rescalonados para que o total ponderado de cada subperíodo reproduza exatamente o total populacional mensal obtido da tabela 6022 do SIDRA.
Nota 2: O total populacional da tabela 6022 do SIDRA é uma estimativa para o mês central de cada trimestre móvel (e.g., fevereiro de 2012 para o 1º trimestre de 2012). Para os dois meses extremos da série (janeiro de 2012 e o último mês do último trimestre disponível), os autores usam extrapolação quadrática baseada nas estimativas do SIDRA para os 24 meses mais próximos. [nota incluída por relevância argumentativa — explicita a base dos totais populacionais usados na calibração]
Os aproximadamente 3% de observações com mês indeterminado são excluídos da análise mensal. Os autores reconhecem que essa exclusão não constitui subamostragem aleatória simples, e que o ajuste hierárquico de pesos busca corrigir eventuais desequilíbrios demográficos e geográficos introduzidos pela seleção.
Estimação de variância. Dois caminhos estão disponíveis: (i) linearização de Taylor, especificando o desenho com variáveis originais de estrato e UPA e os pesos mensais calibrados — rápida e adequada para médias e proporções; (ii) pesos de replicação bootstrap, disponibilizados pelo IBGE em 200 réplicas (\(V1028001\) a \(V1028200\)), adaptados para pesos mensais pela fórmula:
\[w_{i,k}^{(m)} = w_{i,k} \times \frac{w_i^{(m)}}{w_i}\]
onde \(w_{i,k}\) é o \(k\)-ésimo peso de replicação original, \(w_i\) é o peso trimestral original (V1028) e \(w_i^{(m)}\) é o peso mensal calibrado. Essa adaptação preserva a estrutura de variabilidade do desenho amostral.
3 Identificação de meses exatos nos dados do SIDRA (pp. 16–19)
3.1 A lógica da inversão do trimestre móvel [§47–§52]
A segunda abordagem opera exclusivamente sobre os agregados publicados pelo IBGE no SIDRA, dispensando acesso a microdados. Ela tem duas vantagens próprias: (i) as variações mensais recuperadas derivam diretamente dos dados oficiais do IBGE, com publicação que antecede os microdados em até três meses; (ii) pesquisadores sem infraestrutura para processar microdados podem obter estimativas mensais para mais de 80 indicadores.
A chave está na sobreposição entre trimestres móveis consecutivos. Dois trimestres consecutivos (\(x_t\) e \(x_{t-1}\)) compartilham os meses \(y_{t-2}\) e \(y_{t-1}\). Sua diferença isola exatamente o que mudou — o mês que entrou menos o que saiu:
\[d_{3t} \equiv 3(x_t - x_{t-1}) = (y_{t-2} + y_{t-1} + y_t) - (y_{t-3} + y_{t-2} + y_{t-1}) = y_t - y_{t-3}\]
Portanto, \(d_{3t}\) corresponde à variação entre dois meses separados por três posições, e é exatamente três vezes a subtração entre dois trimestres móveis consecutivos. Sob essa lógica, os meses se organizam em três subsequências independentes conforme suas posições relativas nos trimestres — posição \(j \in \{1, 2, 3\}\), correspondendo respectivamente a jan/abr/jul/out, fev/mai/ago/nov e mar/jun/set/dez. Dentro de cada subsequência, o valor mensal é a soma telescópica das variações a partir de um ponto inicial:
\[y_t = y_0^{(j)} + \sum_{\substack{s \leq t \\ s \equiv j \pmod{3}}} d_{3s}\]
Três pontos iniciais — um por posição — são suficientes para recuperar toda a série histórica. A inversão resolve as variações exatas, mas não os níveis iniciais. Para taxas e rendimentos médios (razões entre grandezas), é necessário mensalizar numerador e denominador separadamente, pois a média de uma razão não é igual à razão das médias.
3.2 Calibração dos pontos iniciais [§53–§58]
Os três pontos iniciais \(y_0^{(j)}\) — os valores em nível de janeiro, fevereiro e março de 2012 — não podem ser recuperados a partir dos dados agregados. É aqui que as duas abordagens se tornam mutuamente complementares: os microdados mensalizados fornecem esses pontos iniciais.
O procedimento se dá em quatro passos: (1) calcular \(d_{3t} = 3(x_t - x_{t-1})\) para cada par consecutivo de trimestres móveis do SIDRA; (2) acumular as variações dentro de cada subsequência \(j\); (3) usar os microdados mensalizados para estimar os valores em nível de janeiro, fevereiro e março de 2012, gerando estimativas para os três \(y_0^{(j)}\); (4) somar as variações acumuladas aos pontos iniciais para reconstruir as séries completas.
Alternativamente, qualquer mês disponível nos microdados pode servir como ponto inicial, gerando versões alternativas da série. Em princípio idênticas, elas diferem numericamente devido a ruídos estatísticos da incompletude da mensalização — discrepâncias que podem alcançar centenas de milhares de pessoas em indicadores de nível. Os autores recomendam calcular a média simples dessas estimativas usando 2013–2019 como janela de calibração, período com as mais altas taxas de identificação (~98%). O pacote {PNADCperiods} armazena internamente os pontos iniciais pré-calculados para todas as séries do SIDRA, de modo que o usuário pode obter estimativas mensais para mais de 80 indicadores sem executar todas essas etapas.
4 Estratégias experimentais para granularidades submensais (pp. 19–20)
4.1 Atribuição probabilística e agregação por UPA [§59–§62]
Com taxas de determinação estrita baixas (~3% semanal, ~9% quinzenal), os autores propõem duas estratégias opcionais que elevam essas taxas sem comprometer a integridade da identificação mensal.
Atribuição probabilística: Quando o intervalo de datas possíveis de uma observação abrange exatamente dois períodos consecutivos, ela é atribuída ao período que contém o ponto médio do intervalo. Um índice de confiança — definido como a proporção do intervalo contida no período atribuído — acompanha cada atribuição. Com limiar de confiança de 0,75, a taxa de quinzenas sobe para ~13,5% e a de semanas para ~7,5%. Para uso robusto, recomenda-se filtrar observações com confiança \(\geq 0,7\).
Agregação por UPA: Se todos os domicílios com quinzena ou semana determinada dentro de uma UPA apontam para o mesmo período, os domicílios indeterminados da mesma UPA podem herdar essa atribuição. A homogeneidade intra-UPA é de 100% para os 55 trimestres analisados (9,6 milhões de observações). Na prática, o ganho marginal é limitado, pois a maioria das UPAs já possui todos os domicílios determinados ou todos indeterminados.
Os autores recomendam cautela substancial nas análises submensais: exceto em choques de magnitude excepcional ou em eventos semanais/quinzenais analisados ao longo de múltiplos anos empilhados, a incerteza adicional das atribuições probabilísticas e os intervalos de confiança amplos limitam a utilidade prática dessas extensões.
5 Validação: o mês de ajuste do Salário Mínimo (pp. 20–22)
5.1 O teste de validação e seus resultados [§63–§68]
A validação enfrenta um problema fundamental: os meses verdadeiros de referência não são observados nos dados públicos. A estratégia proposta explora uma assimetria temporal estrutural da PNADC combinada a uma regularidade institucional do mercado de trabalho brasileiro.
A PNADC contém duas variáveis de rendimento com temporalidades distintas: o rendimento habitual (\(VD4016\)) refere-se ao mês da entrevista, enquanto o rendimento efetivo (\(VD4017\)) refere-se ao mês anterior. O salário mínimo é reajustado por decreto, tipicamente em 1º de janeiro. Se a identificação mensal for precisa, o rendimento habitual dos entrevistados de janeiro deve refletir o novo valor, enquanto o efetivo só o refletirá em fevereiro (cujo “mês anterior” é janeiro). Essa defasagem de exatamente um mês funciona como teste falsificável: um algoritmo incorreto produziria uma transição borrada em vez de abrupta.
A análise abrange 16 transições entre 2012 e 2025, incluindo reajustes intra-anuais como o de maio de 2023. O teste mais exigente ocorre em 2020, quando houve dois reajustes em rápida sucessão: de R$ 998 para R$ 1.039 em 1º de janeiro, e de R$ 1.039 para R$ 1.045 em 1º de fevereiro. O valor de R$ 1.039 foi o salário mínimo oficial por exatamente um mês — um teste de estresse natural: qualquer erro de atribuição de uma pequena fração de observações diluiria esse valor nos meses vizinhos.
Resultado da validação: Em todas as 16 transições, o rendimento habitual apresenta mudança abrupta no mês do reajuste e o rendimento efetivo replica o mesmo padrão com defasagem de exatamente um mês — sem exceção. A transição de dois reajustes em 2020 é identificada com precisão. Valores anteriores não desaparecem completamente (fração residual reflete ajustes graduais de empregadores), mas a transição majoritária é abrupta em um único mês, como previsto. A regularidade ao longo de 13 anos (2012–2025) é, nas palavras dos autores, “notável”.
6 O pacote {PNADCperiods}: modos de usar (pp. 22–23)
6.1 Dois workflows complementares [§69–§73]
Ambas as abordagens estão implementadas no pacote R {PNADCperiods}, disponível em código aberto no CRAN. O uso típico segue dois fluxos complementares:
Workflow por microdados (3 passos). O crosswalk de identificação de períodos é construído uma única vez a partir de dados empilhados e pode ser reutilizado para qualquer divulgação trimestral ou anual. A função pnadc_identify_periods() recebe os microdados empilhados e retorna o crosswalk; pnadc_apply_periods() aplica o crosswalk a uma divulgação específica e calibra os pesos mensais. A variável resultante weight_monthly é o peso amostral calibrado para totais populacionais mensais; ref_month_yyyymm identifica o mês exato no formato AAAAMM.
Workflow SIDRA (3 linhas). Dispensa microdados — o pacote já traz pontos iniciais pré-calculados para mais de 80 indicadores. fetch_sidra_rolling_quarters() baixa as séries de trimestres móveis do SIDRA; mensalize_sidra_series() executa a inversão e retorna as séries mensais. As colunas m_* contêm as estimativas mensais recuperadas; anomesexato é o equivalente de ref_month_yyyymm.
O artigo destaca que os dois workflows podem ser combinados: o microdados fornece os pontos iniciais para calibrar as séries do SIDRA, e o SIDRA fornece estimativas rápidas antes da disponibilidade dos microdados.
7 Alguns exemplos e aplicações (pp. 24–31)
7.1 Pobreza mensal a partir dos dados anuais [§74–§79]
A primeira aplicação demonstra o uso dos dados anuais da PNADC, que contêm variáveis abrangentes de rendimento domiciliar per capita (\(VD5008\)) não disponíveis nas divulgações trimestrais. O pipeline opera em dois passos: o crosswalk é construído a partir dos microdados trimestrais empilhados (2015–2024); essa tabela é então aplicada aos dados anuais com âncora anual (\(V1032\)) e calibração mensal pelo procedimento hierárquico. A chave é que as divulgações trimestral e anual da PNADC compartilham a mesma estrutura de painel \((UPA, V1014, V1008)\), de modo que o crosswalk construído com dados trimestrais se aplica diretamente aos anuais.
Utilizando a linha de pobreza de R$ 624/mês per capita (preços de dezembro de 2023) e a medida FGT-0, os autores estimam taxas mensais de pobreza com intervalos de confiança de 95% para 2015–2024, incorporando o desenho amostral complexo via svydesign() do pacote {survey}. Três padrões emergem que os dados anuais não capturam:
- Salto abrupto da pobreza entre março e abril de 2020, diluído na média anual.
- Queda abaixo dos níveis pré-pandêmicos já em maio de 2020, com o início do Auxílio Emergencial — estatisticamente significativa segundo as bandas de confiança.
- Repique parcial com a redução do auxílio e sua extinção em 2021, com timing exato agora mensurável.
7.2 A recessão de 2014–2017: deterioração mês a mês [§80–§83]
A segunda aplicação examina a recessão prolongada de 2014–2017, durante a qual a taxa de desocupação mais que dobrou (de 6,6% para 13,9%). Os dados trimestrais apresentam essa deterioração como trajetória relativamente suave e contínua. Os dados mensais, em contraste, revelam que a piora ocorreu em episódios discretos: diversos meses registraram aumentos superiores a 1 ponto percentual na taxa de desocupação — choques abruptos invisíveis nas médias trimestrais. O código demonstrativo usa data.table para calcular as variações mensais (delta) e identificar os meses com saltos expressivos.
7.3 Indicadores mensalizados do SIDRA [§84–§87]
A terceira aplicação demonstra a versatilidade da inversão de trimestres móveis para quatro indicadores selecionados por diversidade temática: taxa de participação na força de trabalho, empregados sem carteira no setor privado, subocupação por insuficiência de horas, e alojamento e alimentação. Em todos os quatro painéis, a série mensal recuperada (linha vermelha) contrasta com a série de trimestres móveis publicada (linha azul tracejada), revelando dinâmicas distintas ocultas pela média trimestral: a queda abrupta da participação em março de 2020, a volatilidade mensal da informalidade, a sensibilidade extrema do setor de alojamento e alimentação aos ciclos de restrição sanitária, e os picos sazonais de subocupação.
8 Discussão e Conclusão (pp. 31–33)
8.1 Relação com métodos clássicos de desagregação temporal [§94–§99]
A literatura de desagregação temporal se desenvolve desde a década de 1970, com contribuições de Chow e Lin (1971), Denton (1971), Fernández (1981) e Litterman (1983), implementadas computacionalmente no pacote tempdisagg (Sax & Steiner, 2013). Esses métodos foram concebidos para o problema clássico de interpolação de séries de contas nacionais — sistemas subdeterminados (mais incógnitas do que equações) resolvidos mediante hipóteses de suavidade ou correlação com indicadores externos de alta frequência.
A abordagem por microdados proposta por Hecksher e Barbosa difere fundamentalmente: não é interpolação estatística, mas identificação determinística que explora a estrutura interna da própria pesquisa — informações de nascimento e idade dos respondentes e a invariância do painel rotativo — sem indicadores externos nem hipóteses sobre a estrutura temporal das séries. A abordagem por agregados (inversão das médias móveis do SIDRA) constitui um sistema exatamente determinado condicionado a três pontos iniciais, diferindo dos sistemas subdeterminados dos métodos clássicos.
Posicionamento na literatura: O método não compete com as abordagens por modelos de séries temporais (Gonçalves et al., 2022; 2025), mas as complementa: enquanto essas abordagens produzem estimativas probabilísticas a partir de hipóteses sobre a estrutura temporal das séries, o método aqui descrito produz identificação determinística a partir da estrutura interna da pesquisa, sem hipóteses sobre a dinâmica das variáveis de interesse. A principal vantagem comparativa é a aplicabilidade a todos os microdados individuais e a todas as variáveis disponíveis, não apenas às séries de indicadores publicados.
Os autores listam as aplicações potenciais do método: avaliação de políticas com timing preciso (transferências de renda, reformas trabalhistas, pisos salariais); análise de choques imprevistos (pandemia, eventos climáticos); comparação internacional; emprego em modelos com outras séries mensais; detecção antecipada de pontos de inflexão; e estudos populacionais de pobreza, desigualdade e participação feminina. Com o pacote {PNADCperiods} no CRAN, os autores expressam a expectativa de que outros usuários encontrem novas aplicações.