yit=β0+β1xit+αi+uit
yit=β0+β1xit+αi+uit
Quando cov(αi,xit)≠0, devemos utilizar EF ou PD
Se cov(αi,xit)=0, então MQO não é viesado
yit=β0+β1xit+αi+uit
Quando cov(αi,xit)≠0, devemos utilizar EF ou PD
Se cov(αi,xit)=0, então MQO não é viesado
Por que utilizar EA?
yit=β0+β1xit+αi+uit
yit=β0+β1xit+αi+uit
cov(vit,vis)=cov(αi+uit,αi+uis)=σ2α⟹corr(vit,vis)=σ2α/(σ2α+σ2u)
yit=β0+β1xit+αi+uit
cov(vit,vis)=cov(αi+uit,αi+uis)=σ2α⟹corr(vit,vis)=σ2α/(σ2α+σ2u)
Heterogeneidade não observada, mesmo quando não relacionada com o regressor x, induz correlação serial no termo de erro!
MQO deixa de ser BLUE 😡
yit=β0+β1xit+αi+uit
cov(vit,vis)=cov(αi+uit,αi+uis)=σ2α⟹corr(vit,vis)=σ2α/(σ2α+σ2u)
Heterogeneidade não observada, mesmo quando não relacionada com o regressor x, induz correlação serial no termo de erro!
MQO deixa de ser BLUE 😡
Estimador de EA será Mínimos Quadrados Generalizados (MQG) para corrigir esta correlação serial
ˉyi=T−1∑tyit
Faremos uma centralização parcial na média intragrupo
ˉyi=T−1∑tyit
Faremos uma centralização parcial na média intragrupo
yit−λˉyi=β0(1−λ)+β1(xit−λˉxi)+vit−λˉvi
Por enquanto não sabemos o melhor valor para 0≤λ≤1
ˉyi=T−1∑tyit
Faremos uma centralização parcial na média intragrupo
yit−λˉyi=β0(1−λ)+β1(xit−λˉxi)+vit−λˉvi
Por enquanto não sabemos o melhor valor para 0≤λ≤1
λ→0⟹ˆβEA1→ˆβMQO1 e λ→1⟹ˆβEA1→ˆβEF1
ˉyi=T−1∑tyit
Faremos uma centralização parcial na média intragrupo
yit−λˉyi=β0(1−λ)+β1(xit−λˉxi)+vit−λˉvi
Por enquanto não sabemos o melhor valor para 0≤λ≤1
λ→0⟹ˆβEA1→ˆβMQO1 e λ→1⟹ˆβEA1→ˆβEF1
Se a hipótese de EA for válida, cov(xit,αi)=0, então
λ=1−[σ2uσ2u+Tσ2α]1/2
λ=1−[σ2uσ2u+Tσ2α]1/2
Na prática não conhecemos λ, pois, não observamos as variâncias diretamente
A solução é utilizar um estimador de Mínimos Quadrados Generalizados Factíveis (MQGF)
λ=1−[σ2uσ2u+Tσ2α]1/2
Na prática não conhecemos λ, pois, não observamos as variâncias diretamente
A solução é utilizar um estimador de Mínimos Quadrados Generalizados Factíveis (MQGF)
ˆλ=1−[ˆσ2uˆσ2u+Tˆσ2α]1/2
MQO também é não viesado. Usado para estimar ˆvit e ˆσ2v
ˆσ2α é estimado pela covariância entre ˆvit e ˆvis, com t≠s
ˆσ2α=1NT(T−1)/2−2N∑i=1T−1∑t=1T∑s=t+1ˆvitˆvis
MQO também é não viesado. Usado para estimar ˆvit e ˆσ2v
ˆσ2α é estimado pela covariância entre ˆvit e ˆvis, com t≠s
ˆσ2α=1NT(T−1)/2−2N∑i=1T−1∑t=1T∑s=t+1ˆvitˆvis
ˆσ2u=ˆσ2v−ˆσ2α
Principal hipótese de EA é cov(xit,αi)=0
Hipótese muito restritiva. Equivalente a MQO.
Principal hipótese de EA é cov(xit,αi)=0
Hipótese muito restritiva. Equivalente a MQO.
Deve ser encarada como exceção e não regra
Principal hipótese de EA é cov(xit,αi)=0
Hipótese muito restritiva. Equivalente a MQO.
Deve ser encarada como exceção e não regra
Usa-se painel geralmente para explorar heterogeneidade não observada que está correlacionada com os regressores
Principal hipótese de EA é cov(xit,αi)=0
Hipótese muito restritiva. Equivalente a MQO.
Deve ser encarada como exceção e não regra
Usa-se painel geralmente para explorar heterogeneidade não observada que está correlacionada com os regressores
Somente usado se podemos plausivelmente presumir que cov(xit,αi)=0. Caso contrário, EF é preferível
O principal ponto a ser considerado em escolher um modelo de Efeito Fixo ou Efeito Aleatório é a plausibilidade da hipótese cov(xit,αi)=0
Quando a hipótese é verdadeira, ambos os estimadores são consistentes
Se cov(xit,αi)≠0, então apenas EF é consistente
O principal ponto a ser considerado em escolher um modelo de Efeito Fixo ou Efeito Aleatório é a plausibilidade da hipótese cov(xit,αi)=0
Quando a hipótese é verdadeira, ambos os estimadores são consistentes
Se cov(xit,αi)≠0, então apenas EF é consistente
Ideia de Hausman: testamos cov(xit,αi)=0 indiretamente ao testarmos ˆβEA1−ˆβEF1=0
Uma rejeição da H0 (i.e. ˆβEA1≠ˆβEF1) implica na escolha do modelo de EF
Explora mudanças ao longo do tempo que não afetam a todos
Necessidade de encontrar (ou construir) grupo de controle apropriado
Suposição chave: tendências paralelas
Aplicação empírica: impacto do salário mínimo no emprego. Card e Krueger (1994)
Design de inferência causal mais amplamente utilizado em econometria aplicada
A regressão múltipla geralmente não fornece estimativas causais por causa da seleção em não observáveis (e.g. viés de variável omitida).
Experimentos RCTs são uma maneira de resolver este problema, mas muitas vezes são impossíveis de fazer.
A regressão múltipla geralmente não fornece estimativas causais por causa da seleção em não observáveis (e.g. viés de variável omitida).
Experimentos RCTs são uma maneira de resolver este problema, mas muitas vezes são impossíveis de fazer.
Quatro principais métodos de avaliação causal usados em economia:
A regressão múltipla geralmente não fornece estimativas causais por causa da seleção em não observáveis (e.g. viés de variável omitida).
Experimentos RCTs são uma maneira de resolver este problema, mas muitas vezes são impossíveis de fazer.
Quatro principais métodos de avaliação causal usados em economia:
Esses métodos são usados para identificar relações causais entre tratamentos e resultados.
2 períodos de tempo: antes e depois do tratamento.
2 grupos:
2 períodos de tempo: antes e depois do tratamento.
2 grupos:
2 períodos de tempo: antes e depois do tratamento.
2 grupos:
grupo controle: nunca recebe tratamento,
grupo de tratamento: inicialmente não tratado e depois totalmente tratado.
2 períodos de tempo: antes e depois do tratamento.
2 grupos:
grupo controle: nunca recebe tratamento,
grupo de tratamento: inicialmente não tratado e depois totalmente tratado.
Sob certas suposições, o grupo de controle pode ser usado como contrafactual para o grupo de tratamento
Imagine que você está interessado em avaliar o impacto causal do aumento do salário mínimo no (des)emprego.
Por que isso não é tão simples? Qual deve ser o grupo de controle?
Imagine que você está interessado em avaliar o impacto causal do aumento do salário mínimo no (des)emprego.
Por que isso não é tão simples? Qual deve ser o grupo de controle?
Paper seminal em 1994 pelos proeminentes economistas trabalhistas David Card e Alan Krueger intitulado "Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania"
Imagine que você está interessado em avaliar o impacto causal do aumento do salário mínimo no (des)emprego.
Por que isso não é tão simples? Qual deve ser o grupo de controle?
Paper seminal em 1994 pelos proeminentes economistas trabalhistas David Card e Alan Krueger intitulado "Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania"
Estima o efeito de um aumento do salário mínimo sobre a taxa de emprego na indústria de fast-food. Por que essa indústria?
Nos EUA, existe um salário mínimo nacional, mas os estados podem divergir dele.
1º de abril de 1992: o salário mínimo de Nova Jersey aumenta de US$ 4,25 para US$ 5,05 por hora.
Nos EUA, existe um salário mínimo nacional, mas os estados podem divergir dele.
1º de abril de 1992: o salário mínimo de Nova Jersey aumenta de US$ 4,25 para US$ 5,05 por hora.
A vizinha Pensilvânia não mudou seu nível de salário mínimo.
Nos EUA, existe um salário mínimo nacional, mas os estados podem divergir dele.
1º de abril de 1992: o salário mínimo de Nova Jersey aumenta de US$ 4,25 para US$ 5,05 por hora.
A vizinha Pensilvânia não mudou seu nível de salário mínimo.
Nos EUA, existe um salário mínimo nacional, mas os estados podem divergir dele.
1º de abril de 1992: o salário mínimo de Nova Jersey aumenta de US$ 4,25 para US$ 5,05 por hora.
A vizinha Pensilvânia não mudou seu nível de salário mínimo.
Pensilvânia e Nova Jersey são muito semelhantes: instituições semelhantes, hábitos semelhantes, consumidores semelhantes, renda semelhante, clima semelhante, etc.
Pesquisados 410 estabelecimentos de fast-food em Nova Jersey (NJ) e leste da Pensilvânia
Tempo:
Pesquisados 410 estabelecimentos de fast-food em Nova Jersey (NJ) e leste da Pensilvânia
Tempo:
Pesquisados 410 estabelecimentos de fast-food em Nova Jersey (NJ) e leste da Pensilvânia
Tempo:
Pesquisados 410 estabelecimentos de fast-food em Nova Jersey (NJ) e leste da Pensilvânia
Tempo:
Que comparações você acha que eles fizeram?
Pesquisados 410 estabelecimentos de fast-food em Nova Jersey (NJ) e leste da Pensilvânia
Tempo:
Que comparações você acha que eles fizeram?
Vamos dar uma olhada nos dados
Pesquisados 410 estabelecimentos de fast-food em Nova Jersey (NJ) e leste da Pensilvânia
Tempo:
Que comparações você acha que eles fizeram?
Vamos dar uma olhada nos dados
## # A tibble: 6 × 6## sheet chain state observation empft emppt## <chr> <chr> <chr> <chr> <dbl> <dbl>## 1 46 bk Pennsylvania February 1992 30 15 ## 2 49 kfc Pennsylvania February 1992 6.5 6.5## 3 506 kfc Pennsylvania February 1992 3 7 ## 4 56 wendys Pennsylvania February 1992 20 20 ## 5 61 wendys Pennsylvania February 1992 6 26 ## 6 62 wendys Pennsylvania February 1992 0 31
Emprego médio por loja antes e depois do aumento do salário mínimo de NJ
Variáveis | Pensilvania | Nova Jersey |
---|---|---|
emprego FTE antes | 23.33 | 20.44 |
emprego FTE depois | 21.17 | 21.03 |
Mudança na média emprego FTE | -2.17 | 0.59 |
Emprego médio por loja antes e depois do aumento do salário mínimo de NJ
Variáveis | Pensilvania | Nova Jersey |
---|---|---|
emprego FTE antes | 23.33 | 20.44 |
emprego FTE depois | 21.17 | 21.03 |
Mudança na média emprego FTE | -2.17 | 0.59 |
Estimativa causal de diferenças em diferenças: 0,59−(−2,17)=2,76
Interpretação: o aumento do salário mínimo levou a um aumento no emprego FTE por loja de 2,76 em média.
Sim, a essência das diferenças-em-diferenças é assim simples! 😀
Vejamos esses resultados graficamente.
Na prática, o DID é geralmente estimado em mais de 2 períodos (4 observações)
Há mais pontos de dados antes e depois da alteração da política
Na prática, o DID é geralmente estimado em mais de 2 períodos (4 observações)
Há mais pontos de dados antes e depois da alteração da política
3 ingredientes:
Na prática, o DID é geralmente estimado em mais de 2 períodos (4 observações)
Há mais pontos de dados antes e depois da alteração da política
3 ingredientes:
Na prática, o DID é geralmente estimado em mais de 2 períodos (4 observações)
Há mais pontos de dados antes e depois da alteração da política
3 ingredientes:
Variável dummy de tratamento: TREATs onde o subscrito s nos lembra que o tratamento está no nível do estado
Variável dummy dos períodos de pós-tratamento: POSTt onde o subscrito t nos lembra que esta variável varia ao longo do tempo
Na prática, o DID é geralmente estimado em mais de 2 períodos (4 observações)
Há mais pontos de dados antes e depois da alteração da política
3 ingredientes:
Variável dummy de tratamento: TREATs onde o subscrito s nos lembra que o tratamento está no nível do estado
Variável dummy dos períodos de pós-tratamento: POSTt onde o subscrito t nos lembra que esta variável varia ao longo do tempo
Termo de interação entre os dois: TREATs×POSTt 👉 o coeficiente neste termo é o efeito causal DID!
Variável dummy de tratamento TREATs={0se s=Pensilvânia1se s=Nova Jersey
Variável dummy de tratamento TREATs={0se s=Pensilvânia1se s=Nova Jersey
Variável dummy pós-tratamento POSTt={0se t<1º abril, 19921se t≥1º abril, 1992
Variável dummy de tratamento TREATs={0se s=Pensilvânia1se s=Nova Jersey
Variável dummy pós-tratamento POSTt={0se t<1º abril, 19921se t≥1º abril, 1992
Quais observações correspondem a TREATs×POSTt=1?
Variável dummy de tratamento TREATs={0se s=Pensilvânia1se s=Nova Jersey
Variável dummy pós-tratamento POSTt={0se t<1º abril, 19921se t≥1º abril, 1992
Quais observações correspondem a TREATs×POSTt=1?
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Temos o seguinte:
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Temos o seguinte:
E(EMPst|TREATs=0,POSTt=0)=α
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Temos o seguinte:
E(EMPst|TREATs=0,POSTt=0)=α
E(EMPst|TREATs=0,POSTt=1)=α+γ
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Temos o seguinte:
E(EMPst|TREATs=0,POSTt=0)=α
E(EMPst|TREATs=0,POSTt=1)=α+γ
E(EMPst|TREATs=1,POSTt=0)=α+β
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Temos o seguinte:
E(EMPst|TREATs=0,POSTt=0)=α
E(EMPst|TREATs=0,POSTt=1)=α+γ
E(EMPst|TREATs=1,POSTt=0)=α+β
E(EMPst|TREATs=1,POSTt=1)=α+β+γ+δ
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Temos o seguinte:
E(EMPst|TREATs=0,POSTt=0)=α
E(EMPst|TREATs=0,POSTt=1)=α+γ
E(EMPst|TREATs=1,POSTt=0)=α+β
E(EMPst|TREATs=1,POSTt=1)=α+β+γ+δ
[(4)−(3)]−[(2)−(1)]=δ
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Temos o seguinte:
E(EMPst|TREATs=0,POSTt=0)=α
E(EMPst|TREATs=0,POSTt=1)=α+γ
E(EMPst|TREATs=1,POSTt=0)=α+β
E(EMPst|TREATs=1,POSTt=1)=α+β+γ+δ
[(4)−(3)]−[(2)−(1)]=δ δ: efeito causal do aumento do salário mínimo sobre o emprego
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Em formato de tabela:
Pré | Pós | Δ(Pós - Pré) | |
---|---|---|---|
Pensilvânia (PA) | α | α+γ | γ |
Nova Jersey (NJ) | α+β | α+β+γ+δ | γ+δ |
Δ(NJ - PA) | β | β+δ | δ |
EMPst=α+βTREATs+γPOSTt+δ(TREATs×POSTt)+εst
Em formato de tabela:
Pré | Pós | Δ(Pós - Pré) | |
---|---|---|---|
Pensilvânia (PA) | α | α+γ | γ |
Nova Jersey (NJ) | α+β | α+β+γ+δ | γ+δ |
Δ(NJ - PA) | β | β+δ | δ |
Esta tabela generaliza para outras configurações substituindo Pensilvânia por Controle e Nova Jersey por Tratamento
Hipótese de tendências comuns ou paralelas: sem qualquer aumento do salário mínimo, a tendência de emprego de fast-food na Pensilvânia teria sido o que deveríamos esperar ver em Nova Jersey.
Hipótese de tendências comuns ou paralelas: sem qualquer aumento do salário mínimo, a tendência de emprego de fast-food na Pensilvânia teria sido o que deveríamos esperar ver em Nova Jersey.
Hipótese de tendências comuns ou paralelas: sem qualquer aumento do salário mínimo, a tendência de emprego de fast-food na Pensilvânia teria sido o que deveríamos esperar ver em Nova Jersey.
Esta hipótese afirma que a tendência de emprego de fast-food da Pensilvânia entre fevereiro e novembro de 1992 fornece uma tendência confiável de emprego contrafactual que a indústria de fast-food de Nova Jersey teria experimentado caso não tivesse aumentado seu salário mínimo.
Impossível validar ou invalidar completamente esta hipótese (não-testável).
Verificação intuitiva: comparar tendências antes da mudança de política e boa argumentação da comparabilidade dos grupos
Aqui estão as tendências reais para a Pensilvânia e Nova Jersey
Aqui estão as tendências reais para a Pensilvânia e Nova Jersey
O principal pressuposto subjacente à estimativa de DID é que, no estado sem tratamento, o resultado do restaurante i no estado s no momento t é dado por:
E[Y0ist|s,t]=γs+λt
Duas suposições implícitas:
Viés de seleção: refere-se a características de estado fixo (γ)
Tendência temporal: mesma tendência temporal para grupos tratamento e controle (λ)
Resultados no grupo de comparação:
E[Yist|s=Pensilvânia,t=Fev]=γPA+λFev
Resultados no grupo de comparação:
E[Yist|s=Pensilvânia,t=Fev]=γPA+λFev E[Yist|s=Pensilvânia,t=Nov]=γPA+λNov
Resultados no grupo de comparação:
E[Yist|s=Pensilvânia,t=Fev]=γPA+λFev E[Yist|s=Pensilvânia,t=Nov]=γPA+λNov
E[Yist|s=Pensilvânia,t=Nov]−E[Yist|s=Pensilvânia,t=Fev]=γPA+λNov−(γPA+λFev)=λNov−λFev⏟tendência temporal
Resultados no grupo de comparação:
E[Yist|s=Pensilvânia,t=Fev]=γPA+λFev E[Yist|s=Pensilvânia,t=Nov]=γPA+λNov
E[Yist|s=Pensilvânia,t=Nov]−E[Yist|s=Pensilvânia,t=Fev]=γPA+λNov−(γPA+λFev)=λNov−λFev⏟tendência temporal
➡️ o grupo de comparação permite estimar a tendência temporal.
Seja δ o verdadeiro impacto do aumento do salário mínimo:
E[Y1ist−Y0ist|s=Nova Jersey,t=Nov]:=δ
Seja δ o verdadeiro impacto do aumento do salário mínimo:
E[Y1ist−Y0ist|s=Nova Jersey,t=Nov]:=δ
Resultados no grupo de tratamento:
E[Yist|s=Nova Jersey,t=Fev]=γNJ+λFev
Seja δ o verdadeiro impacto do aumento do salário mínimo:
E[Y1ist−Y0ist|s=Nova Jersey,t=Nov]:=δ
Resultados no grupo de tratamento:
E[Yist|s=Nova Jersey,t=Fev]=γNJ+λFev E[Yist|s=Nova Jersey,t=Nov]=γNJ+δ+λNov
Seja δ o verdadeiro impacto do aumento do salário mínimo:
E[Y1ist−Y0ist|s=Nova Jersey,t=Nov]:=δ
Resultados no grupo de tratamento:
E[Yist|s=Nova Jersey,t=Fev]=γNJ+λFev E[Yist|s=Nova Jersey,t=Nov]=γNJ+δ+λNov E[Yist|s=Nova Jersey,t=Nov]−E[Yist|s=Nova Jersey,t=Fev]=γNJ+δ+λNov−(γNJ+λFeb)=δ+λNov−λFeb⏟tendência temporal
Portanto nós temos que:
E[Yist|s=PA,t=Nov]−E[Yist|s=PA,t=Fev]=λNov−λFeb⏟tendência temporal
Portanto nós temos que:
E[Yist|s=PA,t=Nov]−E[Yist|s=PA,t=Fev]=λNov−λFeb⏟tendência temporal
E[Yist|s=NJ,t=Nov]−E[Yist|s=NJ,t=Fev]=δ+λNov−λFeb⏟tendência temporal
Portanto nós temos que:
E[Yist|s=PA,t=Nov]−E[Yist|s=PA,t=Fev]=λNov−λFeb⏟tendência temporal
E[Yist|s=NJ,t=Nov]−E[Yist|s=NJ,t=Fev]=δ+λNov−λFeb⏟tendência temporal
DID=E[Yist|s=NJ,t=Nov]−E[Yist|s=NJ,t=Fev]−(E[Yist|s=PA,t=Nov]−E[Yist|s=PA,t=Fev])=δ+λNov−λFeb−(λNov−λFeb)=δ
Veja que E[Y0ist|s=NJ,t=Nov] é um valor contrafactual.
Economistas tipicamente utilizam testes de placebo (também conhecidos como falsificação)
O teste placebo mais utilizado é obter observações de um período anterior ao próprio período pré-tratamento e utilizá-las no design como se fossem observações posteriores.
Se havia tendências paralelas entre os períodos pré-tratamento (t−1,t0), então não deve aparecer efeito na regressão
Suponha que temos observações de Jan/92:
DID=E[Yist|s=NJ,t=Jan]−E[Yist|s=NJ,t=Fev]⏟tendência NJ−(E[Yist|s=PA,t=Jan]−E[Yist|s=PA,t=Fev]⏟tendência PA)=0caso sejam tendências paralelas
Uma generalização para o teste de placebo é analisar os coeficientes de leads de um estudo de eventos.
Ideia básica é: efeito do tratamento antes de sua aplicação deve ser zero entre grupos com tendências paralelas.
Yist=γs+λt+−1∑τ=−qγτDst+p∑τ=0δτDst+εist
GERTLER, Paul J. et al. Avaliação de Impacto na Prática, 2018. - 2. ed. Banco Mundial. Capítulo 7 Diferenças em diferenças
ANGRIST, Joshua D.; PISCHKE, Jörn-Steffen. Mostly harmless econometrics: An empiricist's companion. Princeton university press, 2009. Section 5.2 Differences-in-differences
CUNNINGHAM, Scott. Causal Inference: The Mixtape, New Haven: Yale University Press, 2021. URL: https://mixtape.scunning.com/. Chapter 9 Difference-in-differences
[1]: Este slides foram baseados nas aulas de econometria da SciencesPo Department of Economics
Slides | |
@rfbressan | |
Lista de Exercícios V |
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |