Variável Média Como Dependente Variável


Eu tenho uma série de tempo que eu quero usar como resposta em um modelo de regressão. O problema é que eu suspeito que as mudanças nessa variável podem ser devidas a erros de amostragem. Como resultado, criei uma média móvel desta série de tempo para alisar os choques. Agora estou considerando usar isso como a resposta no meu modelo de regressão e não na série original. Nota: Eu não estou construindo um modelo de tipo ARMA. Meus preditores também são séries temporais, como o gasto em mídia e os escores de confiança do consumidor. Pediu 8 de dezembro 14 às 14:07 Você deve identificar a forma dos polinômios (numerador e denominador) para o processo de erro, pois pode ser um AR strucore ou uma estrutura MA ou alguma combinação desses dois. Uma maneira (não necessariamente otimizada) é realizar uma função de transferência com um erro de ruído branco (ou seja, não ARIMA) e, em seguida, identificar uma possível estrutura ARIMA a partir dos resíduos. Ndash IrishStat 8 de dezembro 14 às 15: 09 Tenho um painel mensal de dados não balanceados de dados do balanço de 70 bancos (em média, 170 observações por banco) ao longo de 20 anos. Eu tenho autocorrelação e heterocedasticidade dentro dos painéis. Estou tentando testar as hipóteses de que existe uma relação entre depósitos transacionais e compromisso de crédito (limite de linha de crédito). Gostaria de dizer que todos são iguais, em média, um banco com mais depósitos transacionais ofereceria mais compromissos de crédito com seus clientes. Ou seja, o argumento é que, para produzir compromissos de crédito, um banco precisa de depósitos transaccionais. Em outro passo da pesquisa, o objetivo final é construir algum tipo de função de produção para compromissos de crédito. Minha variável dependente é a proporção de compromissos de crédito para o total de empréstimos (comitRatio). Minha variável independente (regressor) é a relação entre depósitos transacionais e depósitos totais (depRatio). Estou usando logaritmos naturais dessa variável porque eu gostaria de interpretar coeficientes estimados como elasticidades. Então eu tenho ln (comitRatio) e ln (depRatio). Ln (comitRatio) b0 b1 ln (depRatio) b2 X e onde X são variáveis ​​de controle, a maioria delas invariante no tempo. Eu escolhi usar média móvel de 3, 6 e 12 meses para a variável independente ln (depRatio). Isso ocorre porque a hipótese afirma que, no ponto t em tempo, a oferta de compromissos (comitRatio) é decidida com base em depração de períodos anteriores. Além disso, uma vez que a dependência do regressor para alguns bancos (especialmente os mais pequenos) varia muito de um mês para o outro, suponho que uma média móvel me mostre uma imagem melhor. Minha principal preocupação é o efeito ceteris paribus da variável independente sobre o dependente. Estou trabalhando com um modelo de efeito fixo com autocorrelação (modelo AR (1) e erro padrão robusto (comando xtpcse no Stata). O modelo funciona melhor (R2 mais elevado, estimativas de coeficientes mais altas, estatísticas z mais elevadas) quando uso média móvel do que quando uso os valores originais (mesmo quando uso valores retardados, como L. depRatio). Minha pergunta é, dada esta configuração, posso usar a média móvel apenas na variável independente. Eu irei uma variável independente e dependente, ou não seria aconselhável suavizar a variável dependente. O objetivo da sua modelagem poderia ser, p. (1) descritivo, (2) explicativo ou (3) preditivo. Se (1), o alisamento pode ser útil. Você pode obter a tendência de mudança lenta e usar isso para visualizações de dados. Você veria as relações entre os componentes da tendência do movimento lento das diferentes séries mais claramente do que usar a série original. Claro, você teria que reconhecer que o alisamento ocorreu e que as relações que você provocou apenas ocupam por componentes suavizados, enquanto as variáveis ​​reais são mais erráticas. Se (2), usando diretamente variáveis ​​lisas, as estimativas do ponto de confusão e seus erros padrão em seus modelos. Portanto, você não pôde testar hipóteses de forma direta. A decomposição de séries temporais (veja abaixo) provavelmente pode ser útil aqui. Se (3), em vez de suavizar, você poderia tentar decompor as séries temporais na tendência de movimento lento, componentes sazonais e restantes. Então, você poderia tentar modelar e prever cada um deles separadamente e, em seguida, juntar essas previsões para obter uma previsão da variável original. Por outro lado, o alisamento puro pode fazer você perder informações valiosas. Seu caso parece ser explicativo. Se você estiver interessado na relação de longo prazo entre variáveis, você provavelmente deve usar a decomposição de séries temporais e interpretar suas conclusões de acordo. Ou seja, você não deve reivindicar um relacionamento entre as variáveis ​​originais, mas apenas entre componentes específicos. Você também deve pensar se isso tem uma interpretação sensível da matéria. Editar (após uma edição da pergunta): remover o ruído da variável independente por suavização dá-lhe R2 mais alto (como você observa), mas este é um artefato de alisamento, então ele deve ser tomado com um grão de sal. Depois de ter alisado a variável independente, você não deve fazer a inferência direta w. r.t. A variável original. Isso é algo para ter cuidado - veja o meu ponto (2) acima. Contudo . No seu caso, parece que o alisamento pode ter sentido, já que a variável dependente no tempo t não depende do regressor como de um ponto de tempo preciso no passado, mas sim de um intervalo de tempo. Assim, você explicitamente definirá seu regressor como uma versão suave da variável original e você faria inferência em relação a esse regressor suavizado. Isso poderia funcionar. Se você suavizar a variável dependente, também aumentará ainda mais o R2, mas você vai se afastar ainda mais da interpretação direta, pois novamente a mudança no R2 será um artefato de suavização. Como alternativa, você provavelmente poderia experimentar seus dados menos freqüentemente. Então você deve ver mais sinal em relação ao ruído (como o sinal se acumularia entre os pontos de amostra raros, enquanto o ruído não seria), mas você ainda seria capaz de interpretar os resultados diretamente (ao contrário do caso de suavização). No entanto, essa abordagem poderia ser imediatamente criticada por descartar dados. Provavelmente haveria melhores alternativas. Se o regressor suavizado tiver sentido por conta própria, não precisa fazer isso. Respondeu 30 de julho 16 às 17:07 Eu ampliei minha pergunta original. Meu principal objetivo nesta fase é testar que existe uma relação estável entre as variáveis. Não estou disposto a prever. Quando você menciona a decomposição da série quottime, você está se referindo a modelos de regressão específicos ou, por exemplo, usar variáveis ​​simuladas mês e ano em um modelo de efeito fixo é uma decomposição da série quottime em vez de Emiliano A. Carlevaro 1 de agosto 16 às 12:07 Brevemente, você poderia Olhe a decomposição de séries temporais em livros didáticos de econometria, por exemplo, QuotForecasting: Princípios e práticas por Hyndman amp Athanasopoulos (livremente disponível online), seção 6.1. Não tenho em mente uma maneira muito específica de decompor a série. Ndash Richard Hardy 1 de agosto 16 às 18:07

Comments

Popular Posts