Xtprobit fixed effects in stata forex


Eu tenho um conjunto de dados de painel com uma amostra de 800 grupos, cada um com entre 200-500 observações. Os dados são assim: a variável dependente é binomial: closegp30f30. As variáveis ​​independentes são taxas de crescimento contínuas. Um exemplo de resumo de um desses é: Gostaria de executar esta regressão experimental: no entanto, quando adiciono mais do que cerca de 5 variáveis, a regressão nunca converge e parece que me encostei em um loop de iterações de backup, assim: eu Também repetiram essa regressão com todas as informações de depuração habilitadas, isso é uma grande quantidade de informações, mas pode fornecer a resposta sobre por que não é convergente. Note-se que, aqui, regredisse os valores padronizados das variáveis ​​independentes, mas isso teve exatamente o mesmo efeito (por alguma razão, eu esperava que solucionasse meu problema). Minhas principais perguntas são: Por que não é convergente Como posso resolver esta situação Atualização: verificações de multicolinearidade Isso também não parece ser um problema. Atualização 2: com opção de gradiente e limites modificados: não sei se isso ajuda, mas quando eu faço xtdata indepvars, eu (tickerid) fe clear seguido de um logit depvar indepvar (que normalmente funcionou bem), o logit parece ficar preso também. Eu, portanto, acredito que ele tem algo a ver com efeitos fixos e os dados do painel. Isso faz sentido Como mencionado, eu já tentei difícil. Sem efeito. Ainda não compreendo por que isso está acontecendo. É o meu dado? Como eu determino qual variável está causando isso? Posso transformá-lo para resolver o problema? Você quer que eu o execute novamente com dificuldade e publicar o novo arquivo de log. A regressão está na iteração 34 agora e o gradiente ainda é 2111.886 ndash Tom Mar 30 13 às 22:42 Uma resposta curta é que os modelos complicados são muitas vezes difíceis de caber Você deve tentar um modelo muito mais simples primeiro. Talvez haja problemas devido a altas correlações entre preditores. Às vezes, o uso da opção difícil ajuda. O ponto de tentar um modelo mais simples primeiro é duplo. Se você não conseguir um modelo mais simples para caber, um modelo mais complicado é ainda menos propenso a caber. Mais especificamente, pode ser possível identificar quais preditores são problemáticos: à medida que você os adiciona, as coisas são detectáveis. Às vezes, as pessoas tentam transformar as taxas de crescimento com alguma transformação que preserva os sinais, como a raiz do cubo ou uma função hiperbólica inversa. Isso é sugerido porque o seu preditor de amostra é extremamente distorcido com uma alta cursite, com valores abertos de taxas de crescimento muito elevadas. Isso poderia ser seriamente problemático. Além disso, uma suposição difícil é que, embora sua resposta seja de 0,1, ela aparece do mesmo tipo que as outras: sua dicotomização foi algo como (valor limite). Se assim for, você pode ter descartado a maioria das informações na resposta original e Você está tentando explicar isso pelo ruído mais outliers. Essa é uma leitura altamente pessimista, mas parece inteiramente consistente com o que você está nos dizendo. Você tem experiência anterior montando modelos similares com dados semelhantes, ou há literatura que implique que eles funcionam atendidos 30 de março 13 às 21:04 Quando eu tento menos variáveis ​​como g1, g3, g10, g15, ele funciona. Mas quando eu começar a adicionar mais do que 5 não converge. Como isso me ajuda, eu preciso incluir todas as variáveis ​​e ver sua importância. Eu atualizei minha pergunta original com uma verificação de multicolinearidade: isso não parece ser o problema. Eu também tentei a opção difícil, mas não ajudou. Ndash Tom Mar 30 13 às 21:55 Em resposta à sua atualização: fiz uma dicotomização da variável dependente. É um quando a taxa de crescimento futuro é positiva e zero quando é negativo ou zero. Os meus motivos para isso são fundamentados porque eu não preciso saber mais do que esse comportamento ascendente ou descendente, e isso me permite usar um modelo logístico com pressupostos laxer do que regressões OLS. Meus resultados iniciais parecem confirmar isso, porque as previsões feitas pela regressão OLS são muitas vezes inválidas (mesmo quando se olham unicamente para o sinal de crescimento) do que as previsões feitas pela regressão logística de efeitos fixos. Ndash Tom Mar 31 13 às 15: 07Anúncio 19 de fevereiro de 2017, 08:26 Para adicionar ao comentário de Maartens, o termo quotfixed-effectsquot parece ser usado para descrever coisas muito diferentes na literatura. Do jeito que eu vejo - e isso pode muito bem se aplicar apenas às ciências sociais - as pessoas vêm da literatura multinível, onde o exemplo clássico da estrutura de dados é alunos aninhados nas escolas. Para eles, o termo quotfixed-effectsquot significa que um efeito de variável é corrigido no sentido, que o efeito não varia entre as unidades (alunos ou escolas). Estes efeitos são estimados nos chamados modelos mistos. Isso não tem nada a ver com a capacidade de controlar a heterogeneidade (não observada) que é constante nas observações de nível superior (aqui: escolas). O segundo grupo vem do painel-literatura, onde o exemplo clássico é observado em diferentes pontos do tempo, ou seja, ocasiões aninhadas em indivíduos. Aqui quotfixed-effectsquot geralmente significa (tempo) degradado ou estimador dentro da variância (em modelos não-lineares é um estimador de probabilidade condicional). Esses efeitos não são estimados (além do estimador LSDV). Tais modelos controlam a heterogeneidade (não observada) que é constante nas observações de nível superior (aqui: indivíduos). Demorou bastante tempo para descobrir que a estrutura de dados é o mesmo em ambos os casos e que os mesmos métodos para analisá-los podem ser usados ​​em ambos os casos. Isso realmente é bastante claro para mim agora, mas na minha experiência, muitas pessoas não percebem que essas duas coisas são realmente as mesmas e falam sobre modelos multiníveis ou hierárquicos como algo completamente diferente do que eles chamam de modelos de painel. Última edição por daniel klein 19 de fevereiro de 2017, 08:33. 19 de fevereiro de 2017, 10:50 eu segundo observações de Daniels. Mas minha interpretação difere de Marcoss. Para mim, a referência aos modelos de efeitos mistos quotmultilevel (ou seja, hierárquicos) quase sempre se refere ao que os economistas se referem como quotrandom effectsquot models. Os modelos de efeitos fixos para os economistas são aqueles em que há interceptações fixas específicas da unidade (embora, de acordo com os níveis de liberdade, também possam se referir a parâmetros de inclinação específicas da unidade). NB quotunit-specificquot, o que significa que os interceptos não são extraídos de uma distribuição, normalmente normal, e são assumidos não correlacionados com características observadas da unidade. A abordagem FE não depende da falta de correlação. Apenas porque os dados têm uma estrutura aninhada ou hierárquica não implica necessariamente que se deve usar um modelo multinível (ou seja, efeitos aleatórios). O que é consistente com o que Daniel diz. 19 de fevereiro de 2017, 13:28 Parece que chegamos a um ponto controverso sob alguns aspectos. Ou não, espero. Em termos teóricos, não posso realmente dar uma resposta pessoal: muito além das minhas habilidades. Mas eu ainda não entendo o que há de errado ao afirmar que os dados do painel devem ser considerados como um caso específico dos modelos mistos multi-nível muito mais amplos, com resultados equivalentes quando há apenas um nível. Na verdade, e talvez não seja um ponto de vista unânime, é como eu aprendi, de acordo com livros referenciais e palestrantes. Por exemplo: O modelo de variância e componentes considerado aqui usando xtreg - é um caso especial simples de um modelo linear de efeitos mistos, o comando xtmixed (Rabe-Hesketh e Skrondal. Modelagem multinível e longitudinal usando Stata. Terceira edição. StataPress, 2017, p .85). O modelo mais simples deste tipo é o modelo linear misturado, um modelo de regressão com um ou mais efeitos aleatórios. Um caso especial deste modelo é o modelo de dados de painel de efeitos aleatórios implementado pelo xtreg, re que já discutimos. Se o único coeficiente aleatório for uma intercepção aleatória, esse comando deve ser usado para estimar o modelo. Para modelos mais complexos, o comando xtmixed pode ser usado para estimar uma regressão de efeitos múltiplos de vários níveis. (Cristopher F Baum: Modelos para dados do painel longitudinal e modelos mistos. Link: economics. adelaide. edu. au. ALecture3.pdf Do manual Statas (statamanuals13me. pdf). Porque este - modelo misto é um modelo simples de interceptação aleatória Por ML, seria equivalente a usar xtreg com sua opção mle. Além disso, há uma consulta que fiz no ano passado para Gustavo Sanchez (StataCorp) durante um curso de dados do painel, exatamente devido ao meu espanto pela comparação que fiz entre mesclado E xtreg-. Na carta, comentei: fiz uma comparação entre ambos os modelos e obtive exatamente os mesmos resultados. Como eu deveria escolher o melhor E a resposta da StataCorp: Você obtém o mesmo resultado com misto, ml Stddeviations e xtreg, porque o último se encaixa em um modelo que é um caso particular para o modelo de efeitos mistos. Além disso, ambas as especificações da linha de comando estão usando o mesmo estimador mle. Observe que com o xtreg, você pode ajustar os efeitos aleatórios unidirecionais Modelo, que é o mesmo que o efeito misto S modelo com apenas um nível para o componente de efeitos aleatórios. Quanto à relação entre modelos hierárquicos e de vários níveis: é conveniente especificar um modelo de liner mixed (LMM) em termos de uma hierarquia explicitamente definida de modelos mais simples. Que correspondem aos níveis de um conjunto de dados agrupados ou longitudinais. Quando os LMMs são especificados de tal forma, eles são freqüentemente referidos como modelos lineares hierárquicos (HLMs), ou modelos multiníveis (MLMs) (West, Welch, Gatecki. Modelos mistos lineares: um guia prático usando software estatístico. Segunda edição. CRC Press, 2017, página 22) Todos esses autores, coincidentemente, parecem seguir na mesma direção que sublinhei na última mensagem. Sinceramente, não posso imaginar em que ponto essas declarações podem estar erradas. Portanto, e também sinceramente, parece-me que todos estamos falando neste tópico sobre o mesmo assunto, mas não necessariamente contra ou a favor. E eu concordo, absolutamente, que os efeitos fixos podem ter diferentes significados sob diferentes especialidades, e não apenas modelos mistos, mas também modelos aninhados (como o Nestreg, por exemplo) podem lidar com estruturas hierárquicas, sob certas condições. Eu realmente me desculpo por ter escrito uma mensagem tão longa. Minha culpa, sem dúvida. Como Pascal disse uma vez (e aqui apenas parafraseando o Filósofo-Matemático), infelizmente eu não tive tempo para torná-lo mais curto, como deveria. Última edição por Marcos Almeida 19 de fevereiro de 2017 às 13h34. 19 de fevereiro de 2017, 14:01. Penso que há duas confusões terminológicas acontecendo ao mesmo tempo: o termo efeitos fixos significa coisas diferentes em tradições diferentes e modelos de vários níveis e modelos de painéis são praticamente a mesma coisa. O problema Stephen teve com sua afirmação de que os dados do painel deveriam ser considerados como um caso específico de modelos de efeitos múltiplos de vários níveis. O problema é que, para economistas, quotmulti-levelquot é igual a efeitos aleatórios. Isso não é verdade em outras disciplinas, mas isso não faz isso menos problema se você é um economista. Então eu suspeito que vocês dois estão certos e que a terminologia usada nesta área é uma bagunça impossível.

Comments