Comparar las regresiones de datos en panel: SUR (Seemingly Unrelated Regression), con dummies y con efectos fijos.
Abrir el archivo Panel data.xlsx.
Para comenzar el análisis siempre es recomendable hacer una tabla de estadísticos descriptivos (omitida) y hacer una tabla de correlaciones (ya incluida).
Inspeccionar la data. Las 1164 observaciones que corresponden a 5 países desde el año 2000 hasta el año 2006. Las variables son: TOBINQ, TOP1VR, RAT1, Cfcon1, Lsize, Volatility, Leverage, Year, Country.

En la hoja CR_TS_SUR year country, en la tabla de correlaciones para Brazil desde el año 2000 hasta el año 2006 se observa que la variable dependiente TOBINQ está negativamente correlacionada con TOP1VR y positivamente correlacionada con RAT1. Los signos de las correlaciones son los esperados según la TEORIA, la REVISIÓN de la LITERATURA y las HIPÓTESIS.
Ordenar la data por país. Hacer la regresión para Brazil, en la celda U1. Formatear. Inspeccionar. Interpretar.
Esta es una regresión longitudinal (transversal-de series de tiempo), potencialmente afectada por problemas de autocorrelación.
Ordenar la data por año. Comparando las tablas de correlaciones para los años 2000 y 2006 se observa que la magnitud de las correlaciones cambia con el tiempo, incluso algunos signos cambian. El periodo de estudio incluye un cambio estructural que vale la pena tomar en cuenta, apoyándose en la TEORÍA, la REVISIÓN de la LITERATURA y las HIPÓTESIS.
Se evidencia la importancia de incluir la dimensión tiempo en el análisis.
Hacer la regresión para el año 2000 en la celda K27 y para el año 2006 en la celda U27. Formatear. Inspeccionar. Interpretar.
Estas son regresiones transversales (cross-sectional).
Cuando la data se encuentra en formatos impresos, que toman tiempo digitalizar, se puede aplicar cortes en el tiempo, como en este caso para comparar los coeficientes y sacar conclusiones.
Hacer la regresión para los años 2000 hasta 2006 para todos los países en la celda K1. Formatear. Inspeccionar. Interpretar.
Esta regresión de datos en panel (Seemingly Unrelated Regression SUR o Pool) asume que todos los países y año son iguales (las observaciones son independientes).

En la hoja Panel Dummies, las variables dummies para cada país ya están creadas. Una variable dummie toma el valor 1 para las observaciones de un país y 0 para todas las demás observaciones. Omitir la dummie para Brazil, el país con más observaciones. Incluirla, generaría un severo problema de multicolinealidad ya que es una combinación lineal exacta de las otras variables dummies. Organizar la data de los regresores TOP1VR, RAT1, Cfcon1, Lsize, Volatility, Leverage, Chile, Colomb, Peru, Venezu en columnas consecutivas, como lo requiere Excel.
Hacer la regresión para los años 2000 hasta 2006 para todos los países en la celda P28. Formatear. Inspeccionar. Interpretar. Al controlar por las diferencias (implícitas) entre países el coeficiente de la variable TOP1VR (principal variable de interés) resulta significativamente distinto de 0, cuando no lo es en la especificación SUR.
Además de incluir la dimensión tiempo se está controlado por diferencias no observadas entre países.
Un test (Breusch-Pagan, 1980) no disponible en Excel, sugeriría una especificación de efectos fijos descartando la especificación SUR. Otro test (Hausman, 1978) no disponible en Excel, permitiría distinguir entre efectos fijos y efectos aleatorios.

En la hoja Panel FE, se calcula en columnas consecutivas el promedio de cada variable (excluyendo las dummies) por país y se resta al valor de la variable. (Se está usando la fórmula PROMEDIO.SI.CONJUTO, anidada. Probablemente hay otras formas más eficientes de hacerlo).
Se dice que el panel no es balanceado porque no tiene el mismo número de observaciones (años) para todos los países.
Hacer la regresión de las nuevas variables calculadas: variable dependiente menos su promedio por país (TOBINQ-X), con regresores menos su promedio por país (TOP1VR-X, RAT1-X, Cfcon1-X, Lsize-X, Volatility-X, Leverage-X) para los años 2000 hasta 2006 para todos los países en la celda W58.
Formatear. Inspeccionar. Interpretar. La regresión de datos en panel por efectos fijos incluye la dimensión tiempo y controla por diferencias no observadas entre países. ¿Cómo así? Imagine que hubiera una variable adicional con valores contantes en el tiempo, pero diferentes para cada país. El promedio de una constante es el mismo valor de la constante y al restarlo de la variable se anula. Así se elimina errores de especificación en el modelo por la omisión de variables no observadas específicas de la entidad (país o empresa) e invariables en el tiempo.
El valor del coeficiente de la variable de interés (TOP1VR-X) es el mismo que para TOP1VR en la especificación con dummies.
Si bien el p-value es numéricamente distinto, debido a la diferencia en grados de libertad, las conclusiones son las mismas: el coeficiente de la variable de interés (TOP1VR-X) resulta negativo y significativamente distinto de 0.
La especificación de efectos fijos es preferible a la especificación con variables dummies por el principio de parsimonia.(*)
¡El resultado debe verse como en las figuras!
Guardar y cerrar el archivo.
Por favor, me comentan si les salió, también me comentan si hay algún error (de tipeo).😊
Si algún archivo no descarga, no duden en solicitarlo por e-mail.

(*) Estos últimos resultados se pueden obtener también con STATA. Notar que los coeficientes y p-values son similares, excepto para la intercepción. Esto se debe a la forma como se calculan los errores, pero la intercepción en realidad no interesa en este caso.
cd: C:\....\Downloads /* ubica el archivo de data, donde esté */
cls /* pantalla en blanco */
clear /* limpia la memoria */
use Ownership_data /* abre el archivo de data */
xtreg tobinq top1vr rat1 cfcon1 lsize volatility leverage, fe i(cnum) cformat(%9.3f)
¡Puedes compartir en las redes sociales!😉
Comments