Чому економісти (або інші люди) вивчають або використовують економетрику?
Одна проста відповідь: дізнавайтеся про світ за допомогою даних.
дізнайтеся про світ = Ставте, відповідайте та обдумуйте запитання, теорії, припущення.
дані = множина даних.
Чому економетрика?
Приклад
Середній бал є результатом навичок (здібностей) і навчальних годин (вхідних даних). Отже, можна припустити модель
\[\text{GPA}=f(H, \text{SAT}, \text{PCT})\]
де \(H\) — це навчальні години, \(\text{SAT}\) — оцінка SAT, а \(\text{PCT}\) — відсоток занять, які відвідав студент. Ми очікуємо, що GPA зросте з кожною з цих змінних (\(H\), \(\text{SAT}\) і \(\text{PCT}\)).
Але кому потрібно очікати?
Ми можемо перевірити ці гіпотези використовуючи регресійну модель.
A: Додаткова година в класі корелює зі збільшенням середнього балу (з урахуванням SAT і PCT) на \(\beta_1\).
Q: Коефіцієнт \(\beta_k\) є параметрами генеральної сукупності чи вибірковою статистикою?
A: грецькі літери позначають параметри генеральної сукупності. Їхні оцінки отримують “кришки”, наприклад, \(\hat{\beta}_k\).
Q: Чи можемо ми інтерпретувати оцінки для \(\beta_2\) як причинно-наслідкові?
A: Не без додаткових припущень і/або знання процесу генерування даних.
Q: Що таке \(\varepsilon_i\)?
A: Випадкове відхилення/порушення студента від параметрів сукупності.
Q: Які припущення ми робимо під час оцінювання за допомогою OLS?
A:
Зв’язок між GPA та пояснювальними змінними є лінійним за параметрами, і \(\varepsilon\) входить адитивно.
Пояснювальними змінними є екзогенні, тобто, \(E[\varepsilon|X] = 0\).
Ви також зазвичай припускаєте щось на кшталт: \(E[\varepsilon_i] = 0\), \(E[\varepsilon_i^2] = \sigma^2\), \(E[\varepsilon_i \varepsilon_j] = 0\) для \(i \neq j\).
І (можливо) \(\varepsilon_i\) розподілено нормально.
Припущення
Наскільки вони важливі?
Ви дізналися, наскільки потужною та гнучкою може бути звичайна регресія за методом найменших квадратів (OLS).
Однак результати, які ви дізналися, вимагали припущень.
Реальне життя часто порушує ці припущення.
Питання: «що станеться, якщо ми порушимо ці припущення?» - Чи можемо ми знайти виправлення? (Окремо: як/коли \(\beta\) є причинним?) - Що станеться, якщо ми не застосуємо (або не зможемо) застосувати виправлення?
OLS все ще робить деякі дивовижні речі, але ви повинні знати, коли бути обережним, впевненим чи сумніватися.
R — це безкоштовне програмне середовище для статистичних обчислень і графіки. Він компілюється та працює на різноманітних платформах UNIX, Windows і MacOS.
Що це означає?
R був створений для статистичної та графічної роботи, необхідної економетриці.
R має активну, процвітаючу онлайн-спільноту (stack overflow).
Крім того, вона безкоштовна і з відкритим кодом.
R
Чому ми використовуємо R?
1. R є безкоштовним і з відкритим кодом, що заощаджує 💰💵💰.
2. Пов’язане: За межами невеликої групи економістів, роботодавці приватного та державного секторів віддають перевагу R.
3. R є дуже гнучким і потужним — його можна адаптувати майже до будь-яких завдань, наприклад, «метрики, аналіз просторових даних, машинне навчання, веб-скраппінгу, очищення даних, створення веб-сайтів, навчання. Ця презентація такоє створена за допомогою R.
R
Чому ми використовуємо R?
4. Пов’язане: R не накладає немає обмежень на кількість ваших спостережень, змінних, пам’яті чи потужності обробки.
5. Якщо ви попрацюєте,1 ви отримаєте цінний і товарний інструмент.
6. Я 💖 R
R
R + приклади
R + Regression
# Проста регресія{{fit <-lm(dist ~1+ speed, data = cars)}}# Коефіцієнтиcoef(summary(fit))
Estimate Std. Error t value Pr(>|t|)
(Intercept) -17.579095 6.7584402 -2.601058 1.231882e-02
speed 3.932409 0.4155128 9.463990 1.489836e-12
# Проста та зрозуміла таблицяlibrary(broom)tidy(fit)