Thursday, April 6, 2017

Omitted Variable

Secara bahasa, omitted variable adalah variabel yang dihilangkan.

Dalam statistika, penghilangan suatu variabel padahal variabel itu penting dalam suatu model, maka bisa mengakibatkan estimasi dari parameter yang ada dalam model menjadi bias. Kondisi dimana terjadi bias dalam estimasi paramater dalam model akibat dari adanya variabel yang dihilangkan (tidak dimasukkan) disebut omitted variable bias.

Sunday, April 2, 2017

Manfaat Collapse Pada Stata

Apabila kita memiliki unit observasi yang memiliki nilai yang sama (karakter yang sama) pada suatu atau beberapa variabel tertentu, dan kita ingin menggabungkan nilai-nilai yang berbeda sehingga hanya menjadi satu individu saja, maka fasilitas collapse dapat digunakan. Berikut contoh command-nya:

collapse (mean) luas_lantai (sum) penghasilan harta, by (var1 var2 var 3)

Untuk setiap individu yang memiliki nilai var1 var2 var3 yang sama, akan digabung menjadi satu individu dengan luas_lantai yang baru adalah rata-rata, dan nilai penghasilan adalah jumlah seluruh penghasilan, serta nilai harta adalah jumlah dari seluruh harta.

Jika command di atas dieksekusi, akan terbentuk file baru yang hanya berisi variabel var1, var2, var3, luas_lantai, penghasilan, dan harta. Adapun variabel-variabel lain selain variabel di atas jika ada pada file yang sebelum di-collapse, akan dihilangkan oleh stata. Anda harus berhati-hati jangan sampai me-replace file awal. Untuk lebih aman, simpanlah file hasil collapse Anda dengan nama file yang baru: save D:\file_baru.

Saturday, April 1, 2017

Cara Melakukan Merge Data Pada Stata

Apabila kita ingin menggabungkan data-data yang ada pada dua file menjadi satu file utuh, kita bisa menggunakan fasilitas merge.
Syntax-nya adalah:

use nama_file_asal_dta, clear
merge m:1 id using nama_file_tujuan_dta
save nama_file_baru_hasil_merge_dta 

Perhatikan syntax di atas, tulisan yang ditulis tebal adalah perintah dari stata. Adapun yang berwarna biru adalah nama file yang bisa kita rubah-rubah namanya, yang jelas formatnya adalah .dta. 

Adapun tulisan yang berwarna merah (dalam contoh di atas adalah id), adalah nama variabel yang kita jadikan kunci untuk menyatukan kedua file. Masing-masing file baik itu file asal (file master) dan file tujuan (file using), harus memiliki variabel id. Sehingga observasi dengan id yang sama di kedua file akan disatukan datanya.

Syntax m:1 artinya, variabel id pada file asal tidak unik sementara pada file tujuan unik (hanya ada 1 observasi dengan id tertentu). Sebenarnya ada lagi selain pilihan m:1 yang bisa kita jadikan perintah dalam stata, yaitu:
1:m yaitu ketika file asal variabel id unik namun di tujuan tidak unik.
1:1 yaitu ketika file asal dan file tujuan sama-sama memiliki variabel id yang unik.
m:m yaitu ketika file asal dan file tujuan memiliki variabel id yang tidak unik.

Kunci untuk mempersatukan kedua file bisa lebih dari satu variabel, misal variabel id dan tinggi dan berat. Sehingga syntax-nya menjadi:

use file_asal
merge m:1 id tinggi berat using file_tujuan
save file_baru

Stata akan menunjukkan status match (kecocokan) dari data yang dipersatukan (data hasil merge), yaitu dengan kode:
_m==1 ketika variabel kunci hanya ada di file asal
_m==2 ketika variabel kunci hanya ada di file tujuan
_m==3 ketika variabel kunci ada di file asal dan file tujuan
Sehingga, kecocokan terjadi ketika _m==3.

Adapun syntax terakhir adalah save, yaitu untuk menyimpan file hasil merge yang kita lakukan.