Mengenal Central Tendency: Mean, Median, dan Modus
Central Tendency (Tendensi Sentral) merupakan nilai yang menunjukkan titik tengah dari suatu dataset untuk mengetahui dimana posisi banyak nilai data berkumpul di dalam distribusi. Nilai Mean, Median, dan Modus adalah ukuran Central Tendency yang paling umum digunakan. Ketiganya menunjukkan lokasi berkumpulnya data, namun dengan metode dan makna yang berbeda.
Mean
Nilai mean adalah nilai rata-rata. Nilai ini dapat diperoleh dengan menjumlahkan seluruh nilai data dan kemudian membaginya dengan banyak data di dalam dataset.
Rumus mencari nilai Mean dilakukan dengan menjumlahkan seluruh nilai data yang dilambangkan dengan \(x\) dan kemudian membaginya dengan banyak data di dalam dataset yang dilambangkan dengan \(n\). Nilai Mean untuk data sample dilambangkan dengan \(\bar{x}\), sedangkan untuk data populasi dilambangkan dengan \(\mu\).
$$\bar{x}=\frac{\left(x_1+x_2+x_3+\ldots+x_n\right)}{n}$$Median
Nilai Median membagi dataset menjadi dua bagian yang sama besar jumlahnya. Nilai ini diperoleh dengan mengurutkan data dari nilai yang terkecil hingga ke nilai yang terbesar. Kemudian mencari titik yang membagi data menjadi dua kelompok. Cara mencari nilai Median bergantung pada banyak data, apakah berjumlah ganjil atau genap.
Setiap nilai data diurutkan dari yang terkecil hingga terbesar. Apabila jumlah data bernilai ganjil, maka nilai median berada di urutan data diposisi tengah. Namun jika data berjumlah genap, jumlahkan kedua nilai data yang berada di posisi tengah serta bagi dengan angka dua.
Modus
Nilai Mode (Modus) adalah nilai data yang paling sering muncul di dalam dataset. Apabila setiap nilai di suatu dataset hanya muncul sekali, maka dikatakan dataset tersebut tidak memiliki nilai Modus.
Nilai Modus ditemukan dengan mencari mana nilai data yang memiliki frekuensi terbesar. Anda dapat menemukan nilai Modus menggunakan Microsoft Excel dengan formula MODE.
Central Tendency dalam Visualisasi Data
Apabila suatu dataset memiliki Mean, Median, dan Modus yang bernilai sama, maka kurva yang dibentuk akan menjadi simetris. Namun jika nilai Mean lebih besar dari Median, dan nilai Median lebih besar dari Modus, maka kurva akan berbentuk miring ke kanan. Sedangkan jika nilai Modus lebih besar dari Median, dan nilai Median lebih besar dari Mean, maka kurva akan berbentuk miring ke kiri.
Mean, Median, Modus: Mana yang Lebih Baik?
Setiap ukuran Central Tendency memiliki penggunaannya masing-masing berdasarkan tipe distribusi datanya. Pada distribusi normal, nilai Mean lebih cocok untuk digunakan. Sedangkan pada distribusi miring (skewed distribution), nilai Median lebih umum digunakan untuk mengukur Central Tendency. Apabila data bertipe ordinal, maka nilai Mode ataupun Median lebih sesuai.
Jika hanya mengukur nilai Mean, kesimpulan yang diambil berkemungkinan salah. Karena nilai Mean sangat dipengaruhi oleh validitas data. Nilai Mean dapat berubah jika ada Outlier pada data. Perhatikan tabel berikut ini.
Angka pendapatan perbulan setiap penduduk di kota Jakarta dan Bandung pada data sample tersebut bernilai sama. Seharusnya nilai Mean pada kedua data juga sama. Namun karena terdapat Outlier, yang ditunjukkan oleh highlight warna abu-abu, nilai Mean kedua data menjadi sangat berbeda.
Namun jika Anda juga menghitung nilai Median, nilai kedua dataset tidak jauh berbeda, walaupun terdapat Outlier. Nilai Median dapat membentu menjadi acuan lain untuk mengukur Central Tendency, dengan memperbandingkannya pada nilai Mean, Anda akan mengetahui apabila terdapat Outlier pada dataset yang Anda miliki.
Penulis
Rachmat Wahid Saleh Insani adalah seorang Dosen di Bidang Ilmu Komputer. Ia bergelar Master of Computer Science dari Universitas Gadjah Mada.
Anda mencari sesuatu? Cari disini!