UKURAN PEMUSATAN : mean, modus, median
Salah satu aspek yang
paling penting untuk menggambarkan distribusi data adalah nilai pusat data
pengamatan (Central Tendency). Setiap pengukuran aritmatika yang
ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai
sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran
pemusatan data (tendensi sentral). Terdapat tiga ukuran pemusatan
data yang sering digunakan, yaitu:
·
Mean (Rata-rata
hitung/rata-rata aritmetika)
·
Median
·
Mode
Pada artikel ini akan
di bahas mengenai pengertian beberapa ukuran pemusatan data yang
dilengkapi dengan contoh perhitungan, baik untuk data tunggal ataupun data yang
sudah dikelompokkan dalam tabel distribusi frekuensi. Selain ukuran statistik
di atas, akan dibahas juga mengenai beberapa ukuran statistik lainnya,
seperti Rata-rata Ukur (Geometric Mean),Rata-rata
Harmonik (H) serta beberapa karakteristik penting yang perlu dipahami
untuk ukuran tendensi sentral yang baik serta bagaimana memilih atau menggunakan
nilai tendensi sentral yang tepat.
(1) Mean (arithmetic
mean)
Rata-rata
hitung atau arithmetic
mean atau sering disebut dengan istilah mean saja
merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran
tendensi sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan
kemudian dibagi dengan banyaknya data. Definisi tersebut dapat di nyatakan
dengan persamaan berikut:
Sampel:
Populasi:
Keterangan:
∑
= lambang penjumlahan semua gugus data pengamatan n = banyaknya sampel data N =
banyaknya data populasi = nilai rata-rata
sampel μ = nilai rata-rata populasi Meandilambangkan dengan (dibaca
"x-bar") jika kumpulan data ini merupakan contoh (sampel)
dari populasi, sedangkan jika semua data berasal dari populasi,
mean dilambangkan dengan μ(huruf kecil Yunani mu).
Sampel statistik
biasanya dilambangkan dengan huruf Inggris, , sementara
parameter-parameter populasi biasanya dilambangkan dengan huruf Yunani,
misalnya μ
a. Rata-rata hitung (Mean) untuk data
tunggal
Contoh 1:
Hitunglah nilai
rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2; 4; 5; 6; 6;
7; 7; 7; 8; 9
Jawab:
Nilai rata-rata dari
data yang sudah dikelompokkan bisa dihitung dengan menggunakan formula berikut:
Keterangan: ∑ = lambang
penjumlahan semua gugus data pengamatan fi = frekuensi data
ke-i n = banyaknya sampel data = nilai rata-rata
sampel
Contoh 2:
Berapa rata-rata
hitung pada tabel frekuensi berikut:
|
xi
|
fi
|
|
70
|
5
|
|
69
|
6
|
|
45
|
3
|
|
80
|
1
|
|
56
|
1
|
Catatan: Tabel frekuensi pada
tabel di atas merupakan tabel frekuensi untuk data tunggal, bukan tabel
frekuensi dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu.
Jawab:
|
xi
|
fi
|
fixi
|
|
70
|
5
|
350
|
|
69
|
6
|
414
|
|
45
|
3
|
135
|
|
80
|
1
|
80
|
|
56
|
1
|
56
|
|
Jumlah
|
16
|
1035
|
b. Mean dari data
distribusi Frekuensi atau dari gabungan:
Distribusi Frekuensi: Rata-rata hitung
dari data yang sudah disusun dalam bentuk tabel distribusi frekuensi dapat
ditentukan dengan menggunakan formula yang sama dengan formula untuk menghitung
nilai rata-rata dari data yang sudah dikelompokkan, yaitu:
Keterangan:
∑ = lambang
penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i = nilai rata-rata
sampel
Contoh 3:
Tabel
berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam
tabel frekuensi. Berbeda dengan contoh 2, pada contoh ke-3 ini, tabel
distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan
selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).
|
Kelas ke-
|
Nilai Ujian
|
fi
|
|
1
|
31 - 40
|
2
|
|
2
|
41 - 50
|
3
|
|
3
|
51 - 60
|
5
|
|
4
|
61 - 70
|
13
|
|
5
|
71 - 80
|
24
|
|
6
|
81 - 90
|
21
|
|
7
|
91 - 100
|
12
|
|
Jumlah
|
80
|
Jawab:
Buat daftar tabel
berikut, tentukan nilai pewakilnya (xi) dan hitung fixi.
|
Kelas ke-
|
Nilai Ujian
|
fi
|
xi
|
fixi
|
|
1
|
31 - 40
|
2
|
35.5
|
71.0
|
|
2
|
41 - 50
|
3
|
45.5
|
136.5
|
|
3
|
51 - 60
|
5
|
55.5
|
277.5
|
|
4
|
61 - 70
|
13
|
65.5
|
851.5
|
|
5
|
71 - 80
|
24
|
75.5
|
1812.0
|
|
6
|
81 - 90
|
21
|
85.5
|
1795.5
|
|
7
|
91 - 100
|
12
|
95.5
|
1146.0
|
|
Jumlah
|
80
|
6090.0
|
Catatan: Pendekatan
perhitungan nilai rata-rata hitung dengan menggunakan distribusi frekuensi
kurang akurat dibandingkan dengan cara perhitungan rata-rata hitung dengan
menggunakan data aktualnya. Pendekatan ini seharusnya hanya digunakan apabila
tidak memungkinkan untuk menghitung nilai rata-rata hitung dari sumber data
aslinya.
Rata-rata gabungan
(disebut juga grand mean, pooled mean, atau rata-rata umum)
adalah cara yang tepat untuk menggabungkan rata-rata hitung dari beberapa
sampel.
Contoh 4:
Tiga sub sampel
masing-masing berukuran 10, 6, 8 dan rata-ratanya 145, 118, dan 162. Berapa
rata-ratanya?
Jawab:
(2) Median
Median
dari n pengukuran atau pengamatan x1, x2 ,...,
xn adalah nilai pengamatan yang terletak di tengah gugus data
setelah data tersebut diurutkan. Apabila banyaknya pengamatan (n)
ganjil, median terletak tepat ditengah gugus data, sedangkan bila n genap,
median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang
berada di tengah gugus data. Dengan demikian, median membagi himpunan
pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di
bawah median dan 50% lagi terletak di atas median. Median sering dilambangkan
dengan (dibaca
"x-tilde") apabila sumber datanya berasal dari sampel (dibaca
"μ-tilde") untuk median populasi. Median tidak dipengaruhi oleh
nilai-nilai aktual dari pengamatan melainkan pada posisi mereka. Prosedur untuk
menentukan nilai median, pertama urutkan data terlebih dahulu, kemudian ikuti
salah satu prosedur berikut ini:
·
Banyak data ganjil →
mediannya adalah nilai yang berada tepat di tengah gugus data
·
Banyak data genap →
mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data
a. Median data
tunggal:
Untuk menentukan
median dari data tunggal, terlebih dulu kita harus mengetahui letak/posisi
median tersebut. Posisi median dapat ditentukan dengan menggunakan formula
berikut:
dimana n = banyaknya
data pengamatan.
Median apabila n
ganjil:
Contoh 5:
Hitunglah median dari
nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9;
10
Jawab:
·
data: 8; 4; 5; 6; 7;
6; 7; 7; 2; 9; 10
·
setelah diurutkan: 2;
4; 5; 6; 6; 7; 7; 7; 8; 9; 10
·
banyaknya data (n) =
11
·
posisi Me = ½(11+1) =
6
·
jadi Median = 7 (data
yang terletak pada urutan ke-6)
|
Nilai Ujian
|
2
|
4
|
5
|
6
|
6
|
7
|
7
|
7
|
8
|
9
|
10
|
|
Urutan data ke-
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
|
↑
|
Median apabila n
genap:
Contoh 6:
Hitunglah median dari
nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
Jawab:
·
data: 8; 4; 5; 6; 7;
6; 7; 7; 2; 9
·
setelah diurutkan: 2;
4; 5; 6; 6; 7; 7; 7; 8; 9
·
banyaknya data (n) =
10
·
posisi Me = ½(10+1) =
5.5
·
Data tengahnya: 6 dan
7
·
jadi Median = ½ (6+7)
= 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6)
|
Nilai Ujian
|
2
|
4
|
5
|
6
|
6
|
7
|
7
|
7
|
8
|
9
|
||||||||
|
Urutan data ke-
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||||||||
|
↑
|
||||||||||||||||||
b. Median dalam
distribusi frekuensi:
Formula untuk
menentukan median dari tabel distribusi frekuensi adalah sebagai berikut:
b = batas bawah kelas
median dari kelas selang yang mengandung unsur atau memuat nilai median
p = panjang kelas
median
n = ukuran
sampel/banyak data
f = frekuensi kelas
median
F = Jumlah semua
frekuensi dengan tanda kelas lebih kecil dari kelas median (∑fi)
Contoh 7:
Tentukan nilai median
dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab:
|
Kelas ke-
|
Nilai Ujian
|
fi
|
fkum
|
|
|
1
|
31 - 40
|
2
|
2
|
|
|
2
|
41 - 50
|
3
|
5
|
|
|
3
|
51 - 60
|
5
|
10
|
|
|
4
|
61 - 70
|
13
|
23
|
|
|
5
|
71 - 80
|
24
|
47
|
←letak kelas median
|
|
6
|
81 - 90
|
21
|
68
|
|
|
7
|
91 - 100
|
12
|
80
|
|
|
8
|
Jumlah
|
80
|
·
Letak kelas median:
Setengah dari seluruh data = 40, terletak pada kelas ke-5 (nilai ujian 71-80)
·
b = 70.5, p = 10
·
n = 80, f = 24
·
f = 24 (frekuensi
kelas median)
·
F = 2 + 3 + 5 + 13 =
23
(3) Mode
Mode
adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama
susun data dalam urutan meningkat atau sebaliknya, kemudian hitung
frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah
modus. Modus digunakan baik untuk tipe data numerik atau pun data
kategoris. Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa
kemungkinan tentang modus suatu gugus data:
·
Apabila pada
sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal.
·
Apabila pada
sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut
dikatakan multimodal.
·
Apabila pada
sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus.
Meskipun suatu gugus
data mungkin saja tidak memiliki modus, namun pada suatu distribusi data
kontinyu, modus dapat ditentukan secara analitis.
·
Untuk gugus data yang
distribusinya simetris, nilai mean, median dan modus semuanya sama.
·
Untuk distribusi
miring ke kiri (negatively skewed): mean < median < modus
·
untuk distribusi
miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean
> median > modus.
Hubungan antara ketiga
ukuran tendensi sentral untuk data yang tidak berdistribusi normal, namun
hampir simetris dapat didekati dengan menggunakan rumus empiris berikut:
Mean - Mode = 3 (Mean - Median)
a. Modus Data Tunggal:
Contoh 8:
Berapa modus dari
nilai ujian matematika kelas 3 SMU berikut ini:
·
2, 4, 5, 6, 6, 7, 7,
7, 8, 9
·
2, 4, 6, 6, 6, 7, 7,
7, 8, 9
·
2, 4, 6, 6, 6, 7, 8,
8, 8, 9
·
2, 4, 5, 5, 6, 7, 7,
8, 8, 9
·
1, 2, 3, 4, 5, 6, 7,
8, 9, 10
Jawab:
·
2, 4, 5, 6, 6, 7, 7, 7, 8, 9→ Nilai yang
sering muncul adalah angka 7 (frekuensi terbanyak = 3), sehingga Modus (M) = 7
·
2,
4, 6, 6, 6, 7, 7, 7, 8, 9 → Nilai yang
sering muncul adalah angka 6 dan 7 (masing-masing muncul 3 kali), sehingga
Modusnya ada dua, yaitu 6 dan 7. Gugus data tersebut dikatakan bimodal karena
mempunyai dua modus. Karena ke-2 mode tersebut nilainya berurutan, mode sering
dihitung dengan menghitung nilai rata-rata keduanya, ½ (6+7) = 6.5.
·
2,
4, 6, 6, 6, 7, 8, 8, 8, 9 → Nilai yang
sering muncul adalah angka 6 dan 8 (masing-masing muncul 3 kali), sehingga
Modusnya ada dua, yaitu 6 dan 8. Gugus data tersebut dikatakan bimodal karena
mempunyai dua modus. Nilai mode tunggal tidak dapat dihitung karena ke-2 mode
tersebut tidak berurutan.
·
2, 4, 5, 5, 6, 7, 7, 8, 8, 9 → Nilai yang
sering muncul adalah angka 5, 6 dan 7 (masing-masing muncul 2 kali), sehingga
Modusnya ada tiga, yaitu 5, 6 dan 7. Gugus data tersebut dikatakan multimodal
karena modusnya lebih dari dua.
·
1, 2,
3, 4, 5, 6, 7, 8, 9, 10 → Pada gugus data tersebut, semua frekuensi data sama,
masing-masing muncul satu kali, sehingga gugus data tersebut dikatakan tidak
mempunyai modusnya
b. Mode dalam
Distribusi Frekuensi:
dimana:
Mo = modal = kelas
yang memuat modus
b = batas bawah kelas
modal
p = panjang kelas
modal
bmo =
frekuensi dari kelas yang memuat modus (yang nilainya tertinggi)
b1= bmo – bmo-1 =
frekuensi kelas modal – frekuensi kelas sebelumnya
b2 = bmo – bmo+1 =
frekuensi kelas modal – frekuensi kelas sesudahnya
Contoh 9:
Tentukan nilai median
dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab:
|
Kelas ke-
|
Nilai Ujian
|
fi
|
|
|
1
|
31 - 40
|
2
|
|
|
2
|
41 - 50
|
3
|
|
|
3
|
51 - 60
|
5
|
|
|
4
|
61 - 70
|
13
|
|
|
→ b1 = (24 – 13) = 11
|
|||
|
5
|
71 - 80
|
24
|
← kelas modal (frekuensinya paling
besar)
|
|
→ b2 =(24 – 21) =3
|
|||
|
6
|
81 - 90
|
21
|
|
|
7
|
91 - 100
|
12
|
|
|
8
|
Jumlah
|
80
|
·
Kelas modul =kelas
ke-5
·
b = 71-0.5 = 70.5
·
b1 = 24 -13 = 11
·
b2 = 24 – 21 = 3
·
p = 10
Selain tiga ukuran
tendensi sentral di atas (mean, median, dan mode), terdapat ukuran tendensi
sentral lainnya, yaitu rata-rata ukur (Geometric
Mean) dan rata-rata harmonis (Harmonic
Mean)
(4) Rata-rata Ukur
(Geometric Mean)
Untuk gugus data
positif x1,
x2, …, xn, rata-rata geometrik adalah akar ke-n dari
hasil perkalian unsur-unsur datanya. Secara matematis dapat dinyatakan dengan
formula berikut:
Dimana:
U = rata-rata ukur (rata-rata geometrik) n = banyaknya sampel Π = Huruf kapital
π (pi) yang menyatakan jumlah dari hasil kali unsur-unsur data. Rata-rata
geometrik sering digunakan dalam bisnis dan ekonomi untuk menghitung rata-rata
tingkat perubahan, rata-rata tingkat pertumbuhan, atau rasio rata-rata untuk
data berurutan tetap atau hampir tetap atau untuk rata-rata kenaikan dalam
bentuk persentase.
a. Rata-rata ukur
untuk data tunggal
Contoh 10:
Berapakah rata-rata
ukur dari data 2, 4, 8?
Jawab:
atau:
b. Distribusi
Frekuensi:
xi = tanda kelas
(nilai tengah)
fi = frekuensi yang
sesuai dengan xi
Contoh 11:
Tentukan rata-rata
ukur dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab
|
Kelas ke-
|
Nilai Ujian
|
fi
|
xi
|
log xi
|
fi.log xi
|
|
1
|
31 - 40
|
2
|
35.5
|
1.5502
|
3.1005
|
|
2
|
41 - 50
|
3
|
45.5
|
1.6580
|
4.9740
|
|
3
|
51 - 60
|
5
|
55.5
|
1.7443
|
8.7215
|
|
4
|
61 - 70
|
13
|
65.5
|
1.8162
|
23.6111
|
|
5
|
71 - 80
|
24
|
75.5
|
1.8779
|
45.0707
|
|
6
|
81 - 90
|
21
|
85.5
|
1.9320
|
40.5713
|
|
7
|
91 - 100
|
12
|
95.5
|
1.9800
|
23.7600
|
|
8
|
Jumlah
|
80
|
149.8091
|
(5) Rata-rata Harmonik
(H)
Rata-rata harmonik
dari suatu kumpulan data x1, x2, …, xn adalah kebalikan dari
nilai rata-rata hitung (aritmetik mean). Secara matematis dapat dinyatakan
dengan formula berikut:
Secara
umum, rata-rata harmonic jarang digunakan. Rata-rata ini hanya digunakan untuk
data yang bersifat khusus. Misalnya,rata-rata harmonik sering digunakan sebagai
ukuran tendensi sentral untuk kumpulan data yang menunjukkan adanya laju
perubahan, seperti kecepatan.
a. Rata-rata harmonic
untuk data tunggal
Contoh 12:
Si A bepergian pulang
pergi. Waktu pergi ia mengendarai kendaraan dengan kecepatan 10 km/jam,
sedangkan waktu kembalinya 20 km/jam. Berapakah rata-rata kecepatan pulang
pergi?
Jawab:
Apabila kita menghitungnya dengan menggunakan rumus jarak dan
kecepatan, tentu hasilnya 13.5 km/jam! Apabila kita gunakan perhitungan
rata-rata hitung, hasilnya tidak tepat!
Pada kasus ini, lebih
tepat menggunakan rata-rata harmonik:
b. Rata-rata Harmonik
untuk Distribusi Frekuensi:
Contoh 13:
Berapa rata-rata
Harmonik dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab:
|
Kelas ke-
|
Nilai Ujian
|
fi
|
xi
|
fi/xi
|
|
1
|
31 - 40
|
2
|
35.5
|
0.0563
|
|
2
|
41 - 50
|
3
|
45.5
|
0.0659
|
|
3
|
51 - 60
|
5
|
55.5
|
0.0901
|
|
4
|
61 - 70
|
13
|
65.5
|
0.1985
|
|
5
|
71 - 80
|
24
|
75.5
|
0.3179
|
|
6
|
81 - 90
|
21
|
85.5
|
0.2456
|
|
7
|
91 - 100
|
12
|
95.5
|
0.1257
|
|
8
|
Jumlah
|
80
|
1.1000
|
Perbandingan Ketiga
Rata-rata (Mean):
Karakteristik penting
untuk ukuran tendensi sentral yang baik
Ukuran nilai
pusat/tendensi sentral (average) merupakan nilai pewakil dari suatu distribusi data,
sehingga harus memiliki sifat-sifat berikut:
·
Harus mempertimbangkan
semua gugus data
·
Tidak boleh
terpengaruh oleh nilai-nilai ekstrim.
·
Harus stabil dari
sampel ke sampel.
·
Harus mampu digunakan
untuk analisis statistik lebih lanjut.
Dari
beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan tersebut,
kecuali syarat pada point kedua, rata-rata dipengaruhi oleh nilai ekstrem.
Sebagai contoh, jika item adalah 2; 4; 5; 6; 6; 6; 7; 7; 8; 9 maka mean, median
dan modus semua bernilai sama, yaitu 6. Jika nilai terakhir adalah 90 bukan 9,
rata-rata akan menjadi 14.10, sedangkan median dan modus tidak berubah.
Meskipun dalam hal ini median dan modus lebih baik, namun tidak memenuhi
persyaratan lainnya. Oleh karena itu Mean merupakan ukuran nilai pusat yang
terbaik dan sering digunakan dalam analisis statistik.
Kapan kita menggunakan
nilai tendensi sentral yang berbeda?
Nilai
ukuran pusat yang tepat untuk digunakan tergantung pada sifat data, sifat
distribusi frekuensi dan tujuan. Jika data bersifat kualitatif, hanya modus
yang dapat digunakan. Sebagai contoh, apabila kita tertarik untuk mengetahui
jenis tanah yang khas di suatu lokasi, atau pola tanam di suatu daerah, kita
hanya dapat menggunakan modus. Di sisi lain, jika data bersifat kuantitatif,
kita dapat menggunakan salah satu dari ukuran nilai pusat tersebut, mean atau
median atau modus. Meskipun pada jenis data kuantitatif kita dapat menggunakan
ketiga ukuran tendensi sentral, namun kita harus mempertimbangkan sifat
distribusi frekuensi dari gugus data tersebut.
·
Bila distribusi
frekuensi data tidak normal (tidak simetris), median atau modusmerupakan
ukuran pusat yang tepat.
·
Apabila terdapat nilai-nilai ekstrim,
baik kecil atau besar, lebih tepat menggunakan median atau modus.
·
Apabila distribusi data normal (simetris),
semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan.
Namun, mean lebih sering digunakandibanding yang lainnya
karena lebih memenuhi persyaratan untuk ukuran pusat yang
baik.
·
Ketika kita berhadapan
dengan laju, kecepatan dan harga lebih tepat menggunakan rata-rata harmonik.
·
Jika kita tertarik
pada perubahan relatif, seperti dalam kasus pertumbuhan bakteri, pembelahan sel dan
sebagainya, rata-rata geometrik adalah rata-rata yang paling
tepat.
Referensi:
·
Mario Triola. 2004.
Elementary Statistics. 9th Edition. Pearson Education.
·
Stephen Bernstein and
Ruth Bernstein. 1999. Elements of Statistics I: Descriptive Statistics and
Probability. The McGraw-Hill Companies, Inc
Tidak ada komentar:
Posting Komentar