BAB 5 ANALISIS DESKRIPTIF

Rabu, 16 November 2011
BAB 5
ANALISIS DESKRIPTIF
Statistika deskriptif merupakan bagian dari statitika yang mempelajari alat, teknik, atau prosedur yang digunakan untuk menggambarkan atau mendeskripsikan kumpulan data atau hasil pengamatan. Data yang dikumpulkan tersebut perlu disajikan supaya mudah dimengerti, menarik, komunikatif, dan informatif bagi pihak lain. Beberapa teknik yang akan dibahas disini meliputi ukuran gejala pusat, ukuran keragaman, penyajian dalam bentuk tabel dan grafik. Bentuk-bentuk penyajian data tersebut secara umum dibagi dalam dua aspek, yaitu (1) penyiapan data yang mencakup proses editing, pengkodean, dan pemasukkan data, serta (2) analisis pendahuluan meliputi pemilahan, pemeriksaan, dan penyusunan data sehingga diperoleh gambaran, pola, dan hubungan yang lebih bermakna.
5.1. FORMAT PEMASUKKAN DATA
Pemasukkan data merupakan tahap awal yang harus dilakukan sebelum proses analisis data. Perkembangan teknologi komputer mempunyai peranan besar dalam mempermudah proses pemasukkan data. Beberapa metode pemasukkan data mulai dari sistem manual sampai ke penggunaan teknologi yang lebih maju, dapat dilihat pada Gambar berikut.
Handsort Instruments Editing Coding Cards Sorting
tabulation
Calculator
statistical
analysis
Keypunch Instruments Editing Coding Keypunch Card
reader
Computer
statistical
analysis
Keyboard
entry Instruments Editing Coding Keyboard
entry
Computer
statistical
analysis
Keyboard entry
with precoded
instrument
Precoded Keyboard
Instrument Entry
Editing if Editing if
necessary necessary
Computer
statistical
analysis
Optical scan;
Real time keyboard
entry;
uploads fromPC;
telephone keypad;
bar code; voice
recognition
Precoded Data
Instrument Entry
Editing if
necessary
Computer
statistical
analysis
Metode PI Ekonomi: Analisis Deskriptif
50
Metode pamasukkan data yang akan digunakan dalam menganalisis data disini adalah
metode ke 3 dan ke 4, yaitu melalui papan ketik (keyboard) dengan menggunakan perangkat
lunak SPSS.
SPSS
Data Editor
Pemasukkan data pada SPSS dilakukan melalui Data Editor dengan tata letak sebagai
berikut:
Kasus (cases) Nama Variabel
VAR VAR VAR VAR
1
2
3
4
5
Sel (cell)
Pendefinisian Variabel (data)
Menu : DATA DEFINE VARIABLE
Manu ini digunakan untuk mendefinisikan varibel yang meliputi nama atau atribut-atribut
variabel yang akan diproses. Menu Define Variable ini tersedia jika Data editor sedang
aktif. Beberapa Atribut-atribut variabel yang bisa didefinisikan meliputi:
Variable name Mengisi atau merubah nama variabel sepanjang 8 karakter
Type Tpe variabel meliputi Numeric, Comma, Dot, Scientific notation,
Date, Dollar, Custom currency, dan String
Width Lebar digit atau karakater data
Decimal places Jumlah angka desimal
Variable label Label variabel, biasanya konsep atau definisi lengkap dari variabel
Value, Value label Keterangan atau konversi nilai sel yang sering digunakan untuk skala
pengukuran nominal dan ordinal
Data editor SPSS ini relatif sama dengan data editor perangkat lunak statistik lainnya
atau seperti bentuk spreadsheet, misal Lotus, Microsoft Excel, atau Quatro. Contoh isi
data editor untuk 3 buah variabel dan 10 kasus (kasus ini identik dengan obyek yang diukur
atau satuan pangamatan) adalah sebagai berikut:
SPSS
Masukkan data skala usaha, nilai penjualan dan keuntungan yang diperoleh 9 perusahaan
sehingga diperoleh format pada data editor SPSS sebagai berikut:
Metode PI Ekonomi: Analisis Deskriptif
51
Usaha Scales Sales Profit
Sigma Besar 1200 100
Alfa Kecil 500 50
Delta Besar 1500 200
Phi Menengah 750 100
Omega Menengah 800 50
Phi Kecil 400 150
Beta Besar 2000 200
Gamma Kecil 300 50
Kappa Kecil 350 75
Pemasukkan data-data yang ada pada Tabel di atas juga termasuk pendefinisian variabel
yang lengkap meliputi atribut nama, panjang karakter atau desimal, tipe, label, value, dan
value labelnya.
5.2. UKURAN GEJALA PEMUSATAN
1. Modus (Mode)
Modus adalah data yang paling sering muncul. Statistik ini bisa digunakan untuk semua
taraf pengukuran, baik nominal, ordinal, interval, dan ratio. Untuk skala nominal, modus
adalah ukuran pemusatan satu-satunya.
2. Median
Median adalah data yang terletak ditengah setelah data diurutkan. Bila terdapat n data maka
median terletak pada data ke (n+1)/n. Median ini bisa digunakan minimal untuk skala
ordinal dan tidak sensitif terhadap adanya data ekstrim. Misal, sederet data terurut 2, 5, 7, 8,
10 mempunyai median 7. Jika angka 10 diganti dengan 100 maka mediannya tetap 7.
3. Rata-Rata Hitung
Rata-rata ini hanya bisa dihitung untuk data dengan skala pengukuran paling sedikit
interval. Jika ada n data maka rata-rata hitung didefinisikan sebagai berikut:
μ = =

x =
x
n
i
n
i Σ
1
4. Rata-Rata Dibobot
Rata-rata dibobot digunakan bila data mempunyai bobot yang berlainan. Rumus
yang digunakan adalah:
Metode PI Ekonomi: Analisis Deskriptif
52
μ = =

x =
x b
b
i
n
i i
i
Σ
Σ
1
Soal 4.1
Diketahui 3 kelompok data sebagai berikut:
1. Harga minyak goreng eceran di 11 buah pasar:
3500 3600 4200 4750 5000 3600 3400 5500 5100 4200 4200
2. Tingkat pendidikan 11 orang yang menjadi satuan pengamatan:
SD SMP SMP S1 SMU SMP SMU S1 SMU SMP SD
3. Diketahui sikap 11 profesional muda terhadap investor asing yang dinyatakan dengan
Setuju (Y) atau Tidak setuju (T):
Y T T T Y Y T Y T Y Y
Carilah ukuran pemusatan untuk ketiga kelompok data tersebut ?
SPSS
Data : Soal 4.1
Urutan MENU yang dipilih : Statistics Summarize Frequency
Statistic yang diisi : Central Tendency: Mean, Median, Mode
Output untuk variabel HARGA :
HARGA
Mean 4277,273 Median 4200,000 Mode 4200,000
Valid cases 11 Missing cases 0
Keterangan:
Statistika deskriptif yang lengkap bisa menggunakan menu Statistics Summarize
Descriptive tetapi menu tersebut hanya bisa digunakan untuk variabel dengan skala paling
rendah interval
5.3. UKURAN KERAGAMAN
1. Rentang (range)
Rentang merupakan salah satu ukuran variasi yang paling sederhana yaitu hanya
berdasarkan data terbesar dan data terkecil, dengan rumus perhitungan:
Metode PI Ekonomi: Analisis Deskriptif
53
Rentang = Data terbesar - Data terkecil
Semakin kecil rentang maka data semakin homogen. Sebaliknya, makin besar rentang maka
datanya semakin heterogen. Ukuran ini sangat sensitif terhadap angka ekstrem, misalnya
deretan angka 2, 3, 4, 5, dan 8 mempunyai rentang 6, tetapi jika angka 8 diganti dengan 50
maka rentangnya berubah drastis menjadi 48.
2. Interquartile Range (IQR)
Kuartil adalah nilai-nilai yang membagi segugus data pengamatan menjadi 4 bagian
sama besar. Nilai-nilai itu, yang dilambangkan dengan Q1, Q2, dan Q3, mempunyai sifat
bahwa 25% data jatuh dibawah Q1, 50% dibawah Q2, dan 75% dibawah Q3. IQR
didefinisikan sebagai rentang (interval) yang didalamnya tercakup 50 persen data yang
berada di tengah-tengah distribusinya, atau :
IQR = Q3 - Q1
IQR ini relatif tidak sensitif terhadap angka ekstrem dibandingkan rentang (range) dan
digunakan pada penyajian grafik box and whisker (boxplot) yang akan dijelaskan pada
bagian berikutnya.
3. Ragam (variance) dan Simpangan Baku (standard deviation)
Ragam dan simpangan baku digunakan untuk mengukur bervariasinya data di sekitar
rata-rata. Keduanya hanya digunakan untuk skala pengukuran interval dan ratio. Rumus
yang digunakan untuk mengitung kedua ukuran keragaman tersebut adalah:
Σ(Xi - X)2
s2 = (ragam)
N
s = √ s2 (standar deviasi)
SPSS
Open Data : Bab4a_1.sav
Menu : Statistics Summarize Descriptive
Option : pilih Gaji untuk variable
Klik Options dan pilihlah ukuran-ukuran pada Dispersion
Output :
Number of valid observations (listwise) = 11,00
Valid
Variable Mean Std Dev Variance Range Minimum Maximum N
Metode PI Ekonomi: Analisis Deskriptif
54
GAJI 4277,27 722,97 522681,82 2100,00 3400 5500 11
5.4. UKURAN BENTUK DISTRIBUSI
Bentuk distribusi data diukur dengan skewness dan kurtosis, yang menggambarkan
apakah bentuknya simetris atau tidak, serta apakah distribusi tersebut cenderung datar atau
menggunung. Biasanya bentuk distribusi tersebutakan lebih jelas jika disajikan secara
visual, seperti terlihat pada Gambar berikut.
Bentuk:
Skewness Simetris Normal
Menjulur kanan
atau positif
Menjulur kiri
atau negatif
95%
68%
Spread -2σ -1σ μ +1σ +2σ
Lokasi
Rata-rata, Median
Modus
Modus Rata-rata
Median
Rata-rata Modus
Median
Bentuk:
Kurtosis
Mesocurtic Leptocurtic Platycurtic
A B C
D E F
1. Skewness
Skewness adalah ukuran penyimpangan suatu distribusi dari distribusi simeteris.
Distribusi simetris mempunyai rata-rata, median, dan modus berada pada lokasi yang sama
(Kurva A). Suatu distribusi yang bentuknya lebih menjulur ke arah kanan disebut menjulur
kanan atau menjulur positif (Kurva B). Sedangkan jika menjulur ke arah kiri disebut
Metode PI Ekonomi: Analisis Deskriptif
55
menjulur kiri atau negatif (kurva C). Statistik yang digunakan untuk mengukur bentuk
distribusi ini adalah :
sk
x N
x N
=
Σ
Σ
3
2 3
/
( / )
Jika distribusinya simetris maka nilai sk adalah 0, jika distribusinya menjulur kekanan maka
sk bernilai positif, dan jika distribusinya menjulur kekiri maka sk bernilai negatif
2. Kurtosis
Kurtosis mengukur apakah suatu distribusi berbentuk cenderung normal (kurva D),
menjulang (kurva E), atau mendatar (Kurva F). Statistik yang digunakan untuk mengukur
kurtosis ini adalah:
ku
x N
x N
= −
Σ
Σ
4
2 2 3
/
( / )
Nilai ku untuk kurva normal (mesokurtic) adalah 0, kurva menjulang adalah positif, dan
kurva mendatar adalah negatif.
Soal -Soal Latihan
Lakukan analisis deskriptif secara lengkap, yang mencakup ukuran gejala pusat,
penyebaran, bentuk distribusi, mengenai data-data penelitian berikut ini:
1. Seorang mahasiswa tertarik untuk melakukan penelitian deskriptif mengenai penghasilan
para supir angkot di wilayah Jabotabek. Salah satu variabel yang diamati adalah
penghasilan bersih yang didapatkan setiap hari oleh para sopir tersebut. Ukuran sampel
yang diambil adalah sebanyak 30 sopir dengan data penghasilan bersih (dalam ribuan)
sebagai berikut:
5 10 20 30 40 50 5 10 20 30
40 50 5 10 20 30 40 5 15 25
35 5 15 25 30 5 15 25 15 15
2. Penelitian mengenai gaji pokok pertama yang diterima karyawan dengan tingkat
pendidikan sarjana di BUMN. Data selengkapnya adalah sebagai berikut:
150 350 250 250 150 350 250 250 250 300
250 250 300 250 250 300 250 250 300 250
200 300 200 300 250
3. Penelitian yang sama dengan nomor 3 tetapi untuk perusahaan swasta, dengan data
sebagai berikut:
Metode PI Ekonomi: Analisis Deskriptif
56
300 450 600 350 500 650 500 450 500 550
350 500 650 400 550 400 550 500 450 600
400 550 700 450 600
SPSS
Data (Open) : Gaji.sav
Menu : Statistics Summarize Descriptives
Klik options untuk memunculkan kotak dialog yang menunjukkan berbagai
ukuran statistik. Pilihlah beberepa diantaranya, termasuk skewness dan
kurtosis yang menjadi pembahasan saat ini
Output :
Variable G_SUPIR
Mean 21,500 S.E. Mean 2,493
Std Dev 13,655 Variance 186,466
Kurtosis -,615 S.E. Kurt ,833
Skewness ,543 S.E. Skew ,427
Range 45,000 Minimum 5
Maximum 50
Variable G_BUMN
Mean 250,000 S.E. Mean 8,660
Std Dev 43,301 Variance 1875,000
Kurtosis ,581 S.E. Kurt ,902
Skewness ,000 S.E. Skew ,464
Range 200,000 Minimum 150
Maximum 350
Variable G_SWASTA
Mean 500,000 S.E. Mean 20,412
Std Dev 102,062 Variance 10416,667
Kurtosis -,517 S.E. Kurt ,902
Skewness ,000 S.E. Skew ,464
Range 400,000 Minimum 300
Maximum 700
Berdasarkan hasil analsisi tersebut, terlihat bahwa bentuk distribusi G_SUPIR adalah
menjukur kekanan (skewness positif), sedangkan G_BUMN dan G_SWASTA adalah
simetri yaitu skewness-nya 0. Berdasarkan ukuran kurtosis, bentuk distribusi G_BUMN
adalah menjulang (kurtosis positif) sedangkan G_SUPIR dan G_SWASTA adalah relatif
mendatar dengan nilai kurtosisnya negatif. Interpretasinya adalah sebagai berikut:
Metode PI Ekonomi: Analisis Deskriptif
57
1. Penghasilan supir lebih terkonsentrasi pada penghasilan yang rendah atau sebagaina
besar gajia sopir adalah rendah
2. Gaji pegawai BUMN relatif homogen atau tidak terlalu jauh berbeda dengan jumlah
terbesar terletak pada nilai rata-rata yang terletak di tengah-tengah kurva distribusinya
3. Gaji pegawai swasta relatif heterogen atau mempunyai jarak yang relatif lebih besar
antara gaji terendah dengan gaji tertinggi dibandingkan gaji pegawai BUMN.
5.5. TABEL
1. Tabel Frekuensi
Tabel frekuensi merupakan teknik sederhana untuk menyajikan data dalam bentuk
pengurutan, frekuensi atau persentase relatif, frekuensi atau persentase kumulatif. Tabel
frekuensi ini terutama digunakan untuk variabel yang bersifat kategorikal atau untuk skala
pengukuran nominal dan ordinal. Penggunaan tabel frekuensi untuk skala pengukuran
interval dan ratio relatif kurang informatif.
SPSS
Data (Ordinal) : SD SMP SMP S1 SMU SMP SMU S1 SMU SMP SD
Input Data :
MENU : Define Variable
Nama Variabel : TINGKAT
Label Variabel : Tingkat Pendidikan
Value Label : 1 = ‘SD’
2 = ‘SMP’
3 = ‘SMU’
4 = ‘S1’
Proses/Menu :
Statistics Summarize Frequencies
Menu ini digunakan untuk membuat tabel atau tampilan yang menunjukkan seberapa jauh perbedaan nilai-nilai variabel dalam sekumpulan data. Kita bisa juga menggunakan menu ini untuk memperoleh statistik yang mengambarkan nilai tertentu dan sebaran observasinya. Misalnya dalam survey pasar, kita bisa membuat tabel yang menunjukkan seberapa banyak konsumen yang puas dengan pelayanan perusahaan. Tabel tersebut juga bisa disajikan dalam diagram balok dan histogram.
Output :
TINGKAT tingkat pendidikan
Valid Cum
Value Label Value Frequency Percent Percent Percent
Metode PI Ekonomi: Analisis Deskriptif
58
SD 1 2 18,2 18,2 18,2
SMP 2 4 36,4 36,4 54,5
SMU 3 3 27,3 27,3 81,8
S1 4 2 18,2 18,2 100,0
------- ------- -------
Total 11 100,0 100,0
2. Tabel Silang
Tabel silang atau klasifikasi silang digunakan untuk menyajikan data yang terdiri
dari 2 variabel atau lebih. Klasifikasi silang dari dua variabel memerlukan tabel dengan
baris-baris dan kolom-kolom. Kategori-kategori dalam suatu variabel diletakkan pada baris
sedangkan kategori-kategori dalam variabel lain diletakkan pada kolom. Biasanya variabel
tak bebas diletakkan dalam baris sedangkan variabel bebas dalam kolom. Data dalam
klasifikasi silang ini sangat penting dalam pengukuran hubungan antara kedua variabel
tersebut, yang akan dijelaskan dalam bab berikutnya. Sedangkan cara membuat tabel
klasifikasi silang dan penggunaan perangkat lunak SPSS-nya menggunakan contoh kasus
berikut:
Soal 4.3
Misal diketahui data 2 variabel yaitu tingkat preferensi terhadap barang dan jenis kelamin
dari 10 orang konsumen yang menjadi satuan pengamatan:
Responden Preferensi Jenis Kelamin
A Rendah L
B Rendah L
C Tinggi L
D Tinggi L
E Tinggi P
F Rendah P
G Tinggi P
H Tinggi L
I Rendah P
J Rendah L
K Tinggi P
L Tinggi P
M Tinggi P
Buatlah klasifikasi silangnya?
SPSSS
Data : Soal 4.3
Input Data :
Metode PI Ekonomi: Analisis Deskriptif
59
Menu Define Variable
Nama Variabel Prefer dan Jenis_K
Label Variabel Tingkat perefrensi Jenis Kelamin
Label value 0= rendah 0 = perempuan
1= tinggi 1 = laki-laki
Proses/Menu :
Statistics Summarize Crosstabs
Crosstabs digunakan untuk menghitung jumlah kasus yang memiliki kombinasi yang
berbeda dari 2 atau lebih variabel, serta untuk menghitung berbagai statistic dan pengujian.
Klasifikasi silang ini sangat efektif untuk skala pengukuran nominal dan ordinal. Untuk
skala interval atau rasio harus dibuat kategori-kategori terlebih dahulu, contoh untuk gaji
harus dibuat kategori dalam bentuk interval, seperti dibawah 200 ribu, antara 200 ribu
sampai 500 ribu, dan seterusnya.
Output :
PREFER by JENIS_K Jenis Kelamin
JENIS_K
Count
Row Pct Perempuan laki-laki
Col Pct Row
Tot Pct 0 1 Total
PREFER
0 2 3 5
rendah 40,0 60,0 38,5
28,6 50,0
15,4 23,1
1 5 3 8
tinggi 62,5 37,5 61,5
71,4 50,0
38,5 23,1
Column 7 6 13
Total 53,8 46,2 100,0
Format tabel silang yang dihasilkan perangkat lunak SPSS diatas dapat dijelaskan
dengan gambar berikut.
Metode PI Ekonomi: Analisis Deskriptif
60
JENIS_K
Count
Row Pct Perempuan laki-laki
Col Pct Row
Tot Pct 0 1 Total
PREFER
0 2 3 5
rendah 40,0 60,0 38,5
28,6 50,0
15,4 23,1
1 5 3 8
tinggi 62,5 37,5 61,5
71,4 50,0
38,5 23,1
Column 7 6 13
Total 53,8 46,2 100,0
Kandungan sel Variabel 1
Variabel 2
Kategori pada
variabel 1
Kategori
pada variabel 2
Marginal kolom
mj
Marginal baris
mi
sel 2,1 (baris 2 kolom 1)
5
62,5
71,4
38,5
frekuensi
persen terhadap total baris
persen terhadap total kolom
persen terhadap total
5.6. GRAFIK
1. Diagram Batang
Diagram batang merupakan penyajian data secara visual yang terdiri dari dua buah
sumbu yaitu ordinat dan axis. Jumlah variabel yang bisa disajikan adalah satu atau dua
varibel. Jika hanya satu variabel, maka aksisnya adalah variabel yang biasanya berskala
kategorikal (nominal atau ordinal) dan ordinatnya adalah frekuensi kasus untuk setiap
Metode PI Ekonomi: Analisis Deskriptif
61
kategori tersebut. Sedangkan jika diagram menyajikan dua variabel, maka aksisnya adalah
variabel kategorikal dan ordinatnya variabel interval atau ratio.
SPSS
Data : Tabel 4.1
Variabel : Scales (axis) dan frekuensinya (ordinat)
Menu : Graphs Bar
Option : Pilih simple
Klik Define dan pilih N of cases untuk Bars represent
Output :
Skala usaha
Besar Kecil Menengah
Count
4,5
4,0
3,5
3,0
2,5
2,0
1,5
Data : Tabel 4.1
Variabel : Sales (ordinat) dan scales (axis)
Menu : Graphs Bar
Options : Pilih Simple
Klik Define dan pilih other summary function untuk bars represent
Mean(sales) untuk variable dan scales untuk category axis
Output :
Metode PI Ekonomi: Analisis Deskriptif
62
Skala usaha
Besar Kecil Menengah
Mean SALES
1800
1600
1400
1200
1000
800
600
400
200
2. Diagram Lingkaran
Diagram lingkaran digunakan untuk menyajikan komposisi jumlah atau frekuensi
untuk variabel kategorikal atau variabel dengan skala pengukuran nominal atau ordinal.
Jadi diagram ini biasanya merupakan penyajian grafis dari tabel frekuensi karena lingkaran
tersebut menunjukkan persentase jumlah kasus untuk setiap kategori. Contoh berikut adalah
komposisi jumlah perusahaan untuk masing-masing skala kecil, menengah, dan besar yang
disajikan dalam bentuk diagram lingkaran.
SPSS
Data : Tabel 4.1
Variabel : Scales
Menu : Graphs Pie
Options : Pilih simple
Klik Define dan pilih N of cases untuk Bars represent
Scales untuk category axis
Output :
Metode PI Ekonomi: Analisis Deskriptif
63
Menengah
Kecil
Besar
3. Histogram
Histogram merupakan teknik konvensional untuk menyajikan data rasio interval,
yang digunakan jika memungkinkan sekumpulan nilai-nilai variabel dibuat dalam bentuk
selang atau interval. Histogram, yang dibentuk dengan batang-batang (bars) dimana setiap
nilai yang menempatinya sama dengan luas batang tersebut, sangat bermanfaat untuk (a)
menyajikan semua interval data pada distribusinya, dan (b) memeriksa secara visual bentuk
distribusi data, apakah simteris, menjulur, menjulang, atau mendatar.
Soal
Seorang mahasiswa jurusan akuntansi Universitas Gunadarma sedang melakukan penelitian
untuk mengetahui profitabilitas perusahaan-perusahaan manufaktur. Ukuran yang dipakai
salah satunya adalah current ratio (dalam persen). Ukuran sampel yang diambil adalah 40
perusahaan dengan data selengkapnya sebagai berikut:
138 164 150 132 144 125 149 157
146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128
Buatlah analisis statitika deskriptif yang lengkap mengenai data current ratio tersebut,
termasuk histogramnya?
Metode PI Ekonomi: Analisis Deskriptif
64
SPSS
Open Data : Histo.sav
Menu : Graphs Histogram atau Statistics Summarize Explore Plots
Sub sub menu EXPLORE digunakan untuk analisis deskriptif relatif
lengkap yang meliputi berbagai statistik dan tampilan grafiknya. Kita bisa
mengetahui statistik nilai terkecil, terbesar, rata-rata, ragam, standar
deviasi, bentuk distribusi, uji kenormalan data, dan berbagai ukuran
lainnya, serta membuat grafik boxplot, stem and leaf, atau histogram.
Menu ini sangat efektif digunakan untuk data dengan skala pengukuran
minimal interval.
Option : Pilih display normal curve
Output :
DATA
175,0
170,0
165,0
160,0
155,0
150,0
145,0
140,0
135,0
130,0
125,0
120,0
10
8
6
4
2
0
Std. Dev = 13,05
Mean = 146,8
N = 40,00
4. Steam and Leaf
Stem and leaf relatif lebih efisien dibandingkan histogram karena pada bentuk grafik
ini data asalnya masih bisa diketahui sedangkan pada histogram tidak bisa karena
dimasukkan dalam bentuk kisaran (interval). Akibat pengelompokan data dalam bentuk
interval pada histogram, kita tidak bisa secara pasti menentukan statistik-statistik yang
meliputi median atau kuartil. Informasi yang hilang tersebut tidak akan terjadi jika kita
menggunakan stem and leaf. Selain itu, visualisasi dari stem and leaf ini juga bisa
menggambarkan bentuk distribusi data secara cepat dan jelas. Untuk ukuran data yang
relatif kecil, grafik ini bisa dibuat secara manual dengan mudah, yaitu dengan langkahlangkah:
1. Daftarkan digit pertama (0 sampai 9) di kolom paling kiri (sebagai batang atau stem)
Metode PI Ekonomi: Analisis Deskriptif
65
2. Digit kedua ditempatkan di sebelah kanannya (sebagai daun atau leaf)
Contoh, misalkan diketahui data-data sebagai berikut:
37 42 48 49 53 55 57
58 59 60 62 62 70 71
Stem: Leaf:
0
1
2
3 7
4 289
5 35789
6 022
7 01
8
9
Soal
Seorang peneliti sedang melaksanakan penelitian mengenai potensi ekonomi para pedagang
kaki lima yang menjual makanan atau jajanan di pinggir jalan-jalan di seluruh Wilayah
Depok. Salah satu variabel yang diamati adalah keuntungan bersih per hari yang diperoleh
setiap pedagang. Ukuran sampel yang diambil adalah 41 pedagang kaki lima dengan data
selengkapnya mengenai keutungan bersih dalam ribuan rupiah sebagai berikut:
75 98 42 75 84 87 65 59 63
86 78 37 99 66 90 79 80 89
68 57 95 55 79 88 76 60 77
93 85 70 62 80 74 69 90 62
84 64 73 48 72
Selain analisis deskriptif yang meliputi gejala pusat dan sebaran datanya, buatlah grafik
stem and leaf-nya!
SPSS
Open Data : Stem.sav
Menu : Statistics Summarize Explore
Devendent list: Ujian
Klik Plots dan pilihlah stem and leaf
Output :
Frequency Stem & Leaf
1,00 3 . 7
2,00 4 . 28
3,00 5 . 579
Metode PI Ekonomi: Analisis Deskriptif
66
9,00 6 . 022345689
11,00 7 . 02345567899
9,00 8 . 004456789
6,00 9 . 003589
Stem width: 10
Each leaf: 1 case(s)
5. Boxplot (box and whisker)
Boxplot merupakan teknik grafis yang dikembangkan oleh Tukey dan sering
digunakan untuk analisis data eksplorasi. Grafik ini secara umum mengurangi penyajian
data mentah yang terperinci pada grafik stem and leaf sehingga efektif untuk ukuran data
yang relatif lebih besar, serta memvisualisasikannya dalam bentuk lain tanpa kehilangan
berbagai informasi statistika deskriptif yang meliputi lokasi distribusi, sebaran, bentuk,
panjang ekor kurva distribusi, dan data ekstrem. Jadi statistik median, kuartil bawah, kuartil
atas, data terkecil dan data terbesar. Median dan kuartil pada boxplot digunakan sebagai
ukuran gejala pemusatan dan sebaran karena statistik tersebut relatif tidak dipengaruhi
(resistensi) oleh data ektrem. Statistik dikatakan resisten jika ralatif tidak dipengaruhi data
ekstrem atau outlier dan perubahan hanya terjadi jika terjadi penggantian data pada
sejumlah proporsi tertentu dari kumpulan data awal.
Boxplot bisa dibuat relatif mudah secara manual atau dengan bantuan program
komputer statistika. Elemen dasar dari bentuk grafiknya adalah (1) kotak segi empat yang
memuat 50 persen data (ingat istilah IQR atau interquartile range), (2) garis melintang pada
kotak yang menunjukkan median, (3) kedua sisi pada kotak dengan kutub yang berlawanan
(kiri dan kanan, atau atas dan bawah), disebut hinges, dan (4) serat (whisker) yang
menghubungkan hinges dikedua sisi dengan data terkecil dan data terbesar. Penjelasan
selengkapnya mengenai bentuk grafik ini bisa dilihat pada Gambar berikut.
Metode PI Ekonomi: Analisis Deskriptif
67
whisker
median
Hinge:
kuartil
bawah
Hinge:
kuartil
atas
50% data
berada
dalam
kotak
1.5IQR IQR 1.5IQR
batas dalam:
hinge atas
+ 1.5 IQR
batas dalam:
hinge bawah
+ 1.5 IQR
batas luar:
hinge atas
+ 3 IQR
batas luar:
hinge bawah
+ 3 IQR
data
outlier
data
sangat
ekstrem
data
outlier
data terbesar
dalam1.5 IQR
data terkecilr
dalam1.5 IQR
Soal
Seorang mahasiswa, yang sedang menyusun skripsi, melakukan penelitian mengenai strategi
harga yang dibuat oleh penjual pakaian jadi wanita di DKI Jakarta. Ukuran sampel yang
diambil adalah sebanyak 100 penjual dengan data harga jual ke konsumen langsungnya
dalam ribuan rupiah sebagai berikut:
25 40 45 45 100 48 50 65 75 65
45 42 50 55 45 45 50 55 40 50
15 20 75 45 42 50 60 45 50 75
25 25 42 45 40 65 65 45 45 40
50 55 50 75 65 50 75 75 55 50
250 40 45 80 75 45 45 40 40 55
10 45 50 45 15 20 25 25 45 40
25 75 65 50 45 40 30 30 35 45
55 65 45 40 25 90 85 85 90 45
40 35 45 40 45 35 25 45 30 40
Informasi statistik apa saja yang akan diperoleh mahasiswa tersebut jika data diatas
disajikan dalam bentuk grafik boxplot?
Metode PI Ekonomi: Analisis Deskriptif
68
SPSS
Data (Open) : boxplot.sav
Menu : Graphs Boxplot
Pada kotak dialog yang muncul, pilihlah simple dan summaries of
separate variable. Klik Define dan masukkan Harga ke kotak Variable.
Setelah selesai, Klik OK
Output :
HARGA
0 20 40 60 80 100
Berdasarkan bentuk Boxplot diatas, kita bisa menyimpulkan bahwa data harga pakaian
menjulur kekiri atau sebagain besar data relatif terkumpul pada harga yang rendah. Selain
itu dapat disimpulkan harga pakaian yang terendah tidak terlalu jauh dari harga rata-rata,
sedangkan harga tertinggi relatif jauh dari rata-rata harga. Berbagai kemungkinan bentuk
Boxplot dan informasi yang bisa diperoleh dari bentuk tersebut dapat dilihat pada Gambar
berikut:
Metode PI Ekonomi: Analisis Deskriptif
69
Simetris
Simetrisukuran
relatif lebih
besar dalam proporsi
terhap ukuran sampel
Menjulur ke kanan
Menjulur ke kiri
Sebaran kecil
Menjorok kedalam
pada median untuk
uji kesamaan dengan
median populasi

0 komentar: On BAB 5 ANALISIS DESKRIPTIF

Posting Komentar

Entri Populer

tempat iklan
Grab this Widget ~ Blogger Accessories
 
bottom