PENGENTAR ANALISIS MULTIVARIAT
Analisis multivariat merupakan salah satu teknik statistik yang digunakan untuk memahami struktur data dalam dimensi tinggi. Disebut dimensi tinggi karena melibatkan lebih dari satu variabel. Variabel-variabel itu saling terkait (berkorelasi) satu sama lain. Disinilah letak perbedaan antara multivariabel dan multivariat. Multivariat pasti melibatkan multivariabel tetapi tidak sebaliknya. Multivariabel yang saling berkorelasilah yang dikatakan multivariat.
Sebuah unit penelitian dapat dilihat dari berbagai sudut pandang. Dalam penelitian mengenai kesejahteraan rakyat misalnya, kita dapat mengambil sejumlah rumah tangga sebagai unit penelitian. Sebuah rumah tangga bisa diukur pendapatannya, pengeluarannya, konsumsi protein, jumlah anggota rumah tangga dan lain-lain. Ada banyak dimensi yang bisa kita gali dari sebuah rumah tangga.
Misalkan sebuah kumpulan unit penelitian dinyatakan oleh sebuah himpunan . Kita memiliki n observasi yang diukur dalam p dimensi. Setiap observasi memiliki p dimensi dinyatakan dengan
Kita mungkin saja tetarik untuk mengetahui:
- Apakah ada komponen X yang lebih menyebar daripada yang lain?
- Apakah ada beberepa komponen yang membentuk suatu kelompok baru?
- Apakah ada nilai-nilai ektsrem dalam sebuah komponen?
- Bagaimana distribusi datanya?
- Apakah mungkin dilakukan pengurangan dimensi sehingga memungkinkan memandang dimensi yang lebih kecil?
Berdasarkan pertanyaan-pertanyaan diatas memunculkan berbagai teknik analisis multivariat seperti analisis komponen utama, kluster, diskriminan dan lain-lain.
Karakteristik Analisis Mutlivariat
Analisis statistik multivariat merupakan metode statistik yang memungkinkan kita melakukan penelitian terhadap lebih dari dua variable secara bersamaan. Dengan menggunakan teknik analisis ini maka kita dapat menganalisis pengaruh beberapa variable terhadap variabel – (variable) lainnya dalam waktu yang bersamaan. Contoh kita dapat menganalisis pengaruh variable kualitas produk, harga dan saluran distribusi terhadap kepuasan pelanggan. Contoh yang lain, misalnya pengaruh kecepatan layanan, keramahan petugas dan kejelasan memberikan informasi terhadap kepuasan dan loyalitas pelanggan. Analisis multivariat digunakan karena pada kenyataannnya masalah yang terjadi tidak dapat diselesaikan dengan hanya menghubung-hubungkan dua variable atau melihat pengaruh satu variable terhadap variable lainnya. Sebagaimana contoh di atas, variable kepuasan pelanggan dipengaruhi tidak hanya oleh kualitas produk tetapi juga oleh harga dan saluran distribusi produk tersebut.
Klasifikasi Teknik-Teknik Analisis Multivariat
Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu analisis dependensi dan analisis interdependensi. Analisis dependensi berfungsi untuk menerangkan atau memprediski variable (variable) tergantung dengan menggunakan dua atau lebih variable bebas. Yang termasuk dalam klasifikasi ini ialah analisis regresi linear berganda, analisis diskriminan, analisis varian multivariate (MANOVA), dan analisis korelasi kanonikal
Metode dependensi diklasifikasikan didasarkan pada jumlah variable tergantung, misalnya satu atau lebih dan skala pengukuran bersifat metrik atau non metrik. Jika variable tergantung hanya satu dan pengukurannya bersifat metrik, maka teknik analisisnya digunakan analisis regresi berganda. Jika variable tergantung hanya satu dan pengukurannya bersifat non-metrik, maka teknik analisisnya digunakan analisis diskriminan. Jika variable tergantung lebih dari satu dan pengukurannya bersifat metrik, maka teknik analisisnya digunakan analisis multivariate varian. Jika variable tergantung lebih dari satu dan pengukurannya bersifat non-metrik, maka teknik analisisnya digunakan analisis conjoint. Jika variable tergantung dan bebas lebih dari satu dan pengukurannya bersifat metrik atau non metrik, maka teknik analisisnya digunakan analisis korelasi kanonikal. Analisis interdependensi berfungsi untuk memberikan makna terhadap seperangkat variable atau membuat kelompok-kelompok secara bersama-sama. Yang termasuk dalam klasifikasi ini ialah analsis faktor, analisis kluster, dan multidimensional scaling. Contoh membuat klasifikasi terhadap kelompok pengunjung supermarket tertentu.
1.3 Analisis Dependensi
Analisis depedensi dibagi menjadi 1) analisis regresi berganda, 2) analisis diskriminan, 3) analisis multivariate varian, 4) analisis conjoint, dan 5) analisis korelasi kanonikal . Bagian berikut ini akan membahas masing-masing teknik analisis yang termasuk dalam metode-metode dependensi secara teori sedang untuk contoh penggunaan dengan SPSS
1.3.1 Analisis Regresi Linear Berganda
Yang dimaksud dengan analisis regresi linear berganda ialah suatu analisis asosiasi yang digunakan secara bersamaan untuk meneliti pengaruh dua atau lebih variable bebas terhadap satu variable tergantung dengan skala interval. Pada dasarnya teknik analisis ini merupakan kepanjangan dari teknik analisis regresi linear sederhana. Untuk menggunakan teknik analisis ini syarat-syarat yang harus dipenuhi diantaranya ialah:
- Data harus berskala interval.
- Variabel bebas terdiri lebih dari dua variable.
- Variabel tergantung terdiri dari satu variable.
- Hubungan antar variable bersifat linier. Artinya semua variable bebas mempengaruhi variable tergantung. Pengertian ini secara teknis disebut bersifat rekursif, maksudnya pengaruh bersifat searah dari variable-variabel X ke Y Tidak boleh terjadi sebaliknya atau juga saling berpengaruh secara timbal balik (reciprocal).
- Tidak boleh terjadi multikolinieritas. Artinya sesama variable bebas tidak boleh berkorelasi terlalu tinggi, misalnya 0,9 atau terlalu rendah, misalnya 0,01.
- Tidak boleh terjadi otokorelasi. Akan terjadi otokorelasi jika angka Durbin dan Watson sebesar < 1 atau > 3 dengan skala 1 – 4.
- Jika ingin menguji keselarasan model (goodness of fit), maka dipergunakan simpangan baku kesalahan. Untuk kriterianya digunakan dengan melihat angka Standard Error of Estimate (SEE) dibandingkan dengan nilai simpangan baku (Standard Deviation). Jika angka Standard Error of Estimate (SEE) < simpangan baku (Standard Deviation), maka model dianggap selaras.
- Kelayakan model regresi diukur dengan menggunakan nilai signifikansi. Model regresi layak dan dapat dipergunakan jika angka signifikansi lebih kecil dari 0,05 (dengan presisi 5%) atau 0,01 (dengan presisi 1%)
1.3.2 Analisis Diskriminan
Apa itu analisis diskriminan? Yang dimaksud dengan analisis diskriminan ialah suatu teknik statistik yang yang digunakan untuk memprediksi probabilitas obyek-obyek yang menjadi milik dua atau lebih kategori yang benar-benar berbeda yang terdapat dalam satu variable tergantung didasarkan pada beberapa variable bebas.
Lebih lanjut analisis diskriminan digunakan untuk membuat satu model prediksi keanggotaan kelompok didasarkan pada karakteristik-karakteristik yang diobservasi untuk masing-masing kasus. Prosedur ini akan menghasilkan fungsi diskriminan yang didasarkan pada kombinasi-kombinasi linier yang berasal dari variabel-variabel prediktor atau bebas yang dapat menghasilkan perbedaan paling baik antara kelompok-kelompok yang dianalisis. Semua fungsi dibuat dari sampel semua kasus bagi keanggotaan kelompok yang sudah diketahui. Fungsi-fungsi tersebut dapat diaplikasikan untuk kasus-kasus baru yang mempunyai pengukuran untuk semua variabel bebas tetapi mempunyai keanggotaan kelompok yang belum diketahui.
Tujuan utama menggunakan analisis diskriminan ialah melihat kombinasi linier. Artinya untuk mempelajari arah perbedaan-perbedaan yang terdapat dalam suatu kelompok sehingga diketemukan adanya kombinasi linier dalam semua variable bebas. Kombinasi linier ini terlihat dalam fungsi diskriminan, yaitu perbedaan-perbedaan dalam rata-rata kelompok. Jika menggunakan teknik ini, pada praktiknya peneliti mempunyai tugas pokok untuk menurunkan koefesien-koefesien fungsi diskriminan (garis lurus). Sebagai contoh: Jenis pelanggan kereta api secara umum dapat dibagi dua, yaitu mereka yang menggunakan jasa kereta api eksekutif dan bisnis/ekonomi. Untuk membuat klasifikasi ini prosedur analisis diskriman dapat digunakan sehingga kita dapat mengetahui faktor-faktor yang berpengaruh terhadap pembuatan klasifikasi tersebut. Tujuan melakukan klasifikasi tersebut ialah kita dapat mengetahui apakah pengelompokan tersebut signifikan atau tidak. Artinya kelompok yang menggunakan jasa kereta api eksekutif memang benar-benar berbeda dengan kelompok yang menggunakan kelas bisnis / ekonomi.
Untuk menggunakan teknik analisis ini syarat-syarat yang harus dipenuhi diantaranya ialah:
· Variabel tergantung hanya satu dan bersifat non-metrik, artinya data harus kategorikal dan berskala nominal.
· Variabel bebas terdiri lebih dari dua variable dan berskala interval.
· Semua kasus harus independent
· Semua variabel prediktor sebaiknya mempunyai distribusi normal multivariat, dan matrices variance-covariance dalam kelompok harus sama untuk semua kelompok
· Keanggotaan kelompok diasumsikan ekseklusif, maksudnya tidak satupun kasus yang termasuk dalam kelompok lebih dari satu. dan exhaustive secara kolektif, maksudnya semua kasus merupakan anggota satu kelompok
1.3.3 Analisis Korelasi Kanonikal
Pengertian dari analisis korelasi kanonikal ialah suatu teknik statistik yang digunakan untuk menentukan tingkatan asosiasi linear antara dua perangkat variable, dimana masing-masing perangkat terdiri dari beberapa variable. Sebenarnya analisis korelasi kanonikal merupakan perpanjangan dari analisis regresi linear berganda yang berfokus pada hubungan antara dua perangkat variable yang berskala interval. Fungsi utama teknik ini ialah untuk melihat hubungan linieritas antara variable-variabel kriteria (variable-variabel tergantung) dengan beberapa variable bebas yang berfungsi sebagai predictor. Sebagai contoh seorang peneliti ingin mengkaji korelasi antara seperangkat variable dalam perilaku berbelanja sebagai kriteria dan beberapa variable mengenai personalitas sebagai predictor. Tujuan penelitian ini ialah peneliti ingin mengetahui bagaimana beberapa karakteristik personalitas tersebut mempengaruhi perilaku berbelanja, misalnya pembuatan daftar belanja, jumlah toko yang dikunjungi, dan frekuensi belanja dalam satu minggu.
Untuk menggunakan teknik analisis ini syarat-syarat yang harus dipenuhi diantaranya ialah:
- Variabel bebas terdiri dari lebih dari dua variable yang berskala interval.
- Variabel tergantung terdiri dari lebih dari dua variable yang berskala interval.
- Hubungan antar variabel bebas dan tergantung bersifat linier. Artinya semua variabel bebas mempengaruhi secara searah terhadap semua variable tergantung, misalnya korelasi antara variable-variabel bebas personalitas yang digunakan sebagai predictor dengan variable-variabel tergantung yang digunakan sebagai kriteria bersifat searah. Jika nilai variabel variable personalitas besar, maka nilai variable-variabel perilaku berbelanja harus besar juga. Jika terjadi variabel variable personalitas besar bernilai besar sedang nilai variable-variabel perilaku berbelanja menjadi mengecil, maka hal ini berlawanan dengan asumsi linieritas.
· Tidak boleh terjadi multikolinieritas pada masing-masing kelompok variabel bebas dan variabel tergantung yang akan dikorelasikan.
1.3.4 Analsis Multivariat Varian (MANOVA)
Manova mempunyai pengertian sebagai suatu teknik statistik yang digunakan untuk menghitung pengujian signifikansi perbedaan rata-rata secara bersamaan antara kelompok untuk dua atau lebih variable tergantung. Teknik ini bermanfaat untuk menganalisis variable-variabel tergantung lebih dari dua yang berskala interval atau rasio.
Dalam SPSS prosedur MANOVA disebut juga GLM Multivariat digunakan untuk menghitung analisis regresi dan varians untuk variabel tergantung lebih dari satu dengan menggunakan satu atau lebih variabel faktor atau covariates. Variabel - variabel faktor digunakan untuk membagi populasi kedalam kelompok-kelompok. Dengan menggunakan prosedur general linear model ini, kita dapat melakukan uji H0 mengenai pengaruh variabel-variabel faktor terhadap rata-rata berbagai kelompok distribusi gabungan semua variabel tergantung. Kita dapat meneliti interakasi antara faktor-faktor dan efek dari faktor-faktor individu. Lebih lanjut, efek-efek covariates dan interaksi antar covariate dengan semua faktor dapat dimasukkan. Dalam analisis regresi, variabel bebas atau predictor dispesifikasi sebagai covariates
Sebagai contoh: Suatu perusahaan plastik mengukur tiga ciri khusus filem plastik: daya tahan tidak sobek, kehalusan, dan kapasitas. Dua tingkat ekstrusi dan dua zat aditif yang berbeda diujicobakan. Kemudian ketiga karakteristik tersebut diukur dengan menggunakan kombinasi tingkatan ekstrusi dan jumlah aditif masing-masing. Penelitian menemukan bahwa tingkat ekstrusi dan jumlah zat aditif masing-masing memberikan hasil yang signifikan, tetapi interaksi kedua faktor tidak signifikan
Pilihan-Pilihan untuk GLM Multivariate
Estimated Marginal Means. Pilihlah faktor-faktor dan interaksi yang kita inginkan untuk estimasi rata-rata marjinal populasi dalam sel-sel. Rata-rata ini jika ada kemudian dicocokkan dengan covariates. Interaksi akan ada jika kita mempunyai suatu model yang tetap.
- Compare main effects. Menyediakan perbandingan pasangan yang tidak terkoreksi antara rata-rata marjinal yang diestimasi untuk setiap efek dalam suatu model, yaitu untuk antara dan dalam faktor. Pilihan ini hanya tersedia jika efek-efek ditentukan dengan menggunakan opsi Display Means For list.
- Confidence interval adjustment. Pilihlah perbedaan signifikan yang terkecil (least significant difference (LSD)), Bonferroni atau Tidak disesuaikan dengan tingkat kepercayaan (confidence intervals) dan signifikansi. Opsi ini tersedia jika pilihan diberikan jika efek-efek utama perbandingan dipilih.
Untuk menggunakan MANOVA beberapa persyaratan yang harus dipenuhi ialah:
- Variabel tergantung harus dua atau lebih dengan skala interval
- Variabel bebas satu dengan menggunakan skala nominal.
- Untuk semua variabel tergantung, data diambil dengan cara random sample dari vektor-vektor populasi normal multivariate dalam suatu populasi, dan untuk matrik-matrik variance-covariance untuk semua sel sama
- Untuk menggunakan prosedur GLM gunakan prosedur Explore untuk memeriksa data sebelum melakukan analisis variance. Untuk satu variabel tergantung gunakanlah, prosedur GLM Univariate. Jika kita mengukur beberapa variabel tergantung yang sama pada beberapa kesempatan untuk masing-masing subyek, maka gunakanlah GLM Repeated Measures.
1.3.5 Ringkasan Teknik Analisis Dependensi Multivariat
Pada bagian ini akan dibahas mengenai ringkasan teknik-teknik analisis depedensi multivariat sebagaimana dalam table 1.1 di bawah ini.
Teknik | Tujuan | Jumlah Variabel Tergantung | Jumlah Variabel Bebas | Pengukuran Untuk Variabel Tergantung | Pengukuran Untuk Variabel Bebas |
Regresi Berganda | Untuk menganalisis secara bersmaan pengaruh beberapa variable bebas terhadap satu variable tergantung | 1 | 2 atau lebih | Interval | Interval |
Analisis Diskriminan | Untuk memprediksi probabilitas suatu obeyek-obyek atau individu-individu yang dimiliki oleh beberapa kategori yang berbeda didasarkan pada bebrapa variable bebas | 1 | 2 atau lebih | Nominal | Interval |
Korelasi Kanonikal | Untuk menentukan tingkat hubungan linear dua perangkat beberapa variabel | 2 atau lebih | 1 | Interval | Interval |
MANOVA | Untuk menentukan apakah terdapat perbedaan signifikan secara statistik pada beberapa variable yang terjadi secara serentak antara dua tingkatan dalam satu variabel | 2 atau lebih | 1 | Interval | Nominal |
Table 1.1 Ringkasan Teknik Analisis Dependensi Multivariat
1.4 Analisis Interdependensi
Pada bagian analisis interdependensi ini, terdapat tiga teknik analisis yang meliputi analisis faktor, analisis kluster, dan multidimensional scaling.
1.4.1 Analisis Faktor
Yang dimaksud dengan analisis faktor ialah suatu teknik analisis yang digunakan untuk memahami yang mendasari dimensi-dimensi atau regularitas suatu gejala. Tujuan utama teknik ini ialah untuk membuat ringkasan informasi yang dikandung dalam sejumlah besar variable kedalam suatu kelompok faktor yang lebih kecil. Secara statistik tujuan pokok teknik ini ialah untuk menentukan kombinasi linear variable-variabel yang akan membantu dalam penyeledikan saling keterkaitannya variable-variabel tersebut. Atau dengan kata lain digunakan untuk mengidentifikasi variabel-variabel atau faktor-faktor yang menerangkan pola hubungan dalam seperangkat variabel. Teknik ini bermanfaat untuk mengurangi jumlah data dalam rangka untuk mengidentifikasi sebagian kecil faktor yang dapat menerangkan varians yang sedang diteliti secara lebih jelas dalam suatu kelompok variabel yang jumlahnya lebih besar. Kegunaan utama analisis faktor ialah untuk melakukan pengurangan data atau dengan kata lain melakukan peringkasan sejumlah variabel menjadi lebih kecil jumlahnya. Pengurangan dilakukan dengan melihat interdependensi beberapa variabel yang dapat dijadikan satu yang disebut dengan faktor sehingga diketemukan variabel-variabel atau faktor-faktor yang dominan atau penting untuk dianalisa lebih lanjut.
Prosedur analisis faktor juga dapat digunakan untuk membuat hipotesis yang mempertimbangkan mekanisme sebab akibat atau menyaring sejumlah variabel untuk kemudian dilakukan analisis selanjutnya, misalnya mengidentifikasi kolinearitas sebelum melakukan analisis regresi linear.
Dalam prosedur analisis faktor, terdapat tingkatan fleksibilitas tinggi, diantaranya ialah:
- Tujuh metode untuk membuat ekstrasi faktor.
- Lima metode rotasi, diantaranya ialah direct oblimin dan promax untuk rotasi non orthogonal.
- Tiga metode untuk menghitung nilai-nilai faktor dan kemudian faktor-faktor tersebut dapat disimpan ke dalam file untuk dianalisis lebih lanjut.
Sebagai contoh dalam suatu penelitian, kita ingin mengetahui sikap-sikap apa saja yang mendasari orang mau memberikan jawaban terhadap pertanyaan-pertanyaan dalam suatu survei politik? Dari hasil penelitian didapatkan adanya tumpang tindih yang signifikan antara berbagai sub-kelompok butir-butir pertanyaan, misalnya pertanyaan-pertanyaan mengenai masalah perpajakan cenderung untuk berkorelasi satu dengan lainnya, masalah militer saling berkorelasi, masalah ekonomi juga demikian. Jika terjadi demikian, maka kita sebaiknya menyelesaikan persoalan tersebut dengan menggunakan analisis faktor. Dengan teknik ini kita dapat melakukan penyelidikan sejumlah faktor yang mendasarinya dan dapat mengidentifikasi faktor-faktor apa saja yang mewakilinya secara konseptual. Tidak hanya itu, kita juga dapat menghitung nilai-nilai untuk masing-masing responden dan kemudian dipergunakan untuk analisis selanjutnya. Sebagai contoh kita dapat membuat model regresi logistik untuk memprediksi perilaku pemberian suara didasarkan pada nilai-nilai faktor.
Untuk menggunakan teknik ini persyaratan yang sebaiknya dipenuhi ialah:
· Data yang digunakan ialah data kuantitatif berskala interval atau ratio.
· Data harus mempunyai distribusi normal bivariate untuk masing-masing pasangan variable
· Model ini mengkhususkan bahwa semua variabel ditentukan oleh faktor-faktor biasa (faktor-faktor yang diestimasikan oleh model) dan faktor-faktor unik (yang tidak tumpang tindih antara variabel-varaibel yang sedang diobservasi)
· Estimasi yang dihitung didasarkan pada asumsi bahwa semua faktor unik are tidak saling berkorelasi satu dengan lainnya dan dengan faktor-faktor biasa.
· Persyaratan dasar untuk melakukan penggabungan ialah besarnya korelasi antar variabel independen setidak-tidaknya 0,5 karena prinsip analisis faktor ialah adanya korelasi antar variabel.
1.4.2 Analisis Kluster
Analisis kluster merupakan suatu teknik analisis statistik yang ditujukan untuk membuat klasifikasi individu-individu atau obyek-obyek kedalam kelompok-kelompok lebih kecil yang berbeda satu dengan yang lain. Prosedur analisis kluster ini digunakan untuk mengidentifikasi kelompok kasus yang secara relatif sama yang didasarkan pada karakteristik-karakteristik yang sudah dipilih dengan menggunakan algoritma yang dapat mengatur kasus dalam jumlah besar. Algoritma yang digunakan mengharuskan kita membuat spesifikasi jumlah kluster-kluster yang akan dibuat. Metode yang digunakan untuk membuat klasifikasi dapat dipilih satu dari dua metode, yaitu memperbaharui kelompok-kelompok kluster secara iteratif atau hanya melakukan klasifikasi. Dalam analisa kluster tidak ada variabelbebas dan tergantung karena model analisa ini merupakan model independent. Kegunaan utama ialah untuk mengelompokkan obyek-obyek berdasarkan karakteristik tertentu yang sama. Obyek dapat berupa benda , misalnya produk ataupun orang yang biasa disebut responden. Kluster sebaiknya mempunyai kesamaan yang tinggi dalam kelompok kluster tersebut tetapi mempunyai perbedaan yang besar antar kelompok kluster
Contoh kasus: Kita ingin mengidentifikasi kelompok-kelompok pertunjukkan televisi yang menarik pemirsa yang mirip di setiap kelompok masing-masing. Dengan menggunakan analisis k-means cluster, kita dapat membuat kluster-kluster beberapa pertunjukkan televisi kedalam kelompok yang sama didasarkan pada karakteristik para pemirsa pertunjukkan tersebut. Kegunaan utama hal ini ialah untuk mengidentifikasi segmen-segmen untuk pemasaran yang akan bermanfaat untuk strategi pemasaran.
Untuk menggunakan teknik ini persyaratan yang harus dipenuhi, diantaranya ialah:
· Data yang digunakan untuk analisis ini ialah data kuantitatif berskala interval atau rasio.
· Metode yang ada ialah hubungan antara kelompok (between-groups linkage), hubungan dalam kelompok (within-groups linkage), kelompok terdekat (nearest neighbor), kelompok berikutnya (furthest neighbor), kluster centroid (centroid clustering), kluster median (median clustering), dan metode Ward's.
1.4.3 Multidimensional Scaling
Multidimensional scaling merupakan suatu teknik statistik yang mengukur obyek-obyek dalam ruangan multidimensional didasarkan pada penilaian responden mengenai kemiripan (similarity) obyek-obyek tersebut. Perbedaan persepsi diantara semua obyek direfleksikan didalam jarak relative diantara obyek-obyek tersebut didalam suatu ruangan multidimensional. Contoh kasus misalnya seorang responden diminta menilai kemiripan karakteristik antara mobil Honda dengan mobil Suzuki. Kemiripan ini dilihat didasarkan pada komponen-komponen sikap. Terbukanya komponen-komponen sikap tersebut akan membantu menerangkan mengapa obyek-obyek tersebut, dalam hal ini Mobil Honda dan Suzuki dinilai mempunyai kemiripan atau perbedaan diantaranya keduanya.
Multidimensional scaling dapat juga diaplikasikan kedalam rating subyektif dalam perbedaan (dissimilarity) antara obyek atau konsep. Lebih lanjut teknik ini dapat mengolah data yang berbeda dari berbagai sumber yang berasal dari responden. Sebagai contoh bagaimana orang diminta untuk melihat hubungan antara mobil yang berbeda. Jika seorang peneliti mempunyai data yang berasal dari responden yang menunjukkan penilaian kesamaan antara pembuatan yang berbeda dan model mobil, maka teknik multidimensional scaling dapat digunakan untuk mengidentifikasi dimensi-dimensi yang menggambarkan persepsi konsumen. Peneliti dapat menemukan, misalnya bahwa harga dan ukuran kendaraan mendefinisikan dua ruangan dimensional yang mempertimbangkan kesamaan-kesamaan yang dilaporkan oleh para responden.
Untuk menggunakan teknik analisis ini persyaratan yang harus dipenuhi diantaranya ialah:
- Data dapat menggunakan berbagai skala pengukuran, misalnya interval, rasio, ordinal dan nominal. Semua itu tergantung pada teknik yang dipergunakan.
- Jika data dalam bentuk keterbedaan, maka data tersebut harus kuantitatif dan diukur dengan skala pengukuran metrik yang sama, misalnya skala pengukuran interval. Jika data merupakan data multivariat, maka variable-variabel dapat berupa kuantitatif, biner atau data hitungan. Jika data mempunyai perbedaan dalam skala, misalnya ada rupiah, tahun, meter, dstnya; maka data tersebut harus di standarisasi terlebih dahulu dengan menggunakan prosedur yang sudah ada di dalam teknik ini.
- Asumsi menggunakan teknik multidimensional scaling procedure relative bebas dari asumsi distribusional. Sekalipun demikian kita harus memilih skala pengukuran yang tepat, misalnya ordinal, interval, atau ratio dalam SPSS pilihan ini ada di perintah Options.
- Jika file data mewakili jarak antara seperangkat obyek atau jarak antara dua perangkat obyek, maka kita harus melakukan spesifikasi bentuk matriks data untuk memperoleh hasil yang benar. Pilihlah alternative sebagai berikut: Square symmetric, Square asymmetric, atau Rectangular.
- Multidimensional scaling menggunakan data yang berbeda untuk membuat solusi penggunaan skala. Jika data merupakan data multivariat, maka kita harus menciptakan data yang berbeda untuk menghitung solusi multidimensional scaling. Kita dapat membuat spesifikasi detil-detil data tersebut dengan cara menciptakan pengukuran keterbedaan dari data yang kita miliki.
· Pengukuran akan memungkinkan kita membuat spesifikasi pengukuran keterbedaan dalam analisis yang kita lakukan. Caranya ialah dengan memilih satu alternatif dari Measure group yang berhubungan dengan tipe data yang dipunyai, dan kemudian pilih salah satu pengukuran dari daftar yang ada yang berhubungan dengan tipe pengukuran yang ada dalam SPSS, diantaranya:
· Interval. Euclidean distance, squared Euclidean distance, Chebychev, Block, Minkowski, atau Customized.
· Count. Chi-square measure atau Phi-square measure.
· Binary. Euclidean distance, Squared Euclidean distance, Size difference, Pattern difference, Variance, atau Lance dan Williams
· Pengukuran keterbedaan untuk data interval digunakan:
· Euclidean distance. Akar kuadrat jumlah perbedaan yang dikuadratkan antara nilai-nilai semua item.
· Squared Euclidean distance. Jumlah perbedaan yang dikuadratkan antara semua nilai bagi item-item tersebut.
· Chebychev. Perbedaan absolut maksimum nilai-nilai untuk semua item.
· Block. Jumlah perbedaan absolut antara nilai-nilai item; yang juga disebut sebagai Manhattan distance.
· Minkowski. Akar ke p dari jumlah perbedaan absolut ke to p power antara nilai-nilai semua item.
· Customized. Akar ke r dari jumlah perbedaan absolut ke p power antara nilai-nilai untuk semua item
· Pengukuran keterbedaan untuk data count digunakan:
· Chi-square measure. Didasarkan pada uji chi-square untuk kesejajaran (equality) untuk dua perangkat frekuensi..
· Phi-square measure. Pengukuran ini sejajar dengan chi-square measure yang normalisasikan dengan akar kuadrat dari frekuensi yang dikombinasikan.
· Pengukuran keterbedaan untuk data biner digunakan:
· Euclidean distance. Dihitung dari table lipat empat sebagai SQRT(b+c), dimana b dan c mewakili sel-sel diagonal yang berhubungan dengan kasus-kasus yang hadir dalam satu item tetapi absen di item-item lain.
· Squared Euclidean distance. Dihitung sebagai jumlah kasus-kasus yang sejajar. Nilai minimum sebesar 0, dan tidak mempunyai batas atas..
· Size difference. Indeks asimetris yang mempunyai jangkauan dari 0 ke 1.
· Pattern difference. Pengukuran keterbedaan untuk data biner yang berkisart dari 0 ke 1. Dihitung dari table lipat empat sebagai bc/(n**2), dimana b dan c mewakili sel-sel diagonal yang berhubungan dengan kasus-kasus yang hadir satu item tetapi absen di item-item lain dan n merupakan jumlah observasi total.
· Variance. Dihitung dari table lipat empat sebagai (b+c)/4n, dimana b dan c mewakili sel-sel diagonal yang berhubungan dengan kasus-kasus yang hadir satu item tetapi absen di item-item lain dan n merupakan jumlah observasi total dengan kisaran nilai dari 0 ke 1.
· Lance and Williams. Dihitung dari table lipat empat sebagai (b+c)/(2a+b+c), dimana a mewakili sel yang berhubungan dengan dengan kasus-kasus yang hadir dalam kedua item, dan b serta c mewakili sel-sel diagonal yang berhubungan dengan kasus-kasus yang hadir satu item tetapi absen di item-item lain. Pengukuran ini berkisar dari 0 ke 1. Pengukuran ini dikenal juga sebagai Bray-Curtis nonmetric coefficient.
· Pengukuran nilai-nilai yang ditransformasi digunakan:
· Z scores. Semua nilai distandarisasi kedalam nilai Z, dengan rata-rata sebesar 0 dan simpangan baku sebesar 1.
· Range -1 to 1. Masing-masing nilai untuk item tertentu yang sedang distandarisasi dibagi dengan jarak semua nilai.
· Range 0 to 1. Prosedur ini mengurangi nilai minimum dari masing-masing dari masing-masing item yang sedang distandarisasi kemudian dibagi dengan jarak.
· Maximum magnitude of 1. Prosedur untuk membagi masing-masing nilai untuk item tertentu yang sedang distandarisasi dengan jumlah maksimum semua nilai.
· Mean of 1. Prosedur untuk membagi masing-masing nilai untuk item tertentu yang sedang distandarisasi dengan rata-rata semua nilai.
· Standard deviation of 1. Prosedur untuk membagi masing-masing nilai untuk variable atau kasus tertentu yang sedang distandarisasi dengan simpangan baku semua nilai.
· Model Multidimensional Scaling
Estimasi yang tepat dalam suatu model multidimensional scaling tergantung pada aspek-aspek data dan model itu sendiri. Di bawah ini akan dibahas mengenai tingkat pengukuran, persyaratan, dimensi dan model scaling.
· Tingkat Pengukuran (Level of Measurement). Memungkinkan kita untuk membuat spesifikasi tingkat data, yang dapat berupa data ordinal, interval, atau rasio. Jika variable-variabel berupa ordinal, pilih Untie observasi-observasi terikat “tied” dengan meminta semua variable tersebut diperlakukan sebagai variable-variabel continuous, sehingga pengikat (tie) untuk semua nilai yang sama bagi kasus-kasus yang berbeda dapat diselesaikan secara optimal.
· Persyaratan (Conditionality). Memungkinkan kita untuk membuat spesifikasi perbandingan-perbandingan mana yang bermakna. Pilihannya ialah Matrix, Row, atau Unconditional.
· Dimensi (Dimensions). Memungkinkan kita membuat spesifikasi dimensionalitas dalam penyelesaian scaling. Salah satu penyelesaiannya ialah dengan menghitung masing-masing angka dalam kisaran tertentu.. Spesifikasi integer-integer antara 1 dan 6; minimal 1 diijinkan hanya jika kita memilih Euclidean distance sebagai model scaling. Untuk penyelesaian tunggal, spesifikasi angka yang sama dalam bentuk minimal dand maximal.
· Model Pembuatan Skala (Scaling Model). Memungkinkan kita melakukan spesifikasi asumsi-asumsi dimana scaling dilakukan. Pilihan yang tersedia ialah Euclidean distance atau Individual differences Euclidean distance (disebut juga sebagai INDSCAL). Untuk model Individual differences Euclidean distance, kita dapat memilih perintah Allow negative subject weights, jika sesuai dengan data yang ada.
· Opsi-Opsi dalam Multidimensional Scaling
Kita dapat membuat spesifikasi opsi-opsi dalam analisis multidimensional scaling, diantaranya:
· Display. Memungkinkan kita memilih berbagai tipe keluaran, misalnya. Group plots, Individual subject plots, Data matrix, serta Model dan options summary.
· Criteria. Memungkinkan kita menentukan kapan iterasi harus berhenti. Untuk mengubah default, masukkan nilai-nilai untuk S-stress convergence, Minimum S-stress value, dan Maximum iterations.
· Treat distances less than n as missing. Jarak (distance) kurang dari nilai yang dikeluarkan dari analisis.
1.4.4 Ringkasan Teknik Analisis Interdependensi Multivariat
Pada bagian berikut ini akan digambarkan table 1.2 berupa ringkasan teknik analisis interdependensi multivariat.
Teknik | Tujuan | Tipe Pengukuran |
Analisis Faktor | Untuk membuat ringkasan informasi yang berisi jumlah variable yang banyak menjadi sejumlah factor yang lebih sedikit | Interval |
Analisis Kluster | Untuk membuat klasifikasi individu-individu atau obyek-obyek ke dalam jumlah yang lebih kecil kelompok yang berbeda dengan tujuan untuk meyakinkan bahwa akan terdapat kesamaan yang besar dalam kelompok-kelompok tersebut dan perbedaan antar kelompok-kelompok tersebut | Interval |
Multidimensional Scaling | Untuk mengukur obyek-obyek dalam ruangan multidimensional dengan didasarkan pada penilaian-penilaian yang diberikan oleh responden mengenai kemiripan obyek-obyek tersebut. | Tergantung teknik yang digunakan |
1.5 Ringkasan
- Analisis multivariate digunakan jika suatu masalah dalam penelitian mengandung tiga atau lebih dari tiga variable. Selanjutnya dalam analisis ini dibagi menjadi dua kategori metode, yaitu metode dependensi dan interdepedensi. Model pertama terdapat dua jenis variable, yaitu variable bebas dan tergantung; sedang model kedua hanya terdapat satu jenis variable, yaitu variable bebas.
- Metode dependensi terdiri atas beberapa teknik analisis, yaitu regresi berganda, analisis diskriminan, korelasi kanonikal dan MANOVA
- Metode interdependensi terdiri atas beberapa teknik analisis, yaitu analisis faktor, analisis kluster dan multidimensional scaling.
1.6 Pertanyaan-Pertanyaan
1 Apa sebenarnya yang dimaksud dengan analisis multivariate?
2 Apa perbedaan antara metode dependensi dan interdependensi?
3 Apa tujuan-tujuan kita dalam menggunakan teknik-teknik analisis: regresi berganda, analisis diskriminan, korelasi kanonikal dan MANOVA
4 Apa tujuan-tujuan kita dalam menggunakan teknik-teknik analisis: analisis faktor, analisis kluster dan multidimensional scaling.
5 Berikan contoh-contoh kasus yang dapat menggambarkan masalah dan penyelesaiannya dengan menggunakan teknik-teknik analisis di atas baik yang termasuk dalam metode dependensi maupun interdependensi.
Tidak ada komentar:
Posting Komentar