Tahapan Melakukan Pemodelan Data yang Terbaik

Pastilah kita semua mengetahui, bahwa data itu sebenarnya sangat penting dan vital dalam segala aspek yang erat relasinya dengan pengambilan suatu keputusan dan kebijakan terhadap objek tertentu. Tentu kita mengerti pula, bahwa data dalam prosesnya hingga sampai kepada pengambilan keputusan memerlukan analisis dan pemodelan yang tepat.
Hal tersebut dilakukan guna mengidentifikasi pola dan karakteristik data, mencari adakah faktor-faktor yang signifikan dalam data dan bagaimana mendapatkan suatu model terbaik untuk tahapan analisis nantinya. Oleh karena itu, terdapat beberapa tahapan atau stage untuk menidentifikasi karakteristik serta pemodelan data, yaitu :

1. Exploration
    Dalam tahap eksplorasi data ini, kita lihat dulu datanya, apakah terdapat outlier (karena outlier kemungkinan informasi tersebut berasal dari populasi yang lain'dunia lain' karena memang sebuah penelitian atau survey dilakukan dengan mengambil sampel, sementara sampel itu diambil berdasarkan varians dalam populasi yang pastinya terdapat variasi indikator tertentu di dalamnya) atau pencilan, tingkat, pengkalkulasian beberapa estimator nya, baik ukuran pemusatan, ukuran dispersi dan penyebarannya. Hal ini berfungsi sebagai early warning data sebagai identifikasi awal.

2.Uji Asumsi Awal
   Seperti biasanya, kita uji data tersebut dengan uji normalitas. Apakah data tersebut mengikuti distribusi data yang normal atau tidak. Jika terjadi data tidak normal, cara yang paling tepat adalah dengan menambah jumlah sampel, dengan berdasarkan Central Limit Theorem maka jika data yang berjumlah besar, maka dapat didekati dengan distribusi normal. Uji normalitas yang biasanya dipakai oleh statistisi dan para ahli adalah uji Kolmogorov-Smirnov dan Liliefors, tetapi disini biasanya terbatasi oleh ketersediaan atau jumlah data yang ada. Setelah asumsi normalitas terpenuhi, maka kita lanjutkan ke tahap berikutnya, yaitu

3. Pemodelan
    Dalam tahap pemodelan ini, kita buat beberapa calon model yang relevan dengan data yang ada.
Kemudian, kita uji besarnya korelasi antar variable bebas, dan korelasi variabel bebas terhadap variabel terikatnya atau y dalam hal ini. Kumpulkan semua informasi mengenai koefisien korelasi yang ada. Kemudian tentukan VIFnya dan  koefsien determinasinya atau R2 kemudian periksa, apakah nilai VIF > 10 atau tidak dengan ketentuan bahwa jika nilai VIF > 10 maka mengidentifikasikan adanya Multicolinearity atau adanya hubungan antar variabel bebasnya dalam hall ini X nya (khusus untuk pemodelan yang mempertimbangkan adanya interaksi antar variabel bebas), jika tidak maka lanjutkan ke tahap berikutnya, yaitu

4. Lakukan Uji terhadap β1 dan β2
    Misalnya dua variabel bebas X1 dan X2
    Lakukan Uji masing-masing koefisien tersebut dengan uji t - Students. Jika hasilnya β1 tidak signifikan dan β2 hasilnya juga tidak signifikan, maka cek dulu dengan uji F. Jika hasilnya signifikan, pastilah disini menimbulkan kecurigaan adanya Multicolinearity juga, tetapi memang tergantung pula ketersediaan datanya, kalau memang jumlahnya terbatas mau tidak mau kita harus mengecek kembali seberapa besar korelasi antar variabel. Disini jelas, jika uji F "berkata" signifikan maka hanya terdapat salah satu variabel bebas saja yang paling tepat masuk dalam model. Artinya jika X1 masuk dalam model, X2 dapat dihilangkan dari model atau sebaliknya. Untuk memutuskan hal tersebut, lagi lagi kita harus melihat besarnya masing-masing koefisien korelasinya yeng terbesar, maka variabel tersebutlah yang fit dimasukkan dalam model.
Perlu diperhatikan pula, bahwa semakin sedikit variabel yang masuk dalam model, artinya model tersebut semakin baik dan efisien karena dengan hanya satu atau beberapa variabel bebas dapat secara umum mendeskripsikan model secara umum.

** Bagaimana cara membedakan antara Interaction dan Multicolinearity ?.......
Interaksi adalah suatu kecenderungan antar variabel bebas atau variabel bebas terhadap variable terikatnya. Adanya interaksi ini berdasarkan logika atau referensi tertentu.
Sementara Multicolinearity menunjukkan korelasi yang kuat antar variabel bebasnya, namun lemah terhadap variabel terikatnya atau Y.

Kemudian terdapat beberapa metode untuk memilih model yang terbaik, apapun pemodelannya baik dengan mempertimbangkan adanya interaksi atau tidak, yaitu :

1. Koefisien Determinasi atau R2p dan Sum Square Error
    Yaitu dengan mencari nilai SSE yang terkecil, dengan demikian R2p menjadi lebih besar dimana

     R2p = 1- {SSE/SST} dimana SST adalah Sum Square Total.
    Kelemahan metode ini adalah jika variabelnya sangat banyak maka  R2p dipengaruhi oleh adanya penambahan variabel.

2. R2adjusted
    Yaitu juga dengan mencari nilai Mean Square Error (MSE), diman MSE=SSE/dof
dof adalah derajad kebebasan n-p sehingga secara matematis diformulasikan

     R2adjusted = 1 - {(SSE/(n-p)) / (SST/(n-1))}= 1 - [(n-1).{MSE/SST}]
maka kita harus mencari nilai MSE yang terkecil dan jumlah n yang besar.
Kelebihan metode ini nilainya < R2p sehingga seperti mereduce pengaruh dari penambahan variabel.

 3. Cp Mellow's Criteria
     Yaitu dengan mencari nilai Cp yang mendekati nilai parameternya atau p. Jika terdapat Q variabel maka nilai Cp yang terbaik adalah yang mendekati nilai Q+1, yang secara matematis diformulasikan

     Cp = {SSEp/MSEp} - (n-2p)

dimana, n adalah jumlah sampel sementara p adalah jumlah parameter.

 4. Stepwise Selection

 4.1 Forward Selection
       Caranya adalah dengan melakukan uji beruntun, memasukkan variabel bebas X satu per satu, sampai semua variabel telah teruji kelayakannya dalam model,
X1 > uji .....hasil tolak Ho tetap dalam model
X2 | X1 > uji ketika X2 dimasukkan dalam model saat X1 sudah ada dalam model....hasil tolak Ho, maka X2 masuk dalam model
X3|X1,X2 >uji ketika X3 dimasukkan dalam model saat X1 dan X2 sudah ada dalam model....hasil tolak Ho, maka X3 masuk dalam model
X4|X1,X2,X3  >uji ketika X4 dimasukkan dalam model saat X1,X2 dan X3 sudah ada dalam model....hasil tolak Ho, maka X4 masuk dalam model
X5| X1,X2,X3, X4 >uji ketika X5 dimasukkan dalam model saat X1,X2,X3 dan X4 sudah ada dalam model....hasil terima Ho, maka X5 tidak masuk dalam model
 (cari yang nilai t-nya terbesar)
begitu seterusnya sampai habis....

 4.2 Backward Selection
       Caranya adalah melakukan uji beruntun, dengan mengidentifikasi variabel-variabel mana saja yang harus tetap dalam model penuh dan mana yang harus dihilangkan dari model,
X1|X2,X3,X4,X5,X6,X7,X8,X9,X10,X11,X12,X13 uji apakah X1 layak dalam model, jika tolak Ho > X1 tetap ada dalam model
X2|X1,X3,.......X13 uji apakah X2 layak dalam model, jika terima tolak Ho > X2 dihilangkan dari model
X3|X1,X3,......X13  uji apakah X3 layak dalam model, jika terima tolak Ho > X3 dihilangkan dari model
X4|X1,X4,...X13 uji apakah X4 layak dalam model, jika tolak Ho > X4 tetap dalam model
begitu seterusnya sampai habis kombinasinya,...
(cari yang nilai t-nya terbesar)

5. PRESS
    Caranya adalah dengan mengurangi datanya, jadi yang minimal jumlah datanya maka itulah model yang terbaik. Selain itu, ada pula metode AIC dan SBC, hanya kurang begitu populer digunakan.

Mathematics Corner

Apakah Anda mengetahui bahwa sebenarnya terdapat pola tertentu dalam kalkulasi perkalian?...
Apakah Anda juga mengetahui bahwa  pola kalkulasi bilangan berpangkat mengikuti segitiga Pascal?.....
Tentu jika Anda belum mengetahui pola segitiga Pascal, berikut polanya :
                                                             1
                                                        1        1
                                                    1       2       1
                                                 1      3       3      1
                                             1      4      6       4      1   dst...
 

Hmm....kalau belum, coba deh kita mulai menghitung saja dengan contoh :

1. hitunglah berapakah nilai 124=...

nah, ternyata cara mengitungnya adalah

1.14.20_4.13.21_6.12.22_4.11.23_1.10.24

dimana 1,4,6,4 dan 1 adalah barisan segitiga Pascal pangkat 4
kemudian kita hitung masing-masing
1_8_24_32_16         nah, sekarang kita gunakan aturan penyusunan bilangannya menjadi,

                      16
                    32
                  24
                  8
                1
             ________ +
                20736

Nah, kan terbukti,...

Anda dapat mengaplikasikannya untuk menghitung bilangan berpangkat berapapun kok,...hehehe




By : Joko Ade Nursiyono

Potret Penduduk dan Nasib Lapisan Ozon O3

Indonesia merupakan salah satu negara yang memiliki jumlah penduduk yang sangat besar, berdasarkan data United Nations (PBB) tahun 2009 jumlah populasi Indonesia menempati peringkat ke-4 dunia setalah USA. Saat ini total populasi Indonesia kian meningkat, berdasarkan data hasil Sensus Penduduk 2010 menyebutkan bahwa jumlah total populasi penduduk Indonesia mengikuti sebaran penduduk eksponensial, yaitu sekitar 236,56 juta jiwa dengan proporsi 119,51 juta jiwa untuk populasi laki-laki dan 118,05 juta jiwa papulasi perempuan. Secara squensial, perjalanan laju trend populasi penduduk Indonesia sejak tahun 1930-an sampai tahun 2010 terlihat cukup normal, namun terus mengalami peningkatan. Tidak hanya teropong populasi Indonesia, sama halnya dengan jumlah penduduk dunia secara agregat berdasarkan data PBB pula mendeskripsikan komparasi jumlah penduduk semakin pesat yang terjadi pada tahun 2009 sebesar 6.829 juta jiwa. Dengan menggunakan pola laju pertumbuhan masing-masing negara dapat dilihat bahwa proyeksi jumlah penduduk dunia meningkat sekitar 2.000 juta jiwa lebih pada tahun 2025 dan 3.000 juta jiwa lebih di tahun 2050 diukur terhadap tahun 2009. Dimana, China masih memimpin dengan jumlah penduduk terbanyak sampai proyeksi tahun 2025, namun pada proyeksi tahun 2050 India diestimasikan akan mengalahkan China dengan populasi penduduk terbanyak sebesar 13,9 % dari proyeksi penduduk China dan ini mengindikasikan taraf keberhasilan China dalam mencapai target penurunan jumlah penduduk melalui program One Child Policy.
Sejalan dengan peningkatan penduduk bumi ini, tentunya berimbas terhadap variasi kegiatan manusia. Dimana, kegiatan manusia menghasilkan berbagai dampak lingkungan berupa polusi atau secara umum menimbulkan deplesi dan degredasi lingkungan. Kegiatan industri rumah tangga, pabrik, tambang dan kendaraan bermotor misalnya, yang paling banyak dalam menyumbang pencemaran terhadap udara. Sementara itu, semakin hari stok gas Oksigen atau O2 semakin menipis oleh karena berkurang dan rusaknya berbagai jenis tumbuh-tumbuhan, terutama hutan akibat kegiatan tersebut. Hal ini merupakan sebuah ancaman masa depan jika jumlah populasi hutan dan tumbuh-tumbuhan umumnya yang tidak mampu lagi menghasilkan Oksigen yang cukup bagi kehidupan mahluk hidup heterotrof, dalam hal ini manusia. Karena secara ilmiah dan biologis, jenis autotrof- lah yang mempunyai kemampuan menghasilkan gas Oksigen melalui proses respirasinya dengan asumsi bahwa komponen yang lain dikatakan relatif rendah sumbangsihnya terhadap stok Oksigen, misalnya plankton terutama fithoplankton. Sekilas mengerucutnya fenomena, peranan serta keadaan lingkungan akibat pertumbuhan jumlah penduduk yang semakin meningkat.
Berdasarkan apa yang terpaparkan sebelumnya, terlihat secara gamblang bahwa tidaklah mungkin pertumbuhan penduduk mampu menambah stok Oksigen yang tentu barangkali memerlukan uji statistik untuk membuktikannya. Terlepas dari hal itu, pastinya akan membuat hati merenung saat menengok situasi dan kondisi rata-rata suhu terutama suhu kerak Bumi Pertiwi ini, menurut data yang resmi dipublikasikan melalui situs NASA/ GISS tahun 2010 kemarin, bahwa dampak Global Warming mengalami laju peningkatan yang signifikan.

Berikut terlihat jelas, bahwa peningkatan suhu tahunan matahari semakin berefek ke semua belahan dunia, termasuk Indonesia. Pada tahun 1885, wilayah cikal bakal negara Indonesia masih belum terimbas efek pemanasan suhu bumi, kemungkinan besar pada saat itu kondisi hutan masih dalam keadaan stabil dan masih belum terjadi destruksi hutan atau lingkungan, begitu pula karena pada saat itu keadaan populasinya yang masih sedikit dan masih konvensionalnya berbagai bentuk industri serta sistem feodal dalam pengolahan lahan yang juga tergolong tradisional, menyebabkan tingkat pencemaran masih belum dapat dikatakan berpengaruh signifikan. Suhu tahunan matahari mulai menginfeksi ke Indonesia pada tahun 1902-an (pra-kebangkitan Nasional), dimana rata-rata kenaikan suhu tersebut tampak di bagian barat-laut dan tengah wilayah Indonesia. Hal ini memungkinkan adanya sebuah hipotesis bahwa kegiatan ekstraksi hutan mulai terjadi, sehingga stok oksigen berkurang dan berdampak pemanasan terutama fenomena ekstraksi hutan di pulau Kalimantan dan Sumatra.

Keadaan itu terus berlanjut semasa Indonesia menyatakan kemerdekaannya, di tahun 1945 tampak jelas bahwa peningkatan suhu kerak bumi negeri ini semakin meningkat signifikan. Memungkinkan munculnya hipotesis kedua bahwa keadaan politik, sosial dan ekonomi yang masih labil didukung oleh lemahnya sistem pengawasan kelembagaan dan institusi serta pada fragmen masyarakat sendiri, menyebabkan tindakan destruksi lingkungan terutama hutan yang semakin merajalela. Hal ini tampak bahwa cakupan wilayah yang mendapat efek peningkatan suhu bumi semakin meluas ke daerah Papua dan kepulauan Maluku. Ini hanyalah sebuah awal, ketika sebuah sistem dukung lingkungan alam yang diwarnai distorsi ternyata malah membudaya. Menyelam lebih jauh, pada masa gejolak klimaks negeri ini di tahun 1998, dimana siklus dan fluktuasi perekonomian terganggu, ketika saat dan kondisi psikologi kemasyarakatan terombang-ambing, begitu pula di bidang politik serta budaya yang tercoreng di kanca Internasional, suhu rata-rata tahunan matahari semakin tinggi saja. Tak terbendung lagi, jika menyatakan seluruh wilayah Indonesia mengalami dampak pemanasan tahunan matahari yang mungkin mampu mengindikasikan sebuah hipotesis ketiga.

Fenomena destruksi lingkungan alam apalagi hutan sudah membuat negeri ini merana dan merintih, melaju melirik rata-rata suhu tahunan matahari di tahun 2010 kemarin saja terlihat jelas bahwa tidak satu pun wilayah negeri ini yang tidak terkena dampak pemanasan. Dan ironisnya, efek pemanasan tersebut hampir menyelimuti seluruh permukaan bumi. Inikah teropong keadaan bumi, khususnya bumi pertiwi. Dapat menjadikan sebagai sebuah estimasi dan proyeksi, bagaimana suhu bumi 10-50 tahun ke depan dengan laju pertumbuhan penduduk, khususnya Indonesia yang semakin meningkat. Sebuah barometer yang menjadi jamrud katulistiwa yang terletak secara strategis, Indonesia dalam hal ini dapat dikatakan indikator efek pemanasan global karena dianggap sebagai paru-paru bumi karena hutannya yang berjumlah besar. Sebuah kerangka pikir mulai berjalan, ketika suhu naik pastilah berkurang organisme autotrof-nya, dalam hal ini adalah hutan. Namun, menjadi suatu pertanyaan jika revolver pupil mulai memfokus sejauh mata memandang alam.
Bila mata terfokus mengenai temperatur atau suhu rata-rata tahunan matahari utamanya, ketika itu pula sinanpsis akan mengartikan kepada akson dan dendrit, sel otak kiri serta otak kanan untuk merasakan apa yang terjadi dengan layer Ozon (O3) kala itu. Bagaimana dan mengapa suhu atau temperatur udara menjadi semakin panas, bahkan sepertinya manusia mulai kekurangan Oksigen untuk melakukan inspirasi dan respirasi. Sebuah bayangan saja, ketika 10 orang ditampung dalam sebuah ruangan kaca dengan ukuran yang hanya sebesar masing-masing badan mereka, kemudian ditutup dan diberi celah ventilasi sebesar masing-masing kepala mereka. Maka dapat dikomparasi, jika hal itu dilakukan pada saat ruangan diletakkan dibawah pohon rindang dan hijau dibandingkan saat ditaruh langsung dibawah terik matahari, tanpa tumbuhan hijau disekitarnya. Tentu meskipun diberi ventilasi yang cukup besar, tetapi jika hal itu berlangsung lama mungkin mengurangi sebuah nilai ekspektasi angka harapan hidup mereka. Inilah deskripsi indikasi terhadap nasib Ozon saat ini.
Ozon atau O3, seperti yang telah diketahui merupakan salah satu gas yang mendominasi layer atmosfer bumi. Fungsi dari Ozon sendiri adalah menyerap intensitas radiasi ultraviolet matahari, sehingga radiasi tersebut dipantulkan kembali ke segala arah agar tidak masuk dan langsung mengenai permukaan bumi atau korteks bumi. Kompleksitas fenomena kerusakan lapisan Ozon bukanlah sesuatu yang baru terjadi, namun telah didefinisikan sejak masa yang usang.
Merupakan faktualitas, bahwa kerusakan Ozon terjadi karena adanya zat-zat kimia yang mampu bereaksi, dan menguraikan Ozon menjadi zat (dalam hal ini gas) lain yang menghasilkan produk dengan kemampuan memfiltrasi radiasi ultraviolet matahari saat memasuki layer atmosfer bumi. Chloro Fluoro Carbon (CFC) misalnya, meskipun sering atau bahkan orang tidak mengerti akan efek kumulatifnya yang sangat membahayakan struktur Ozon, dimana O3 akan terurai menjadi O2 (Oksigen) dan O (Nascent/ gas awal) dan ini sering dipakai dalam kehidupan sehari-hari manusia. Sebagai sekelumit contoh, pemakaian pengharum ruangan atau parfume. Hal tersebut terlihat sepele, namun setidaknya perlu untuk ditegaskan kembali kepada masyarakat pada umumnya. Selain itu, ancaman terberat stabilitas lapisan Ozon adalah akumulasi gas Carbon Dioxide CO2 yang sampai detik ini masih memberikan sumbangsih terbesar sebagai polutan. Hal ini juga memberikan dampak langsung terhadap komposisi lapisan Ozon, dimana CO2 mampu menimbulkan efek rumah kaca atau Green House Effect sebagaimana ilustrasi yang terdeskripsi sebelumnya. Dengan adanya efek rumah kaca ini, radiasi panas matahari yang sampai ke permukaan bumi tidak dapat dipantulkan kembali ke langit karena akumulasi dari gas CO2 akan membentuk sebuah layer seperti kaca, sehingga malah dipantulkan kembali ke permukaan bumi, begitulah seterusnya. Implikasinya, suhu bumi semakin tinggi, sementara hutan ataupun komponen autotrof semakin mengecil jumlahnya. Bisa dibayangkan bagaimana kondisi temperatur bumi 70 tahun ke depan.

Ketika Mean Bertasbih di Atas Kemiskinan Negeri

Salah satu estimator yang sering digunakan dalam ilmu statistik adalah mean atau dalam bahasa umumnya adalah rata-rata. Mean adalah estimator titik yang banyak memiliki manfaat dalam melihat rataan suatu data, distribusinya serta estimasi interval statistik dari data tertentu. Dalam kenyataannya memang benar, bahwa mean hanyalah sebuah angka rerata suatu data, memang benar bahwa mean hanyalah sebuah point estimator yang sering membuat orang, masyarakat tertentu ataupun stakeholder mengeluarkan mosi tidak percaya ketika mean "berbicara". Apalagi mengenai kemiskinan yang sudah sangat lama usang menjadi parasit, barang tentu mean seperti menjadi bahan perdebatan para pemimpin berdasi negeri ini. Gemuruh meraung mean seakan mendobrak stabilitas setiap fragmen kehidupan negeri.
Sungguh ironis memang negeri ini. Betapa tidak, banyak masyarakat yang tidak pernah tahu apa itu rata-rata, apa kegunaannya, apa maksudnya dan apa guna, manfaat serta peranannya. Tidaklah membuat kaget, karena tingkat pendidikan di negeri ini memang terbilang dan banyak yang bilang sangat rendah, lemah dan keropos. Yakinlah bagaimana tanggapan kita, ketika seorang yang berprofesi sebagai petani ulung tiba-tiba ditanya, "Berapa rata-rata pengeluaran Bapak dalam sebulan terakhir?", yang jelas beda saat kita langsung bertanya," Rata-rata itu apa sih, Pak ?". Setidaknya, selembar contoh tersebut cukup merepresentasikan betapa pendidikan negeri ini belum semua elemen masyarakatnya tercover dengan baik.
Berawal dari sistem pendidikan, tentu kita semua mengetahui bahwa aspek pendidikan mempunyai korelasi yang sangat kuat terhadap tingkat pengetahuan dan pengalaman seseorang. Sehingga secara kasar pun kita bisa menebak, mengapa sebuah angka statistik itu sampai menjadi bahan perdebatan atau perenungan. Sebagai salah satu contoh saja mengenai angka kemiskinan yang tak baru dipublikasikan oleh Badan Pusat Statistik (BPS). Dimana, banyak pihak ataupun stakeholder yang tidak percaya dengan angka yang dikeluarkan oleh BPS karena masing-masing dari mereka juga mengeluarkan angka kemiskinan pula. Yang implikasinya, membawa masyarakat dalam keraguan dengan setiap data yang dipublikasikan BPS. Merogoh apa yang diperoleh BPS setelah melaksanakan pendataan PPLS kemarin, yang merupakan sebuah program yang diusung pemerintah dalam merealisasikan Bantuan Langsung Tunai atau (BLT). Banyak dari berbagai pihak yang meragukan data dari BPS, karena angka yang mereka keluarkan meskipun tidak berbeda signifikan namun malah menjadi bahan perdebatan dan menjadikan antar stakeholder saling berselisih satu dengan yang lain.hmmmm.....tentu terheran-heran, kenapa sistem birokrasi perstatistikan negeri ini tak konsisten. Menurut perundang-undagan, badan yang wajib menyelenggarakan statistik hanyalah BPS tetapi kenapa data itu tidak tersentral kepada BPS. Kenapa para stakeholder ataupun para peneliti malah meragukan data BPS yang sebagian besar adalah data primer. Nah, mungkin inilah poin perbedaan yang sebenarnya itu mewarnai perstatistikan nasional sampai saat ini. Aspek tersebut dikarenakan dalam statistik seseorang dituntut untuk melakukan uji mandiri terhadap masalah yang menjadi sorotannya. Dalam hakikat statistik, jika suatu fenomena itu adalah benar dan dapat deterima secara akal dan realita, tetapi belum tentu secara statistik. Seolah-olah dalam dalam statistik, kita diajarkan untuk mempelajari tentang kebohongan, egosentrisme serta keragu-raguan akan suatu hal. Sebuah estimator rerata suatu data yang disebut mean pun, apalagi saat berbicara tingkat kemiskinan pastilah akan menimbulkan berbagai pengertian dan anggapan bukan main perbedaannya. Mungkin terlepas dari itu semua, setidaknya saat inilah kita mencari titik simpul bagaimana caranya agar mean atau rata-rata itu merupakan suatu statistik yang unik/ tunggal, salah satunya adalah dengan membangun kerjasama dan kesepakatan antar berbagai pihak produsen data agar mean/ rata-rata tak lagi menjadi perdebatan bahwa "data sayalah yang paling benar", tetapi mengarah kepada " data kita semualah yang benar dan apa adanya".

Statistika Bicara Error

Dalam kehidupan sehari-hari, kita pastinya tidak dapat terhindar dari kesalahan atau secara ilmiah disebut error. Tentunya dengan adanya kesalahan, manusia dapat berpikir bagaimana cara mengatasi kesalahan tersebut, menghindari atau meminimalisirnya. Suatu kesalahan/galat sebenarnya merefleksikan kemampuan manusia dalam menghadapi permasalahan. Nah, dengan adanya kesalahan/error inilah munculah suatu disiplin ilmu yang mengupas secara detail, terintegrasi dan komprehensif, yaitu Statistika.

Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah 'statistika' (bahasa Inggris: statistics) berbeda dengan 'statistik' (statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.

Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam (misalnya astronomi dan biologi maupun ilmu-ilmu sosial (termasuk sosiologi dan psikologi), maupun di bidang bisnis, ekonomi, dan industri. Statistika juga digunakan dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum), serta jajak cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi, statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.