Posts Tagged 'Statistika'

Big Data For Beginner

Apa itu big data? Data yang besar? Seberapa besar? Apakah itu penting?

Itu kiranya sederetan kecil pertanyaan mengenai istilah yang mulai populer sejak tahun 2012. Penulis sendiri pertama kali mendengar tentang istilah “BIG DATA” saat sedang asik-asiknya menyusun skripsi di tingkat univeritas. Saat itu penulis mengikuti sebuah seminar nasional yang diselenggarakan oleh mahasiswa di Program Studi Statistika UGM dengan tema “Data Mining…..”. Saat itu pola pikir yang terbayang adalah apa itu datang mining sampai saat seminar kemudian beberapa pembiacara mulai menyinggung tentang data mining dan hubungannya dengan big data.

Selain itu, aktivis-aktivis statistika yang merupakan alumni juga banyak membahas mengenai ini karena mereka mulai menemukan istilah ini di dunia kerja yang kebanyakan berhubungan dengan dunia perbankan dan telekomunikasi saat itu, bahkan dari mereka tak segan membentuk forum-forum kecil dan mengajak kami untuk menghadiri presentasi menganai apa itu BIG DATA.

Menurut gartner

“Big data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.”

Sejauh ini, inilah definisi BIG DATA yang paling menghampiri dari apa yang seharusnya setidaknya menurut saya. BIG DATA, data yang besar, sebesar apa sampai data itu kemudian digolongkan sebagai data yang besar? Adakah tolak ukur baku yang mengatur itu ? atau mungkin interval kelas sebagaimana statistisi biasa menggolongkan suatu tingkatan dan sebagainya. Big Data bukan hanya berbicara tentang bagaimana besar ukuran atau jumlah suatu data yang dapat di generate pada suatu proses, tetapi juga berbicara bagaimana efisiensi baik biaya, sumber daya dan tenaga dalam proses pengumpulannya, pengolahannya sampai ke sistem interpretasi hasilnya.

Google bisa dikatakan sebagai pelopor penggunaan BIG DATA, pada tahun 2006 mereka sempat memperkenalkan Google Bigtable. Bigtable merupakan sistem database berskala besar dan cepat yang digunakan Google untuk mengolah berbagai jenis data dari berbagai layanan, termasuk data dari layanan mesin pencari berbasis internet milik mereka. Setelah Google, Facebook pun menerapkan sistem database sejenis untuk menangani melonjaknya pengguna layanan mereka. Dengan teknologi Big Data, Facebook tak pernah kesulitan untuk menangani peredaran data yang melonjak drastis dalam enam tahun terakhir yang berasal dari 1 miliar pengguna jejaring sosial mereka. (tekno.liputan6)

Dari pengertian itu, setidaknya ada 3 hal yang kemudian popular dikenal sebagai 3V yang menjadi ciri dari sebuah BIG DATA.

Volume

Volume yang besar dari sebuah data tentu saja menjadi masalah, khususnya dalam hal penyimpanan atau storage dari data tersebut dan bagaimana data yang jumlah atau volumenya besar ini akan dianalisis dan menghasilkan sebuah kesimpulan untuk pengambilan keputusan. Contoh, bisa kita bayangkan berapa banyak data yang harus disimpan dan dianalisis di sebuah pusat perbelanjaan, kita tidak perlu berbicara Supermarket, cukup minimart yang banyak tersebar di sekitar kita. Jumlah outlet yang ratusan, jumlah produk yang ribuan bahkan puluhan ribu, standar ukuran diskon, jumlah pengunjung dan lainnya. Tentunya data yang besar ini kemudian tidak cukup untuk dianalisis dengan menggunakan excell biasa, mengingat besarnya jumlah data yang mungkin terkumpul pada satu hari transaksi, bagaimana kalau satu bulan? setahun? Bertahun-tahun? Bisa kita bayangkan.

Mengingat tidak semua data yang terkumpull apat digunakan untuk penarikan kesimpulan dan solusi maka sistem storage yang besar sangat diperlukan sebelum kita membuang item atau variabel data yang justru mungkin kita perlukan. Disinilah teknologi BIG DATA diperlukan.

Velocity

Kecepatan pertumbuhan data yang tinggi merupakan hal lain yang saat ini menjadi masalah. Bisa dibilang, permasalahan ini berkaitan erat dengan permasalahan volume data, karena kecepatan data dibuat umumnya berbanding lurus dengan volume data. Data tidak hanya datang dalam jumlah besar, tetapi juga dalam tempo yang lebih singkat dan bahkan ada yang real-time. (datascience)

Salah satu perusahaan telekomunikasi di Australia, misalnya, butuh untuk menganalisa kualitas koneksi internet jutaan pelanggannya secara near real-time. Setiap beberapa menit sekali, jutaan record data jaringan ditaruh ke platform big data, lalu dianalisa pada saat itu juga. Hasil analisa tersebut langsung divisualisasikan ke dashboard tim jaringan, dan tim jaringan bisa langsung bertindak apabila ada satu daerah yang mendadak mengalami penurunan kualitas koneksi internet. Lagi-lagi, tentu platform data konvensional juga bisa melakukan hal tersebut. Seperti alasan pemilihan big data untuk memecahkan masalah volume data, menyimpan dan mengolah data akan lebih ekonomis di platform big data. Beban penyimpanan dan pemrosesan data di data warehouse akan lebih berguna apabila diutilisasi untuk data-data yang berhubungan langsung dengan bisnis — data transaksi, keuangan, dan pelanggan(datascience)

Variety

Banyaknya ragam atau tipe data merupakan masalah terbesar di sini. Mengapa? Bisa anda bayangkan berapa banyak tipe dan bentuk data yang berseliweran dalam sebuah database? Belum lagi format ketika data itu di upload ke sistem data base, akan sangat beragam. Kebutuhan penyajian data yang lebih sederhana dari sekumpulan data yang kompleks inilah yang kemudian memicu lahirnya teknologi BIG DATA. Karena saat ini bukan lagi saatnya kita “memaksa” orang untuk mengupload sebuah informasi dari jenis file berbeda ke dalam format file yang kita harapkan. Contoh, ketika kita melamar pekerjaan misalnya, penyedia lamaran pasti akan meminta kita untuk mengirim file foto dengan format tertentu dan ukuran tertentu. Untuk apa? untuk memudahkan proses pengumpulan data, menghemat sistem storage dan sebagainya.

big-data-from-data-to-decision-making-to-action

Berangkat dari ketiga hal tersebut kemudian muncul pertanyaan, bagaimanakah teknik yang sederhana yang dapat membantu dalam hal pengolahan BIG DATA sehingga dapat membantu dalam pengambilan keputusan di berbagai bidang berdasarkan data riil bukan rekayasa? mari kita mulai dengan membahas yang paling populer saat ini yaitu, Hadoop

Hadoop adalah framework open source berbasis Java di bawah lisensi Apache untuk mensupport aplikasi yang jalan pada Big Data. Hadoop berjalan pada lingkungan yang menyediakan storage dan komputasi secara terdistribusi ke kluster-kluster dari komputer/node.

Kenapa Hadoop?

Mengingat sistem storage standar yang selama ini kita gunakan (untuk kompute PC, laptop atau smartphone) yang terbatas, maka tak terbayangkan bagaimana jika kapasitas data yang akan dan sedang kita gunakan sangat besar. Sederhananya ketika kita menginstall beberapa aplikasi di ponsel, sudah bisa dipastikan kinerja ponsel kita akan melambat karena semakin banyak sistem storage yang dipakai untuk menjalankan aplikasi tersebut.

Disinilah hadoop kemudian mengambil langkah untuk mengakomodir semakin besarnya inputan data yang masuk dengan mendukung pemprosesan secara terdistribusi ke kluster-kluster dari komputer yang didukung oleh dua komponen utama.

  • HDFS merupakan sistem penyimpanan/storage terdistribusi, yang melakukan proses pemecahan file besar menjadi bagian-bagian lebih kecil kemudian didistribusikan ke kluster-kluster dari komputer.
  • MapReduce merupakan algoritma/komputasi terdistribusi

Kemudian, bagaimanakah kita dapat mengaplikasikan penggunaan big data dalam keadaan riil?

Mari kita ambil contoh untuk  Analisa Perilaku Belanja Konsumen berikut ini.
Tahukah Anda, bahwa data struk belanja yang dimiliki oleh perusahaan ritel dapat digunakan untuk meneliti perilaku konsumennya?

Jadi, data dari tiap struk transaksi tentunya berisi kombinasi produk-produk yang Anda beli, jumlah dan harganya. Seluruh data transaksi tersebut kemudian dicari pola belanja untuk menjawab pertanyaan: kombinasi dua atau tiga produk apa saja yang paling sering dibeli oleh konsumen.Dari hasil informasi tersebut ada beberapa tindakan menarik yang dapat dilakukan, diantaranya: menyusun rak belanja agar dua atau tiga produk tersebut berdekatan sehingga mudah dijangkau oleh konsumen dan dapat diputuskan untuk dibeli dengan cepat. Kemudian bisa membuat paket promosi dimana kombinasi produk-produk tersebut dijual lebih murah.
Tindakan ini terbukti dapat meningkatkan penjualan secara signifikan dan mengurangi masalah inventori / stok.
Awalnya, permasalahan ini kelihatan mudah dan bisa dipecahkan dengan program spreadsheet seperti Excel. Namun, tahukah Anda jika Anda memiliki 1000 item SKU (produk) dari seluruh struk transaksi maka Anda sudah memiliki 999,000 kombinasi dua produk yang perlu dicek kembali ke data-data transaksi.
Berapa lama waktu yang Anda perlukan dengan menggunakan spreadsheet? Dua minggu? Sebulan? Namun, jika digabungkan dengan penggunaan teknologi data mining dan BIG DATA mungkin hanya memerlukan waktu beberapa detik atau mungkin paling lama 1 jam.

Sumber:

  1. Datascience.or.id
  2. noviadirsyamsuir.blogspot
  3. Apaitubigdata.com
  4. tekno.liputan6.com

Inferensi Statistika

Inferensi statistik adalah pengambilan kesimpulan tentang parameter populasi berdasarkan analisa pada sampel. Beberapa hal yang perlu diketahui berhubungan dengan inferensi statistik yaitu estimasi titik, estimasi interval dan uji hipotesis. Estimasi titik adalah menduga nilai tunggal parameter populasi. Estimasi Interval adalah menduga nilai parameter populasi dalam bentuk interval.

Uji hipotesis adalah suatu proses untuk menentukan apakah dugaan tentang nilai parameter /karakteristik populasi didukung kuat oleh data sampel atau tidak.

Hipotesis dalam inferensi statistik di bedakan menjadi hipotesis nol (Ho), yaitu hipotesis yang akan diuji oleh suatu prosedur statistik, biasanya berupa suatu pernyataan tidak adanya perbedaan atau tidak adanya hubungan, dan hipotesis alternativ (H1), yaitu hipotesis yang merupakan lawan dari Ho biasanya berupa pernyataan tentang adanya perbedaan atau adanya hubungan, yang selanjutnya digunakan untuk menunjukan bahwa pernyataan mendapat dukungan kuat dari data.

Tahap-tahap uji hipotesis secara umum, yaitu:
1. Tentukan model probabilitas yang cocok dari data,
2. Tentukan hipotesis Ho dan H1,
3. Tentukan statistik penguji,
4. Tentukan tingkat signifikansi,
5. Tentukan daerah kritik berdasarkan tingkat signifikansi,
6. Hitung statistik penguji,
7. Alternatif, hitung p-value berdasarkan statistik penguji, dan
8. Ambil kesimpulan berdasarkan poin 6 dan 7.

Statistika: Sejarah dan Makna

Sejarah Singkat Statistika

Penggunaan metode statistika dalam penelitian ilmiah dirintis pertama kali oleh F. Galton sejak tahun 1880 yaitu penggunaan korelasi dalam penelitian biologi. Akhir abad 19 Karl Pearson mempelopori penggunaan metode statistika dalam berbagai penelitian biologi dan pemecahan masalah yang bersifat sosio-ekonomis. Pada tahun 1918-1935, R. Fisher
memperkenalkan Analisis Variansi ke dalam literatur statistika. Sejak saat itu penggunaan statistika semakin meluas dari bidang biologi dan pertanian ke bidang-bidang lainnya.

Arti Statistika


Statistika diambil dari bahasa latin “status” yang berarti negara. Statistika berarti keterangan-keterangan yang dibutuhkan negara dan berguna bagi negara. Statistika hanya dikaitkan dengan penyajian fakta-fakta dan angka-angka tentang situasi perekonomian, kependudukan dan politik di suatu negara.

Contoh:

Statistika tenaga kerja
Statistika produksi pertanian

Sebagai suatu disiplin ilmu Statistika adalah sekumpulan konsep dan metode tentang pengumpulan, penyajian, analisis dan interprestasi data kuantitatif bidang kegiatan tertentu dan pengambilan kesimpulan dalam situasi dimana ada ketidakpastian dan variasi.

Jika yang dibahas hanya terbatas pada pengumpulan, penyajian dan analisis data, dinamakan statistika deskriptif. Namun demikian, jika semua dibahas dengan penekanan pada interprestasi data dan pengambilan kesimpulan disebut statistika induktif atau statistika inferensial.

Keunikan Bilangan dalam Operasi Matematika

mungkin tidak ada dari kita ataupun jika ada mungkin hanya sebagian kecil yang tahu tentang apa yang akan saya sajikan di bawah ini. yap, jika diperhatikan , bilangan-bilangan 1-9 jika kita menerapkan operasi matematika di dalamnya seperti penjumlahan (+), pengurangan (-), perkalian (x), pembagian dan kombinasi diantara keempat operasi tersebut akan mbentuk pola-pola yang luar biasa.

saksikan:

1 x 8 + 1 = 9
12 x 8 + 2 = 98
123 x 8 + 3 = 987
1234 x 8 + 4 = 9876
12345 x 8 + 5 = 98765
123456 x 8 + 6 = 987654
1234567 x 8 + 7 = 9876543
12345678 x 8 + 8 = 98765432
123456789 x 8 + 9 = 987654321
1 x 9 + 2 = 11
12 x 9 + 3 = 111
123 x 9 + 4 = 1111
1234 x 9 + 5 = 11111
12345 x 9 + 6 = 111111
123456 x 9 + 7 = 1111111
1234567 x 9 + 8 = 11111111
12345678 x 9 + 9 = 111111111
123456789 x 9 + 10 = 1111111111

9 x 9 + 7 = 88
98 x 9 + 6 = 888
987 x 9 + 5 = 8888
9876 x 9 + 4 = 88888
98765 x 9 + 3 = 888888
987654 x 9 + 2 = 8888888
9876543 x 9 + 1 = 88888888
98765432 x 9 + 0 = 888888888

1 x 1 = 1
11 x 11 = 121
111 x 111 = 12321
1111 x 1111 = 1234321
11111 x 11111 = 123454321
111111 x 111111 = 12345654321
1111111 x 1111111 = 1234567654321
11111111 x 11111111 = 123456787654321
111111111 x 111111111 = 12345678987654321

got it..??
itulah matematika, sukar tapi indah bagi mereka yang suka kesukaran
dan tak salah kiranya jika salah seorang dosen saya di FMIPA UGM menyatakan bahwa matematika itu seni tingkat tinggi, yang jika kita telah mengerti maknanya maka kita akan terjerat dalam keindahannya.

Periode Penemuan Matematika

matematika atau studi tentang bilangan dan bentuk seluruhnya sebenarnya hanya bertumpu pada 2 hal , yaitu aritmetika dan geometri…
nah di sini ane mau ngebagi inpo periode penemuan matematika yang mungkin agan-agan segani waktu di sekolah dulu..

Periode tahun 2000 SM – 300 M

  • Euclides (330-25 SM) menghipun segala geometri di zamannya menjadi satu sistem
  • Aritmatika (ilmu hitung), geometri, dan logika

Periode tahun 300 – 1400 M

  • Paruh kedua masa-masa puncak kejayaan ilmuan muslim sebelum memasuki abad kemacetan
  • Al-Khawarizmi (780-850) yang di barat dikenal sebagai algorismi, algorism,angrym,atau alguarisme. dijuluki “Bapak Aljabar” karena keahlian dan kepionirannya dalam bidang aritmatika, matematika dan astronomi, menemukan sistem hitungan pengganti sisten segsagesimal, memperkenalkan matematika dasar, beberapa rumus ilmu ukur, teorema trigonometri seperti sinus, cosinus, tangen,cotangen, cara menghitung luas segitiga, luas jajaran genjang, lingkaran dan sebagainya. Karyanya banyak disalin oleh sarjana Barat semisal Coppernicus, Feurbach dan Regiomuntanus
  • Abu Kamil Syja‘, ahli aljabar tertua yang berpengaruh besar pada perkembangan alojabar di Eropa melalui Leonard dari Pisa.
  • Teori Bilangan, Aljabar, geometrik analitik, trigonometri

Periode tahun 1400 – 1600 M

  • Umar Khayyam (1040-1124) penyair yang jago aljabar. Antara lain melakukan modifikasi terhadap perhitungan kalender muslim, menulis tentang persamaan linier, persamaan kuadrat, dan kubik
  • Niccolo Tartaglia, menerapkan matematika pada artileri dan menurunkan penyelesaian untuk persamaan kubik

Periode Abad ke-17

  • Isaac Newton dan Wilhelm Leibnitz, secara terpisah menemukan kalkulus. newton menerapkannya pada gerak planet sementara Leibnitz lebih berminat ke teori

Periode Abad ke-18

  • Kementakan (probabilitas) dan statistik, persamaan differensial, Kalkulus, geometrik analitik dan topologi

Periode Abad ke-19:

  • Bernard Riemann menemukan geometri untuk ruang berdimensi banyak
  • Komputer elektronik, teori informasi, teori fungsi, geometri non-euclides, logika matematika

Calendar

Mei 2024
S S R K J S M
 12345
6789101112
13141516171819
20212223242526
2728293031