Analitik prediktif: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
k hirarki > hierarki (menggunakan WP:JWB)
HsfBot (bicara | kontrib)
k Bot: Penggantian teks otomatis (-algoritma, +algoritme)
Baris 64:
 
=== Portofolio, produk, atau ekonomi-tingkat prediksi ===
Sering fokus analisis adalah bukan konsumen tapi produk, portofolio, perusahaan, industri atau bahkan ekonomi. Misalnya, pengecer mungkin tertarik dalam memprediksi toko-tingkat permintaan untuk manajemen persediaan tujuan. Atau Dewan Federal Reserve mungkin akan tertarik dalam memprediksi tingkat pengangguran untuk tahun berikutnya. Jenis-jenis masalah ini dapat diatasi dengan analisis prediktif menggunakan time series teknik (lihat di bawah). Mereka juga dapat diatasi melalui pendekatan pembelajaran mesin yang mengubah waktu asli seri ke sebuah fitur vektor ruang, di mana algoritmaalgoritme belajar menemukan pola-pola yang memiliki daya prediksi.
 
=== Manajemen risiko proyek ===
Baris 74:
== Teknologi dan data besar pengaruh ==
[[Big data]] adalah koleksi dari data set yang sangat besar dan kompleks sehingga mereka menjadi canggung untuk bekerja dengan menggunakan tradisional [[Pangkalan data|database management]] tools. Volume, variety, dan velocity data besar telah memperkenalkan tantangan di seluruh papan untuk pengambilan, penyimpanan, pencarian, berbagi, analisis, dan visualisasi. Contoh-contoh sumber data yang besar seperti [[Blog|web log]], [[RFID]], sensor data, [[jejaring sosial]], Internet pencarian pengindeksan, call detail records, militer, pengawasan, dan data yang kompleks dalam astronomi, biogeokimia, genomik, dan ilmu apabila. Big Data merupakan inti dari sebagian besar predictive analytic jasa yang ditawarkan oleh organisasi.
Berkat kemajuan teknologi di perangkat keras komputer—Cpu lebih cepat, memori yang lebih murah, dan MPP arsitektur dan teknologi baru seperti Hadoop, MapReduce, dan di-database dan [[Penambangan teks|teks analytics]] untuk pengolahan data yang besar, sekarang layak untuk mengumpulkan, menganalisis, dan tambang dalam jumlah besar yang terstruktur dan yang tidak terstruktur data untuk wawasan baru. Hal ini juga mungkin untuk menjalankan algoritmaalgoritme prediktif pada data streaming. Hari ini, menjelajahi data besar dan menggunakan analisis prediktif adalah dalam jangkauan organisasi lebih dari sebelumnya dan metode-metode baru yang mampu untuk penanganan seperti dataset yang diusulkan.
 
== Teknik analisis ==
Baris 157:
Multivariat dan Adaptive Regression Splines model hampir selalu menciptakan dasar fungsi yang berpasangan.
 
Multivariat dan adaptive regression spline sengaja overfits model dan kemudian plum untuk mendapatkan model yang optimal. AlgoritmaAlgoritme komputasi yang sangat intensif dan dalam prakteknya kita diminta untuk menentukan batas atas pada jumlah dasar fungsi.
 
=== Teknik pembelajaran mesin ===
Baris 169:
Jaringan saraf tiruan yang digunakan ketika sifat yang tepat dari hubungan antara input dan output tidak diketahui. Fitur kunci dari jaringan saraf adalah bahwa mereka mempelajari hubungan antara input dan output melalui pelatihan. Ada tiga jenis pelatihan yang digunakan oleh berbagai jaringan saraf: supervised dan unsupervised pelatihan dan penguatan belajar, dengan diawasi menjadi salah satu yang paling umum.
 
Beberapa contoh dari jaringan saraf tiruan teknik pelatihan [[AlgoritmaAlgoritme perambatan mundur|backpropagation]], cepat rambat, conjugate gradient descent, proyeksi operator, Delta-Bar-Delta dll. Beberapa tanpa pengawasan arsitektur jaringan multilayer [[perceptron]]s, Kohonen jaringan, jaringan Hopfield, dll.
 
==== Multilayer perceptron (MLP) ====
Baris 184:
 
==== ''k''-nearest neighbours ====
The [[KNN|nearest neighbour algorithm]] (KNN) milik kelas pengenalan pola metode statistik. Metode ini tidak memaksakan apriori asumsi tentang distribusi dari mana pemodelan sampel ditarik. Ini melibatkan pelatihan ditetapkan dengan nilai positif dan negatif. Sampel baru adalah diklasifikasikan dengan menghitung jarak ke tetangga terdekat pelatihan kasus. Tanda titik itu akan menentukan klasifikasi sampel. Di k-nearest neighbour classifier, k titik terdekat yang dianggap dan tanda mayoritas digunakan untuk mengklasifikasikan sampel. Kinerja dari algoritmaalgoritme kNN dipengaruhi oleh tiga faktor utama: (1) jarak pengukuran yang digunakan untuk menemukan terdekat tetangga; (2) keputusan aturan yang digunakan untuk memperoleh klasifikasi dari k-tetangga terdekat; dan (3) jumlah tetangga digunakan untuk mengklasifikasikan sampel baru. Hal ini dapat membuktikan bahwa, tidak seperti metode lain, metode ini adalah universal asimtotik konvergen, yaitu: sebagai ukuran dari training set meningkat, jika pengamatan independen dan identik didistribusikan (saya.aku.d.), terlepas dari distribusi dari sampel yang diambil, diperkirakan hotel akan berkumpul untuk tugas kelas yang meminimalkan kesalahan klasifikasi kesalahan. Lihat Devroy et al.
 
==== Geospasial pemodelan prediktif ====
Baris 232:
 
== Kritik ==
Ada banyak skeptis ketika datang ke komputer dan algoritmaalgoritme' kemampuan untuk memprediksi masa depan, termasuk Gary King, seorang profesor dari Harvard University dan direktur Institute for Kuantitatif Ilmu Sosial.<ref>{{Citation|last=Temple-Raston|first=Dina|title=Predicting The Future: Fantasy Or A Good Algorithm?|date=Oct 8, 2012|url=http://www.npr.org/2012/10/08/162397787/predicting-the-future-fantasy-or-a-good-algorithm|publisher=NPR}}</ref> orang-Orang yang dipengaruhi oleh lingkungan mereka dalam banyak cara. Memprediksi sempurna apa yang orang akan lakukan selanjutnya mensyaratkan bahwa semua variabel-variabel yang berpengaruh dapat diketahui dan diukur secara akurat. "Orang-orang lingkungan berubah bahkan lebih cepat dari yang mereka sendiri lakukan. Segala sesuatu dari cuaca untuk hubungan mereka dengan ibu mereka dapat mengubah cara orang berpikir dan bertindak. Semua variabel yang tak terduga. Bagaimana mereka akan mempengaruhi seseorang bahkan kurang dapat diprediksi. Jika dimasukkan ke dalam keadaan yang sama besok, mereka mungkin membuat benar-benar keputusan yang berbeda. Ini berarti bahwa statistik prediksi ini hanya berlaku dalam kondisi laboratorium steril, yang tiba-tiba tidak berguna seperti yang terlihat sebelumnya."<ref>{{Citation|last=Alverson|first=Cameron|title=Polling and Statistical Models Can't Predict the Future|date=Sep 2012|url=http://www.cameronalverson.com/2012/09/polling-and-statistical-models-cant.html|publisher=Cameron Alverson}}</ref>
 
Dalam sebuah studi dari 1072 makalah yang diterbitkan dalam Sistem Informasi Penelitian dan MIS Quarterly antara tahun 1990 dan 2006, hanya 52 empiris kertas berusaha prediksi mengklaim, dari yang hanya 7 dilakukan tepat pemodelan prediktif atau pengujian.<ref>{{Cite journal|last=Shmueli|first=Galit|date=2010-08-01|title=To Explain or to Predict?|url=http://projecteuclid.org/euclid.ss/1294167961|journal=Statistical Science|language=EN|volume=25|issue=3|pages=289–310|doi=10.1214/10-STS330|issn=0883-4237}}</ref>
Baris 239:
* Pidana Pengurangan Memanfaatkan Statistik Sejarah
* Belajar analytics
* Peluang algoritmaalgoritme
* [[Pengenalan pola]]
* Surveilans penyakit