Selasa, 04 Oktober 2022

Big Data Analytics



Big Data Analytics adalah penggunaan teknik analitik tingkat lanjut terhadap kumpulan data besar yang sangat besar dan beragam yang mencakup data terstruktur, semi-terstruktur, dan tidak terstruktur, dari berbagai sumber, dan dalam ukuran berbeda dari terabyte hingga zettabytes.

Apa sebenarnya big data itu? Ini dapat didefinisikan sebagai kumpulan data yang ukuran atau jenisnya di luar kemampuan database relasional tradisional untuk menangkap, mengelola, dan memproses data dengan latensi rendah. Karakteristik big data meliputi volume tinggi, kecepatan tinggi, dan keragaman tinggi. Sumber data menjadi lebih kompleks daripada sumber data tradisional karena didorong oleh kecerdasan buatan (AI), perangkat seluler, media sosial, dan Internet of Things (IoT). Misalnya, berbagai jenis data berasal dari sensor, perangkat, video/audio, jaringan, file log, aplikasi transaksional, web dan media sosial sebagian besar dihasilkan secara real time dan dalam skala yang sangat besar.

Dengan  Big Data Analytics, pada akhirnya Anda dapat mendorong pengambilan keputusan, pemodelan, dan prediksi hasil masa depan yang lebih baik dan lebih cepat, serta kecerdasan bisnis yang ditingkatkan. Saat Anda membangun solusi data besar, pertimbangkan perangkat lunak sumber terbuka seperti Apache Hadoop, Apache Spark, dan seluruh ekosistem Hadoop sebagai alat pemrosesan dan penyimpanan data yang hemat biaya dan fleksibel yang dirancang untuk menangani volume data yang dihasilkan hari ini. 

Cara kerja big data analytics ?
Big Data Analytics mengacu pada pengumpulan, pemrosesan, pembersihan, dan analisis kumpulan data besar untuk membantu organisasi mengoperasionalkan data besar mereka.
  • Kumpulkan Data
    Pengumpulan data terlihat berbeda untuk setiap organisasi. Dengan teknologi saat ini, organisasi dapat mengumpulkan data terstruktur dan tidak terstruktur dari berbagai sumber mulai dari penyimpanan cloud hingga aplikasi seluler hingga sensor IoT di dalam toko dan seterusnya. Beberapa data akan disimpan di gudang data tempat alat dan solusi intelijen bisnis dapat mengaksesnya dengan mudah.
  • Data proses
    Setelah data dikumpulkan dan disimpan, itu harus diatur dengan benar untuk mendapatkan hasil yang akurat pada kueri analitik, terutama jika datanya besar dan tidak terstruktur. Data yang tersedia tumbuh secara eksponensial, membuat pemrosesan data menjadi tantangan bagi organisasi. Salah satu opsi pemrosesan adalah pemrosesan batch, yang melihat blok data besar dari waktu ke waktu.
  • Bersihkan Data
    Data besar atau kecil memerlukan scrubbing untuk meningkatkan kualitas data dan mendapatkan hasil yang lebih kuat; semua data harus diformat dengan benar, dan data duplikat atau tidak relevan harus dihilangkan atau diperhitungkan.
  • Menganalisis data
    Mendapatkan data besar ke dalam keadaan yang dapat digunakan membutuhkan waktu. Setelah siap, proses analitik lanjutan dapat mengubah data besar menjadi wawasan besar. Ada beberapa cara untuk melakukan analisis data diantaranya dengan menggunakan Data Mining, Predictive analytics, dan Deep learning.
Langkah Penerapan Big Data Analytics
  • Data mining
    Ada dua hal yang difokuskan dalam big data analytics yaitu data mining dan data extraction. Secara sederhana, data extraction adalah sebuah proses pengumpulan data dari halaman web ke dalam database. 
  • Data collection
    Big data tidak memiliki tombol “End”, sehingga data yang masuk ke dalam database akan terus bertambah seiring dengan pertumbuhan dunia.Tidak hanya bertambah karena adanya data baru, data extraction harus terus dilakukan untuk mengumpulkan perubahan data yang terjadi dari tiap orang.
  • Data storing
    Storage untuk penyimpanan data yang baik menyediakan infrastruktur yang memiliki mesin analisis data terbaru. 
  • Data cleaning
    Data yang didapat dari proses big data analytics didapatkan secara keseluruhan melalui internet. Dari 100% data yang sudah didapatkan, kemungkinan ada 30%-40% data yang tidak akurat dan tidak dibutuhkan oleh perusahaan.Maka dari itu, dibutuhkan data cleaning alias pembersihan data untuk menyaring data mana yang dibutuhkan atau tidak. 
  • Data analysis
    Bagian terbesar dari big data analytics tentu saja analisis data. Ketika menganalisis data, data analyst akan masuk ke dalam pola sampai kebiasaan para audiens dan mencari mana yang paling dibutuhkan oleh klien.
  • Data consumption
    Data digunakan untuk keperluan dan kebutuhan yang berbeda oleh perusahaan, pemerintah, instansi bahkan organisasi.
Keuntungan dan Tantangan pada Big data analytics
  • Menjaga data Anda terorganisir dan dapat diakses. Tantangan terbesar yang terkait dengan data besar adalah mencari tahu bagaimana mengelola volume informasi yang masuk sehingga mengalir dengan baik di seluruh aplikasi Anda.
  • Kontrol kualitas. Mempertahankan keakuratan dan kualitas data Anda bisa jadi sulit dan memakan waktu, terutama ketika data itu masuk dengan cepat dengan volume yang sangat tinggi.
  • Menjaga keamanan data Anda. Dengan meningkatnya pelanggaran data, melindungi data Anda menjadi lebih penting dari sebelumnya. Seiring pertumbuhan sistem analitik Anda, begitu pula peluang untuk tantangan keamanan dalam bentuk data palsu, kebocoran, masalah kepatuhan, dan kerentanan perangkat lunak.
  • Memilih alat yang tepat. Banyaknya alat dan teknologi yang tersedia bisa sangat banyak untuk dipilih. Inilah sebabnya mengapa penting untuk mendidik diri sendiri, tetap mendapat informasi, dan jika mungkin, untuk menyewa atau berkonsultasi dengan spesialis bila diperlukan.
Adapun tantangan yang terlepas dari berapa banyak pekerjaan yang diperlukan untuk menyiapkan dan mengelola sistem secara efisien, keuntungan menggunakan analitik data besar sepadan dengan usaha, seperti :
  • Waktu yang lebih cepat untuk wawasan. Dengan kecepatan dan efisiensi yang tak tertandingi, analitik data besar membantu organisasi mengubah informasi menjadi wawasan dengan kecepatan yang lebih cepat.
  • Penghematan biaya. Sejumlah besar data membutuhkan penyimpanan, yang bisa mahal untuk dipelihara.
  • Kepuasan pengguna. Fitur intelijen bisnis canggih Big data tidak hanya menganalisis tren pelanggan.


Sumber : 
https://www.tableau.com/learn/articles/big-data-analytics 
https://azure.microsoft.com/en-us/resources/cloud-computing-dictionary/what-is-big-data-analytics/#applications-for-big-data
https://www.simplilearn.com/what-is-big-data-analytics-article