Senin, 06 Juli 2020

JURNAL KOMPUTASI PARALEL UNTUK PROSES TABULASI DATA BERBASIS ARSITEKTUR SHARED MEMORY


UNIVERSITAS GUNADARMA
FAKULTAS TEKNOLOGI INDUSTRI
JURNAL KOMPUTASI PARALEL UNTUK PROSES TABULASI DATA BERBASIS ARSITEKTUR SHARED MEMORY

Nama Kelompok :        Fairuz Ayasha Sukma
                                      Firdha Nurul Amalia
                                      Yustika Maulida
                                      Zulfa Rohayati
Kelas                    :        4IA02


Program studi Pengantar Komputasi Modern
Universitas Gunadarma
2020

KOMPUTASI PARALEL UNTUK PROSES TABULASI DATA BERBASIS ARSITEKTUR SHARED MEMORY (STUDI DATASENSUS PENDUDUK 2010)

TAHUN 6, VOLUME 1, JUNI 2014


Pengertian Komputasi paralel

Komputasi paralel adalah salah satu teknik melakukan komputasi secara bersamaan dengan memanfaatkan beberapa komputer independen secara bersamaan. Ini umumnya diperlukan saat kapasitas yang diperlukan sangat besar, baik karena harus mengolah data dalam jumlah besar (di industri keuangan, bioinformatika, dll) ataupun karena tuntutan proses komputasi yang banyak.
Di dalam komputasi parallel ada yang dinamakan dengan pemrograman parallel. Pemrograman paralel adalah teknik pemrograman komputer yang memungkinkan eksekusi perintah atau operasi secara bersamaan (komputasi paralel), baik dalam komputer dengan satu(prosesor tunggal) ataupun banyak (prosesor ganda dengan mesin paralel) CPU. Bila komputer yang digunakan secara bersamaan tersebut dilakukan oleh komputer-komputer terpisah yang terhubung dalam suatu jaringan komputer lebih sering istilah yang digunakanadalah sistem terdistribusi (distributed computing).
Perlu diingat adalah komputasi paralel berbeda dengan multitasking. Pengertian multitasking adalah komputer dengan processor tunggal mengeksekusi beberapa tugas secara bersamaan. Walaupun beberapa orang yang bergelut di bidang sistem operasi beranggapan bahwa komputer tunggal tidak bisa melakukan beberapa pekerjaan sekaligus, melainkan proses penjadwalan yang berlakukan pada sistem operasi membuat komputer seperti mengerjakan tugas secara bersamaan. Sedangkan komputasi paralel sudah dijelaskan sebelumnya, bahwa komputasi paralel menggunakan beberapa processor atau komputer.Selain itu komputasi paralel tidak menggunakan arsitektur Von Neumann.



Review Jurnal

Jurnal ini membahas mengenai komputasi paralel untuk proses tabulasi data pada sensus penduduk 2010. Untuk menghasilkan informasi kependudukan dari data SP2010, BPS mengolah 237.641.326 data individu yang dikelompokkan berdasarkan kategori tertentu. Untuk memproses data tersebut BPS didukung dengan multi computer dengan basis data terpusat dan setiap komputer yang terhubung dilengkapi oleh multicore processor untuk melakukan perhitungan secara cepat. Proses tabulasi dilakukan dengan membagi data menjadi 33 region untuk diolah di setiap komputer, kemudian hasil parsial dari masing-masing komputer akan disatukan secara manual.
Penerapan konsep paralel dalam lingkungan komputer yang sedang digunakan saat ini menjadi salah satu solusi untuk mengurangi waktu yang diperlukan dalam melaksanakan tabulasi. Konsep paralel shared memory merupakan metode paralel yang memanfaatkan thread sebagai media untuk memproses task di setiap core pada processor. Pada penelitian ini konsep paralel akan diterapkan pada strategi pengambilan data di basis data.
Penelitian ini membahas tentang algoritma pengeksekusian tabulasi secara paralel    yang    akan    diimplementasikan    pada    multicore    processor dengan menggunakan konsep shared memory. Tujuan utama dari penelitian ini untuk merancang penguraian masalah dan menyusun algoritma yang efisien untuk melakukan tabulasi agar proses tabulasi dapat dipercepat.

Implementasi paralel pada multicore processor




Pada penelitian ini proses eksekusi query secara paralel dapat dilakukan pada aspek query dan operator. Untuk intra query parallelism dilakukan eksekusi subquery yang didapatkan pada proses penguraian secara paralel.


Kecepatan shared memory parallelism
 


Perancangan ini diharapkan dapat memberikan perubahan pada strategi pemrosesan data   terutama dalam kasus tabulasi, sehingga waktu yang diperlukan untuk memproses data dapat lebih singkat dengan memaksimalkan potensi sumber daya yang tersedia.

Kesimpulan
Berdasarkan penelitian yang telah dilakukan terkait penyimpanan dan pemrosesan data dengan memanfaatkan teknologi Big Data serta membandingkannya dengan teknologi RDBMS, dapat ditarik beberapa kesimpulan yaitu sebagai berikut:
1.      Pertumbuhan data di BPS dari tahun ke tahun menyebabkan ukuran data menjadi lebih besar dari sisi size, sehingga dibutuhkan adanya tempat penyimpanan yang memadai.
2.      Penerapan teknologi Big Data dengan memanfaatkan Hadoop, HBase, dan Pig merupakan alternatif solusi yang murah dan cukup baik untuk permasalahan penyimpanan dan pemrosesan data BPS dengan kuantitas yang besar.
3.      HDFS mampu menjadi alternatif pilihan tempat penyimpanan data yang baik dan bersifat SSOT (Single Source of Truth) untuk data BPS melalui fungsi replikasi secara otomatis yang ditawarkan dengan tetap menjamin kekonsistenan data.
4.      Jika ukuran data masih memenuhi kapasitas penyimpanan RDBMS, teknologi RDBMS masih menjadi teknologi yang cukup handal dari segi pemrosesan data, meskipun performa RDBMS menurun seiring dengan berkembangnya jumlah data yang disimpan dalam basis data.
5.      Teknologi Big Data yang dimanfaatkan dalam penelitian ini dapat menjadi alternatif solusi yang baik ketika data yang ada di BPS telah berkembang melebihi kapasitas sistem RDBMS, atau telah berkembang hingga memiliki struktur data yang beragam, maupun membutuhkan akses streaming terhadap data yang berkembang tersebut.
6.      Dalam penerapan teknologi Big Data dengan melibatkan sejumlah node (mode klaster) untuk penyimpanan dan komputasi data terdistribusi, terbukti menghasilkan performa yang lebih baik daripada hanya melibatkan satu node saja (mode komputer tunggal).
Saran
Berkaitan dengan hasil penelitian yang diperoleh, beberapa saran untuk pengembangan penelitian dan penerapan teknologi Big Data ke depannya di BPS yaitu sebagai berikut:
1.      Untuk saat ini, penerapan RDBMS di BPS masih dapat dilakukan, karena data yang ada di BPS masih dalam lingkup kapasitas RDBMS. Namun, untuk ke depannya BPS perlu mempersiapkan strategi-strategi untuk menghadapi tantangan terkait penyimpanan dan pemrosesan data-data yang ada, terutama ketika volume datanya telah berkembang melebihi kapasitas penyimpanan yang diterapkan saat ini, atau ketika volume datanya masih dalam lingkup kapasitas penyimpanan RDBMS namun kinerja pemrosesannya menurun sehingga perlu untuk diatasi melalui mekanisme lain. Untuk kondisi tersebut, teknologi Big Data dapat menjadi salah satu solusi alternatif yang murah dan bermanfaat.
2.      Terdapat kemungkinan untuk mengkombinasikan RDBMS dan teknologi Big Data dalam hal penyimpanan dan pemrosesan data. Teknologi Big Data dapat berperan menjadi alat dalam memasukkan raw data ke dalam tempat penyimpanan, sementara RDBMS dapat menjadi alat yang handal dalam memproses bagian dari data bervolume besar tersebut yang berada dalam lingkup kapasitasnya.
3.      Agar penerapan teknologi Big Data dengan memanfaatkan Hadoop dan HBase dapat berjalan dengan optimal, maka diperlukan proses tuning parameter konfigurasi dan pemeliharaan (maintenance) yang baik untuk setiap komponen yang terlibat khususnya untuk node yang berperan sebagai namenode dan HMaster.
4.      Dalam menerapkan teknologi Big Data, spesifikasi perangkat keras yang digunakan sebaiknya memiliki processor dengan inti yang lebih dari satu, RAM yang memadai dan sesuai dengan kebutuhan pengolahan data, serta memiliki kapasitas harddisk yang cukup besar dengan pertimbangan replikasi data yang ditentukan.
5.      Untuk penelitian selanjutnya, dapat dikaji teknologi lain terkait Big Data dalam melakukan pemrosesan data BPS atau data-data lain yang terkait, atau dengan memperbesar ukuran data, menambah variasi data yang akan dipakai dalam penelitian, serta mengkaji parameter-parameter komputasi terkait MapReduce dan/atau pemanfaatan NoSQL dari HBase.
Sumber: 
Komputasi Paralel

Jurnal:
JURNAL APLIKASI STATISTIK & KOMPUTASI STATISTIK