UNIVERSITAS GUNADARMA
FAKULTAS TEKNOLOGI INDUSTRI
JURNAL
KOMPUTASI
PARALEL UNTUK PROSES TABULASI DATA BERBASIS ARSITEKTUR SHARED MEMORY
Nama Kelompok : Fairuz Ayasha Sukma
Firdha
Nurul Amalia
Yustika
Maulida
Zulfa
Rohayati
Kelas : 4IA02
Program studi Pengantar Komputasi Modern
Universitas Gunadarma
2020
KOMPUTASI PARALEL UNTUK PROSES TABULASI DATA
BERBASIS ARSITEKTUR SHARED MEMORY (STUDI DATASENSUS PENDUDUK 2010)
TAHUN 6, VOLUME 1, JUNI 2014
Pengertian Komputasi paralel
Komputasi paralel
adalah salah satu teknik melakukan komputasi secara bersamaan dengan
memanfaatkan beberapa komputer independen secara bersamaan. Ini umumnya
diperlukan saat kapasitas yang diperlukan sangat besar, baik karena harus
mengolah data dalam jumlah besar (di industri keuangan, bioinformatika, dll)
ataupun karena tuntutan proses komputasi yang banyak.
Di dalam komputasi
parallel ada yang dinamakan dengan pemrograman parallel. Pemrograman paralel
adalah teknik pemrograman komputer yang memungkinkan eksekusi perintah
atau operasi secara bersamaan (komputasi paralel), baik dalam komputer dengan
satu(prosesor tunggal) ataupun banyak (prosesor ganda dengan mesin paralel)
CPU. Bila komputer yang digunakan secara bersamaan tersebut dilakukan oleh
komputer-komputer terpisah yang terhubung dalam suatu jaringan komputer
lebih sering istilah yang digunakanadalah sistem terdistribusi (distributed
computing).
Perlu diingat adalah
komputasi paralel berbeda dengan multitasking. Pengertian multitasking adalah
komputer dengan processor tunggal mengeksekusi beberapa tugas
secara bersamaan. Walaupun beberapa orang yang bergelut di bidang sistem
operasi beranggapan bahwa komputer tunggal tidak bisa melakukan beberapa
pekerjaan sekaligus, melainkan proses penjadwalan yang berlakukan pada
sistem operasi membuat komputer seperti mengerjakan tugas secara bersamaan.
Sedangkan komputasi paralel sudah dijelaskan sebelumnya, bahwa komputasi
paralel menggunakan beberapa processor atau komputer.Selain itu komputasi
paralel tidak menggunakan arsitektur Von Neumann.
Review Jurnal
Jurnal ini membahas mengenai
komputasi paralel untuk proses tabulasi data pada sensus penduduk 2010. Untuk
menghasilkan informasi kependudukan dari data SP2010, BPS mengolah 237.641.326
data individu yang dikelompokkan berdasarkan kategori tertentu. Untuk memproses
data tersebut BPS didukung dengan multi computer dengan basis
data terpusat dan setiap komputer yang terhubung dilengkapi oleh multicore
processor untuk melakukan perhitungan secara cepat. Proses tabulasi
dilakukan dengan membagi data menjadi 33 region untuk diolah di setiap
komputer, kemudian hasil parsial dari masing-masing komputer akan disatukan
secara manual.
Penerapan konsep paralel dalam
lingkungan komputer yang sedang digunakan saat ini menjadi salah satu solusi
untuk mengurangi waktu yang diperlukan dalam melaksanakan tabulasi. Konsep
paralel shared memory merupakan metode paralel yang
memanfaatkan thread sebagai media untuk memproses task di
setiap core pada processor. Pada penelitian ini
konsep paralel akan diterapkan pada strategi pengambilan data di basis data.
Penelitian ini membahas tentang algoritma
pengeksekusian tabulasi secara
paralel yang akan diimplementasikan pada multicore processor dengan
menggunakan konsep shared memory. Tujuan utama dari penelitian ini
untuk merancang penguraian masalah dan menyusun algoritma yang efisien untuk
melakukan tabulasi agar proses tabulasi dapat dipercepat.
Implementasi paralel pada multicore processor
Pada penelitian ini proses
eksekusi query secara paralel dapat dilakukan pada aspek query dan
operator. Untuk intra query parallelism dilakukan
eksekusi subquery yang didapatkan pada proses penguraian secara paralel.
Kecepatan shared memory parallelism
Perancangan ini diharapkan
dapat memberikan perubahan pada strategi pemrosesan
data terutama dalam kasus tabulasi, sehingga waktu yang
diperlukan untuk memproses data dapat lebih singkat dengan memaksimalkan
potensi sumber daya yang tersedia.
Kesimpulan
Berdasarkan penelitian yang telah
dilakukan terkait penyimpanan dan pemrosesan data dengan memanfaatkan teknologi
Big Data serta membandingkannya dengan teknologi RDBMS, dapat ditarik beberapa
kesimpulan yaitu sebagai berikut:
1. Pertumbuhan data di BPS dari tahun ke tahun
menyebabkan ukuran data menjadi lebih besar dari sisi size, sehingga dibutuhkan
adanya tempat penyimpanan yang memadai.
2. Penerapan teknologi Big Data dengan memanfaatkan
Hadoop, HBase, dan Pig merupakan alternatif solusi yang murah dan cukup baik
untuk permasalahan penyimpanan dan pemrosesan data BPS dengan kuantitas yang
besar.
3. HDFS mampu menjadi alternatif pilihan tempat
penyimpanan data yang baik dan bersifat SSOT (Single Source of Truth) untuk
data BPS melalui fungsi replikasi secara otomatis yang ditawarkan dengan tetap
menjamin kekonsistenan data.
4. Jika ukuran data masih memenuhi kapasitas
penyimpanan RDBMS, teknologi RDBMS masih menjadi teknologi yang cukup handal
dari segi pemrosesan data, meskipun performa RDBMS menurun seiring dengan
berkembangnya jumlah data yang disimpan dalam basis data.
5. Teknologi Big Data yang dimanfaatkan dalam
penelitian ini dapat menjadi alternatif solusi yang baik ketika data yang ada
di BPS telah berkembang melebihi kapasitas sistem RDBMS, atau telah berkembang
hingga memiliki struktur data yang beragam, maupun membutuhkan akses streaming
terhadap data yang berkembang tersebut.
6. Dalam penerapan teknologi Big Data dengan
melibatkan sejumlah node (mode klaster) untuk penyimpanan dan komputasi data terdistribusi,
terbukti menghasilkan performa yang lebih baik daripada hanya melibatkan satu
node saja (mode komputer tunggal).
Saran
Berkaitan dengan hasil penelitian yang diperoleh, beberapa saran untuk
pengembangan penelitian dan penerapan teknologi Big Data ke depannya di BPS
yaitu sebagai berikut:
1. Untuk saat ini, penerapan RDBMS di BPS masih dapat
dilakukan, karena data yang ada di BPS masih dalam lingkup kapasitas RDBMS.
Namun, untuk ke depannya BPS perlu mempersiapkan strategi-strategi untuk
menghadapi tantangan terkait penyimpanan dan pemrosesan data-data yang ada,
terutama ketika volume datanya telah berkembang melebihi kapasitas penyimpanan
yang diterapkan saat ini, atau ketika volume datanya masih dalam lingkup
kapasitas penyimpanan RDBMS namun kinerja pemrosesannya menurun sehingga perlu
untuk diatasi melalui mekanisme lain. Untuk kondisi tersebut, teknologi Big
Data dapat menjadi salah satu solusi alternatif yang murah dan bermanfaat.
2. Terdapat kemungkinan untuk mengkombinasikan RDBMS
dan teknologi Big Data dalam hal penyimpanan dan pemrosesan data. Teknologi Big
Data dapat berperan menjadi alat dalam memasukkan raw data ke dalam tempat
penyimpanan, sementara RDBMS dapat menjadi alat yang handal dalam memproses
bagian dari data bervolume besar tersebut yang berada dalam lingkup
kapasitasnya.
3. Agar penerapan teknologi Big Data dengan
memanfaatkan Hadoop dan HBase dapat berjalan dengan optimal, maka diperlukan
proses tuning parameter konfigurasi dan pemeliharaan (maintenance) yang baik
untuk setiap komponen yang terlibat khususnya untuk node yang berperan sebagai
namenode dan HMaster.
4. Dalam menerapkan teknologi Big Data, spesifikasi
perangkat keras yang digunakan sebaiknya memiliki processor dengan inti yang
lebih dari satu, RAM yang memadai dan sesuai dengan kebutuhan pengolahan data,
serta memiliki kapasitas harddisk yang cukup besar dengan pertimbangan
replikasi data yang ditentukan.
5. Untuk penelitian selanjutnya, dapat dikaji
teknologi lain terkait Big Data dalam melakukan pemrosesan data BPS atau
data-data lain yang terkait, atau dengan memperbesar ukuran data, menambah
variasi data yang akan dipakai dalam penelitian, serta mengkaji
parameter-parameter komputasi terkait MapReduce dan/atau pemanfaatan NoSQL dari
HBase.
(Sumber:https://docplayer.info/30450658-Jurnal-aplikasi-statistika-komputasi-statistik.html#show_full_text)
Sumber:
Komputasi Paralel
Jurnal:
JURNAL APLIKASI STATISTIK & KOMPUTASI STATISTIK
(Sumber:https://sulistio94.wordpress.com/2016/07/27/tugas-softskill-4-komputasi-pararel-di-bidang-ekononomi/)