Paul Brown, Peter Haas, Jussi
Myllymaki,
Hamid Pirahesh, Berthold Reinwald,
Yannis Sismanis
IBM Almaden Research Center
Halaman 161 – Buku Data
Management In A Connected World
Menuju
Otomatisasi Skala Besar Integrasi Informasi dan Penemuan.
Paul
Brown, Peter Haas, Jussi Myllymaki,
Hamid
Pirahesh, Berthold Reinwald, Yannis Sismanis
IBM
Almaden Research Center
Abstrak :
Tingginya biaya konsolidasi data merupakan inhibitor kunci dalam
penerapan integrasi informasi tradisional dan solusi untuk data warehousing.
Dalam tulisan ini, dirangkum generasi sistem manajemen database
terpadu yang mengambil integrasi informasi tradisional, manajemen konten, dan
teknik data warehouse ke tingkat berikutnyayaitu sebuah sistem yang akan mampu
mengintegrasikan jumlah sumber informasi yang sangat besar dan otomatisasi
untuk membangun bisnis global yang disebut" “Universal Business Objects”.
Kami menjelaskan teknik untuk menemukan, menyatukan, dan
menggabungkan data dari sejumlah besar sumber data yang berbeda. Teknologi yang
memungkinkan menurut kami adalah XML, layanan web, Web caching, messaging, dan
portal untuk real-time dashboarding dan pelaporan.
1. Pengantar
Motivasi
penulis dalam jurnal ini yaitu karena adanya tantangan membuat manajemen bisnis
lebih efisien dan fleksibel serta bagaimana menyatukan semua data dalam bentuk
terpadu baik untuk perusahaan menengah ataupun perusahaan skala besar
(enterprise).Data bisnis perusahaan yang biasanya tersebar dari ribuan sumber
dan dikumpulkan dalam waktu panjang hendaknya bisa disajikan dalam bentuk data
siap pakai sebagai bagian dari sistem turnkey. (Sistem
turnkey, adalah sistem yang seluruhnya sudah diselesaikan dan diuji serta
siap diimplementasikan. Biasanya dijual sebagai modul2 program kompilasi.)
Jurnal ini juga menyoroti banyaknya kekurangan dalam hal integrasi
data, apalagi untuk sistem database tradisional yang tidak dirancang untuk integrasi data di masa depan. Hal utama
dalam jurnal ini adalah bagaimana kita memahami data yaitu mencoba untuk
mencari tahu skema dari setiap sumber input data, aturan kendala yang mengatur
data dalam skema masing-masing, dan mungkin yang paling penting, aturan-aturan
yang menggambarkan hubungan antara data dari sumber yang berbeda. Pengolahan
data tradisional seperti ini disebut data warehouse.
Masalah yang muncul adalah bahwa Pengalaman dengan proyek
data-warehouse menunjukkan bahwa biaya modal integrasi yang sangat tinggidan
desain waktu rata-rata bisa enam bulan sampai dua tahun menyebabkan banyak
proyek gagal. Biaya untuk pengolahan data warehouse, setidaknya satu vendor
memperkirakan biaya untuk data warehouse adalah 70& dari total biaya.
Dalam Jurnal ini dirangkum bagaimana generasi sistem manajemen
database terpadu (DBMS) yang menyatukan integrasi informasi, manajemen konten,
dan data Warehouse dengan bisnis Intelijen.
Ada 4 hal dalam DBMS dalam jurnal ini :
1.
Bagaimana aliran
data antara sistem operasional dan Bagaimana menangkap data yang masih mentah
2.
Secara otomatis
membangun pandangan bisnis global dalam hal Universal Business Objects (UBOs),
3.
menyediakan
fungsionalitas Data Warehouse untuk UBOs seperti kubus query, analisis yang
canggih, danpropagasi efisien perubahan data,
4.
menyediakan antarmuka yang kaya untuk browsing
danmencari UBOs yang menyembunyikan rincian dan berbagai sistem operasional
dasar.
Jurnal ini mengambil pendekatan data-centric bahwa data yang
ditangkap tidak hanya data mentah saja, dan tidak bergantung padaskema
informasi . Untuk memastikan bahwa skala sistem untuk jumlah yang sangat besar
bisa dijadikan sumber informasi, kami mempekerjakan pesan asynchronous dan
merangkai teknik yang mirip dengan yang ditemukan di web skala aplikasi besar seperti Google. Jurnal ini menerapkan teknik
machinelearning untuk memetakan informasi di sumber yang berbeda, dan
mengembangkan algoritma baru untuk memetakan sumber-sumber informasi ke tingkat
yang lebih tinggi dari artefak bisnis, artefak baik dapat ditemukan oleh sistem
atau diperkenalkan ke dalam sistem melalui kamus data perusahaan, taksonomi,
dan ontologi. Jurnal ini memperkenalkan paradigma baru yang mengambil
permintaan query melalui UBOs dan mengubahnya menjadi pertanyaan atas sumber informasi
yang spesifik berdasarkan pada hubungan ditemukan antara sumber mereka.
Teknologi inti yang memungkinkan untuk generasi mendatang DBMSterintegrasi
adalah XML, layanan web, alat untuk penyebaran informasi dan dashboard,
kerangka kerja untuk manajemen informasi yang tidak terstruktur (seperti IBM
UIMA arsitektur) dan kemampuan pencarian lanjutan. Dan hal ini menjadi Sebuah
Database Management terpadu next generation.
0 comments:
Post a Comment
Disclaimer :
I can not guarantee that the information on my blog is 100% correct..
Don't Forget!Leave Comment Here NO SPAM PLEASE!!