Data Warehouse
Data warehouse adalah suatu paradigma baru
dilingkungan pengambilan keputusan strategik. Data warehouse bukan
suatu produk tetapi suatu lingkungan dimana user dapat menemukan informasi
strategic [Poniah, 2001, h.14]. Data warehouse adalah kumpulan
data-data logik yang terpisah dengan database operasional dan merupakan suatu
ringkasan.
Adapun karakteristik dari data
warehouse [Poniah, 2001,h.20-24] adalah sebagai berikut.
1. Berorientasi subyek
Data warehouse adalah tempat penyimpanan berdasakan
subyek bukan berdasakan aplikasi. Subyek merupakan bagian dari suatu
perusahaan. Contoh subyek pada perusahaan manufaktur adalah penjualan,
konsumen, inventori, daln lain sebagainya. Sumber: Poniah, 2001,h.21
Gambar 1. perbedaan data
warehouse dan database operasional Untuk lebih jelasnya mengenai
perbedaan antara database operasional dengan data warehouse bisa
dilihat pada tabel 1 dibawah ini.
2. Data yang terintegrasi
Sumber data yang ada dalam data
warehouse tidak hanya berasal dari database operasional (internal
source) tetapi juga berasal dari data diluar sistem (external source).
Data pada sumber berbeda dapat di-encode dengan cara yang berbeda.
Sebagai contoh, data jenis kelamin dapat dienkode
sebagai 0 dan 1 di satu tempat dan
”m” dan ”f” di tempat lain.
3. Nonvolatile
Data dalam database operasional akan
secara berkala atau periodic dipindahkan kedalam data warehouse sesuai
dengan jadwal yang sudah ditentukan. Misal perhari, perminggu, perbulan, dan
lain sebagainya. Sekali masuk ke dalam data warehouse, data adalah read-only .
Pada gambar 2
dibawah ini bisa dilihat bahwa
database OLTP bisa dibaca, diupdate, dan dihapus. Tetapi pada databasedata
warehouse hanya bisa dibaca.Sumber: Poniah, 2001,h.24 Gambar 2 Data
warehouse adalahnonvolatile
4. Time-Variant
Sistem operasional mengandung data
yang bernilai sekarang sedangkan data dalam data warehousemengandung
data tidak hanya data terkini tetapi juga data history yang
akan digunakan dalam analisis dan pengambilan keputusan. Waktu adalah dimensi
penting yang harus didukung oleh semua data warehouse. Data untuk
analisis dari berbagai sumber berisi berbagai nilai waktu, misalkan harian,
mingguan, dan bulanan.
5. Ringkas
Jika diperlukan, data operasional
dikumpulkan ke dalam ringkasanringkasan.
6. Granularity
Pada sistem operasional data dibuat
secara real-time sehingga untuk mendapatkan informasi langsung
dilakukan proses query. Pada data warehouse pada
menganalisis harus memperhatikan level-of-detailmisalkan perhari,
ringkasan perbulan, ringkasan per-tiga-bulan.
7. Tidak ternormalisasi
Data di dalam sebuah data
warehouse biasanya tidak ternormalisasi dan
sangat redundan. Dasar dari suatu data
warehouse adalah suatu data yang besar yang mengandung informasi
bisnis. Data-data yang ada di dalam data warehouse bisa
berasal dari banyak sumber, misalkan dari database operasional atau
transaksional dan sumber dari luar misalkan dari web, penyedia jasa informasi,
dari perusahaan lain, dan lain sebagainya. Data warehouse mengandung
beberapa elemen penting antara lain [Mallach, 2000,h.473]:
1. Sumber data yang digunakan oleh data
warehouse, database transaksional dan sumber data eksternal.
2. Proses ETL (Extraction,
Transformation, Loading) dari sumber data kedatabase data warehouse.
3. Membuat suatu ringkasan atau summary terhadap data
warehouse misalkan dengan menggunakan fungsi agregat.
4. Metadata.
Metadata mengacu data tentang data.
Metadata menguraikan struktur dan beberapa arti tentang data, dengan demikian
mendukung penggunaan efektif atau tidak efektif dari data.
5. Database data warehouse.
Database ini berisi data yang detail
dan ringkasan data dari data yang ada di dalam data warehouse.
Karena data warehouse tidak digunakan dalam proses transaksi
individu, maka databasenya tidak perlu
diorganisasikan untuk akses
transaksi dan untuk pengambilan data, melainkan dioptimisasikan untuk pola
akses yang berbeda di dalam analisis.
6. Query Tools yaitu dengan OLAP (Online
Analytical Processing ) dan data
mining. Tool untuk query ini
meliputi antarmuka pengguna akhir dalam mengajukan pertanyaan kepada database,
dimana proses ini disebut sebagai On-line Analytical Processing (OLAP).
Tool ini juga terdiri dari tool otomatis yang menemukan pola-pola di dalam
data, yang sering disebut sebagai data mining.Data warehouse harus
memiliki salah satu dari kedua tipe ini atau malah kedua-duanya.
7. User.Pengguna yang memanfaatkan data
warehouse tersebut.
Sumber :
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDkQFjAA&url=http%3A%2F%2Fresearch.amikom.ac.id%2Findex.php%2FJD%2Farticle%2Fdownload%2F484%2F106&ei=gTmTUYCpIdGzrAfFnoHwCA&usg=AFQjCNFtloo_TrvVhq426zLVjFyXothEpA&sig2=MvSVBr2RUVNXSg5unVIHHQ&bvm=bv.46471029,d.bmk
Tidak ada komentar:
Posting Komentar