Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan. Sedangkan data mining muncul setelah banyak dari pemilik data baik perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan terhadap tumpukan data tersebut.
Data warehouse didesain untuk kita bisa melakukan query secara cepat. Informasi diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat trend (kecenderungan).
Kelebihan
- Data terorganisir dengan baik untuk query analisis dan sebagai bahan yang baik untuk proses transaksi.
- Perbedaan struktur data yang banyak macamnya dari sumber yang berbeda dapat di atasi.
- Memiliki aturan transformasi untuk memvalidasi dan menkonsolidasi data dari OLTP ke datawarehouse.
- Masalah keamanan dan kinerja dapat dipecahkan tanpa perlu mengubah sistem produksi.
- Memiliki model data yang banyak macamnya, dan tidak tergantung dari format data awal/sumbernya, sehingga memudahkan dalam menciptakan laporan.
- Proses transformasi/ perpindahan dapat di monitoring. jika terjadi kesalahan dapat di arahkan / di luruskan.
- Informasi yang disimpan dalam datawarehouse, jadi ketika OLTP data sumber nya hilang. informasi yang diolah tetap terjaga dalam suatu datawarehouse.
- Data warehouse tidak memperlambat kerja operasional transaksi.
- Dapat menyediakan laporan yang bermacam-macam
Kekurangan
- Data warehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
- Data perlu di ekstrak, diubah (ETL) dan di load ke datawarehouse sehingga membutuhkan tenggang waktu untuk memindahkannya.
- Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah datawarehouse.
- Data warehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di data warehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.
Tidak ada komentar:
Posting Komentar