Perbezaan antara skema bintang dan salji

Perbezaan antara skema bintang dan salji

Pergudangan Data adalah sistem yang direka untuk menyimpan dan menganjurkan data di repositori pusat termasuk data dari sumber lain. Ini adalah konsep utama kecerdasan perniagaan dalam model pangkalan data relasi yang menggunakan teknik analisis untuk mengintegrasikan data perniagaan ke pangkalan data pusat.

Terdapat dua model seni bina biasa yang digunakan dalam pergudangan data:

  • Skim bintang
  • Skema Snowflake

Kedua -duanya adalah model pangkalan data multidimensi biasa yang digunakan untuk menangani keperluan pangkalan data yang besar untuk tujuan analisis di gudang data sebenar.

Kami membentangkan perbandingan yang tidak berat sebelah antara keduanya untuk lebih memahami yang lebih baik daripada yang lain.

Apa itu Skema Bintang?

Ini adalah model seni bina yang paling biasa dan diterima secara meluas yang digunakan untuk membangunkan gudang data dan data mart di mana data dianjurkan menjadi fakta dan dimensi. Ini adalah model seni bina yang paling mudah di mana satu jadual fakta digunakan untuk merujuk kepada jadual dimensi berganda, meniru corak bintang.

Seperti namanya, gambarajah menyerupai bintang dengan jadual fakta di tengah dan jadual dimensi berganda yang memancar daripadanya, mencipta bintang seperti corak.

Ia juga dikenali sebagai Skema Sertai Bintang dan ia menyimpan semua atribut dimensi ke dalam satu jadual fakta denormalized untuk dengan cepat menavigasi melalui set data multidimensi yang besar yang menyumbang masa tindak balas pertanyaan cepat.

Apa itu Skema Snowflake?

Ia adalah lanjutan skema bintang dengan fungsi tambahan. Tidak seperti skema Star, jadual dimensi dalam skema Snowflake dinormalisasi ke dalam pelbagai jadual yang berkaitan.

Model seni bina mewakili susunan logik jadual dalam hierarki hubungan banyak-ke-satu di mana jadual dimensi berganda dinormalisasi ke dalam jadual sub-dimensi, menyerupai corak seperti salji, maka namanya.

Ini adalah versi skema bintang yang lebih kompleks dengan lebih banyak gabungan antara jadual dimensi yang menyumbang masa pemprosesan perlahan untuk mengambil data yang bermaksud masa tindak balas pertanyaan perlahan. Ia meminimumkan kelebihan data yang seterusnya meningkatkan prestasi pertanyaan.

Perbezaan antara skema bintang dan salji

Senibina Skema Star dan Snowflake

Dalam pangkalan data hubungan, Skema Star adalah model seni bina yang paling mudah digunakan untuk membangunkan gudang data dan data multidimensial. Seperti namanya, model itu menyerupai bintang dengan mata yang memancar dari pusat yang bermaksud jadual fakta adalah pusat dan titik adalah jadual dimensi. Seperti model dimensi lain, ia terdiri daripada data dalam bentuk fakta dan dimensi. Skema Snowflake, sebaliknya, adalah model seni bina yang lebih kompleks yang merujuk kepada pangkalan data multidimensi dengan susunan logik jadual dalam bentuk kepingan salji.

Jadual dimensi

Skema Snowflake agak serupa dengan skema bintang kecuali ia boleh mempunyai lebih daripada satu jadual dimensi yang dinormalisasi ke dalam pelbagai jadual berkaitan yang disebut sebagai jadual sub-dimensi. Ia mewakili pelbagai tahap hubungan yang cabang menjadi corak salji salji. Walau bagaimanapun, skema bintang menyimpan semua atribut yang berkaitan dengan dimensi ke dalam satu jadual dimensi denormalized yang memudahkan untuk memahami dan mengendalikan pertanyaan yang lebih mudah.

Model Perniagaan Skema Star dan Snowflake

Jadual dimensi tidak boleh mengandungi baris pendua dalam model pangkalan data relasi untuk fakta mudah bahawa ia boleh mewujudkan kekaburan dalam pengambilan. Setiap jadual harus mempunyai lajur atau gabungan lajur yang dipanggil kunci utama yang secara unik mengenal pasti semua rekod jadual. Kunci asing adalah lajur atau sekumpulan lajur yang menyediakan hubungan antara dua jadual. Dalam skema bintang, setiap jadual dimensi mempunyai kunci utama yang berkaitan dengan kunci asing dalam jadual fakta. Hierarki Perniagaan dalam Skema Snowflake diwakili oleh Kunci Utama/Hubungan Kunci Asing antara Jadual Dimensi.

Integriti Data dalam Skema Star dan Snowflake

Perbezaan utama antara dua model pangkalan data relasi adalah normalisasi. Jadual dimensi dalam skema bintang tidak dinormalisasi bermaksud model perniagaan akan menggunakan lebih banyak ruang untuk menyimpan jadual dimensi dan lebih banyak ruang bermakna lebih banyak rekod yang berlebihan yang akhirnya akan menyebabkan ketidakkonsistenan. Skema Snowflake, sebaliknya, meminimumkan redundansi data kerana jadual dimensi dinormalisasi yang menyumbang rekod yang jauh lebih rendah. Hierarki perniagaan dan dimensinya dipelihara melalui hubungan integriti rujukan yang dapat dikemas kini secara bebas di gudang data.

Prestasi pertanyaan

Skema bintang lebih sedikit bergabung antara jadual dimensi dan jadual fakta berbanding dengan skema salji yang mempunyai banyak gabungan yang menyumbang kepada kerumitan pertanyaan yang kurang. Kerana dimensi dalam skema bintang dikaitkan melalui jadual fakta utama, ia mempunyai jalur gabungan yang jelas yang bermaksud masa tindak balas pertanyaan cepat dan masa tindak balas yang cepat bermaksud prestasi yang lebih baik. Skema Snowflake mempunyai jumlah masa tindak balas pertanyaan yang lebih tinggi yang menghasilkan pertanyaan yang lebih kompleks yang akhirnya menjejaskan prestasi.

Skema bintang vs. Skema Snowflake: Carta Perbandingan


Ringkasan Bintang Ayat Skema Snowflake

Kedua -duanya adalah model seni bina yang paling biasa dan banyak digunakan untuk membangunkan gudang pangkalan data dan data marts. Walau bagaimanapun, setiap model perniagaan mempunyai bahagian yang saksama dari kebaikan dan keburukan. Walaupun Skema Star adalah model multidimensi yang paling mudah digunakan untuk menyusun data ke dalam fakta dan dimensi, adalah sesuai untuk membangunkan data yang melibatkan hubungan yang kurang kompleks. Skema Snowflake adalah perwakilan logik jadual dalam pangkalan data multidimensi di mana dimensi disimpan dalam jadual sub-dimensi. Perbezaan utama antara keduanya adalah normalisasi. Jadual dimensi dalam skema Snowflake benar.