سیستم هوش تجاریData Vault   (خزانه داده) یا همان مدل‌سازی Data Vault (DV) روش و رویکردی را برای مدل‌سازی انبار داده سازمانی شما (EDW) ارائه می‌کند که چابک، انعطاف‌پذیر و مقیاس‌پذیر است بر اساس تعریف مبدع دیتا والت، آقای Dan Linstedt: 

"دیتا والت، مجموعه‌ای از جداول به هم مرتبط و نرمال‌سازی‌شده مبتنی بر جزئیات، با قابلیت ردیابی تاریخچه داده است که از یک یا چند حوزه عملکردی کسب ‌وکار پشتیبانی می‌کند. این یک رویکرد ترکیبی است که بهترین حالت بین سومین شکل نرمال سازی(3NF) و مدل داده ستاره ای (Star Schema) را در بر می گیرد. طراحی انعطاف پذیر، مقیاس پذیر، سازگار با نیازهای شرکت است. این یک مدل داده است که به طور خاص برای پاسخگویی به نیازهای انبارهای داده سازمانی امروزی طراحی شده است.”


دیتا والت به طور خاص برای حل مشکلات چابکی، انعطاف‌پذیری و مقیاس‌پذیری موجود در دیگر رویکردهای مدل‌سازی انبار داده توسعه داده شده است. این یک مخزن گرانول، غیر فرار، قابل حسابرسی و تاریخی از داده های سازمانی ساخته شده است. 

فلسفه دیتا والت

فلسفه Data vault این است که همه داده ها، داده های مرتبط و صحیح هستند، حتی اگر با تعاریف ثابت و قوانین کسب و کار مطابقت نداشته باشند. اگر داده ها با این تعاریف و قوانین مطابقت نداشته باشند، مشکل برای کسب و کار است، نه انبار داده. تشخیص "اشتباه" بودن داده ها تفسیری از داده ها است که از دیدگاه خاصی ناشی می شود که ممکن است برای همه یا در هر مقطع زمانی معتبر نباشد. بنابراین مخزن داده باید همه داده ها را جمع آوری کند و تنها هنگام گزارش یا استخراج داده ها از انبار داده، داده ها تفسیر می شوند. در دیتا والت، پ داده های خام را همانطور که هست بدون اعمال فرایند تمیز سازی  ذخیره می کنند. تبدیل و تمیز سازی داده‌ها بر حسب نیاز انجام می‌شود دیتای تمیز شده در دیتا مارت مخصوص هر واحد سازمان نگهداری می شود.

مقایسه انبار داده (Data Warehouse) و دیتا والت (Data Vault)  

در مدل انبار داده سنتی، داده ها باید قبل از بارگذاری در انبار داده، آماده و پاکسازی شده باشند. این امر به معنای مراحل زیر(ETL) است:

  • استخراج: فرآیندی که داده های خام را از منابع محتلف بیرون می کشد.
  • تبدیل: داده‌های خام را تغییر می‌دهد و آن‌ها را طوری تغییر می‌دهد که در مطابق قوانین انبار داده باشد
  • بارگذاری: اکنون که داده های خام در قالب استاندارد شده است، در انبار داده بارگذاری می شوند.
  • استفاده: زمانی که شخص یا فرآیندی نیاز به دسترسی به داده ها داشته باشد، می تواند مستقیماً به انبار داده دسترسی داشته باشد.


این روش مزایای زیادی دارد. اول اینکه این روش تضمین می کند که همه چیز ذخیره شده در انبار داده تمیز، معتبر و در قالب قابل پیش بینی باشد. با این حال، این روشبرای هر سناریویی کار نمی کند. به عنوان مثال، یک سازمان ممکن است ده ها منبع داده مختلف داشته باشد که هر کدام دارای ساختارهای منحصر به فرد هستند. اگر سازمان بخواهد این منابع را یکپارچه کند، باید داده ها را ساده کند یا یک انبار داده فوق العاده پیچیده ای ایجاد کند.

دیتا والت با انتقال تبدیل داده ها به مرحله بعدی در فرآیند این مشکل را برطرف می کند. پس روند در دیتا والت، صورت زیر است:

  • استخراج: داده های خام را به طور معمول از منبع خارج می کند.
  • تبدیل: برخی از تبدیلات اساسی را انجام می دهد، مانند حذف مقادیر اشتباه.
  • بارگذاری: داده ها را در قسمت خاصی از انبار داده بارگذاری می کند که به عنوان دیتا والت خام شناخته می شود.

کاربرد قوانین: قوانین کسب و کار جدا از داده ها ذخیره می شوند. در صورت لزوم، انبار می تواند این قوانین را برای ایجاد یک نسخه جدید و تبدیل شده از داده ها اعمال کند. خروجی در قسمت دیگری از انبار قرار می گیرد که به عنوان دیتا والت کسب و کار شناخته می شود.

Data Marts: کاربران با دسترسی مربوطه به دیتا مارت ها دسترسی دارند. این دیتا مارت ها، مارت های مجازی هستند که با استفاده از View  بر داده های موجود در خزانه تجاری ایجاد می شوند.

بنابراین، در حالی که انبار داده تنها یک نسخه از داده ها را نگه می دارد، مدل دیتا والت (خزانه داده ) چندین نسخه را نگه می دارد. این رویکرد دارای مزایا و معایبی است.

مزایای روش Data Vault

همانطور که از مراحل بالا مشخص است، رویکرد دیتا والت (خزانه داده) انعطاف پذیری زیادی را به فرآیند یکپارچه سازی داده ها اضافه می کند. در اینجا برخی از مزایای دیگر وجود دارد:

  • حفظ داده های خام
  • تبدیل ها و پاکسازی های ساده تر
  • جداسازی قوانین حاکم بر کسب و کار و داده ها
  • تبدیل داده خاص هر دپارتمان

استراتژی دیتا والت برای شرکت های بزرگ با نیازهای داده های متنوع به خوبی کار می کند. با این حال، بدون اشکال نیست.

معایب Data Vault

دیتا والت همیشه رویکرد درستی برای ذخیره سازی داده نیست. موانع بالقوه ای وجود دارد که سازمانها باید در نظر بگیرند. برخی از این موراد در زیر ذکر شده است:

  • افزایش استفاده از منابع
  • افزایش داده های ذخیره شده
  • پیچیدگی پیاده سازی دیتا والت
  • کندتر شدن برای دیتا مارت ها