пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

28. Види і моделі сховищ даних

Види сховищ даних

В залежностй від повноти подання даних виділяють такі види сховищ даних.

Корпоративні сховища даних (enterprise data warehouses) - вміщують інтегровану інформацію, зібрану із певної множини оперативних баз даних, яка характеризує всю корпорацію і необхідна для здійснення консолідованого аналізу діяльності корпорації в цілому. Такі сховища містять дані по всіх напрямках діяльності корпорації і використовуються для підтримки прийняття як тактичних, так і стратегічних рішень. Обсяг корпоративного сховища може коливатися від 50 Гбайт до кількох терабайт, а його створення потребує значних витрат праці і часу (до кількох років).

Кіоски або вітрини даних (data marts) - це певна підмножина корпоративних даних, які характеризують конкретний аспект діяльності корпорації, наприклад, облік запасів чи маркетинг. У вітрини даних інформація може вибиратись або з корпоративного сховища (залежні вітрини), або безпосередньо із оперативних баз даних, проходячи попередні узгодження та перетворення (незалежні вітрини). Розробка кіоску даних є набагато менш трудомісткою, ніж сховища, і триває приблизно 3 - 4 місяці.

Побудова корпоративних сховищ і кіосків даних здійснюється за однаковими принципами і з використанням однакових технологій.

Відоме також поняття глобального сховища даних, яке розглядається як єдине джерело інтегрованих даних для всіх вітрин даних.

Моделі сховищ даних

Сховища даних слугують місцем збереження та джерелом інформації для засобів оперативного аналітичного оброблення даних OLAP і можуть мати різну модель побудови - багатовимірну (Multidimensional OLAP - MOLAP), реляційну - (Relational OLAP - ROLAP) або гібридну - (Hybrid OLAP - HOLAP).

Багатовимірна модель

Багатовимірна модель сховища даних MOLAP (Multidimensional OLAP) передбачає збереження і детальних даних, і їх агрегатів у багатовимірній базі даних. В основі такої моделі лежить поняття багатовимірного куба (гіперкуба) даних, у комірках якого зберігаються показники (наприклад, обсяги продажів), а вимірами є ознаки аналізованого процесу (наприклад, види товарів, регіони, періоди продажів). Розглянемо докладніше елементи багатовимірної моделі.

Показник, або міра (Measure) - це поле, значення якого однозначно визначається фіксованим набором значень вимірів, що характеризують певний факт.

Показники складають головну частину вмісту сховища даних і можуть бути подані у вигляді:

  • числових значень фактів чи подій бізнес-процесу, що відбувався на об’єкті управління, для якого створене сховище (наприклад, обсяг і дохід від продажів);
  • формул, що описують розрахунок над іншими показниками сховища. Деякі OLAP-продукти дозволяють користувачам створювати власні формули для розрахунку показників.

  Вимір (Dimension) - це множина однотипних даних, що утворюють одну з осей куба і характеризують якусь ознаку бізнес-процесу, інформація по якому зберігається у сховищі.

Наприклад, для процесу продажів одним із вимірів може бути регіон продажів. Окремі значення виміру називаються членами виміру, або мітками (members), і можуть утворювати ієрархії. Наприклад, значення регіонів в ієрархії розташовуються так: на вищому рівні - «Україна», нижче - «Київська область», «Полтавська область» і т. ін.; нижче - Київ, Васильків, Баришівка і т.ін.

Відношення (Relation) - це зв’язки між різними вимірами моделі та між окремими значеннями всередині певного виміру. Ці елементи моделі використовуються для вираження різних типів відношень (приналежності, ієрархії, типізації та ін.) між елементами кубу і використовуються під час аналізу даних для їх відбору або визначення порядку агрегування показників.

Багатовимірна модель забезпечує можливості використання різноманітих аналітичних операцій на даними у кубі:

  • операція перетину (slice-and-dice) здійснює вибірку підмножини куба, у якій значення одного чи декількох виміорів фіксовані. Наприклад, можна отримати зріз значень продажів всіх товарів за всі періоди часу для певного регіону;
  • операції розгортання та згортання (drill-down та roll-up) використовують ієрархію значень виміру для переходу униз по ієрархії на детальніші рівні або угору для отримання узагальненого подання;
  • операція обертання (rotation) куба надає можливість побачити інше подання даних, згруповане за іншими вімірами. Наприклад, можна поміняти місцями рідки і стовпці таблиці;
  • операція об’єднання (drill-across) виконує комбінацію кубів, що мають один або декілька спільних вимірів.

Багатовимірна модель сховища даних завдяки особливостям своєї організації (надмірності даних, підтримці великої кількості зв’язків між даними)  забезпечує високу продуктивність роботи при аналізі даних. Проте існують недоліки, які перешкоджають її широкому застосуванню. Подання даних у вигляді багатовимірного кубу, коли резервується місце для всіх можливих значень, призводить до суттєвих зайвих витрат пам’яті у разі відсутності деяких значень.

Інструментальними засобами створення багатовимірних сховищ даних є продукти корпорації Oracle, Power Play (корпорації Cognos Corp.), Data Direct (корпорації INTERSOLV).

Реляційна модель

Реляційна модель сховища даних ROLAP (Relational OLAP) передбачає зберігання і детальних, і агрегованих (підсумкових) даних у реляційній базі даних, але агреговані дані розміщуються у спеціально створених службових таблицях.

ROLAP-модель підтримують MetaCube (корпорація Informix), Business-Objects (корпорація BusinessObjects) та ін.

Гібридна модель

Гібридна модель сховища даних HOLAP (Hybrid OLAP) - це спеціалізований механізм, який дає змогу зберігати дані у власних форматах - масивах, що відповідають зручному для ко­ристувачів представленню даних. Основною ознакою цієї моделі є те, що детальні дані залишаються на своєму звичайному місці - у ре­ляційній базі даних, а агреговані (підсумкові) дані зберігають­ся в багатовимірній базі даних.

Висока швидкість оброблення запитів у багатовимірній базі даних забезпечується завдяки попередньму обчисленню агрегованих показників. Швидкість оброблення запитів значно підвищується за рахунок того, що можливо отримати відповідь на запитання на підставі резуль­татів попередніх обчислень, а не виконуючи їх «на льоту». HOLAP-архітектура зазвичай ви­користовується при побудові багаторівневих сховищ даних, що створюються на різних рівнях корпоративних ІС, і особливо ефективна в разі об­роблення надто великих обсягів даних.

Інструментальним засобом, що підтримує HOLAP-модель, є SAS System (компанія SAS Institute).


хиты: 389
рейтинг:0
Точные науки
информатика
Информационные науки
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь