Webová aplikace GTL MetaData Center (MDC) podporuje vývoj a správu korporátních datových skladů (DW). K hlavním úkolům patří ukládání a správa validních metadat datových struktur – tabulek a extraktů – vytváření výstupů SQL, ELT procedur, XML souborů ETL aplikací nebo validačních logů. Struktury mohou být umístěny do různých oblastí.
Hlavní oblasti
- Definice extraktů resp. view.
- Definice mapování dat.
- Definice tabulek.
- Generování výstupů.
- Validace a generování skriptů.
- Podpora řízení změn.
Integrace active directory
MDC je navržen jako webová aplikace (tenký klient), což umožňuje spolupráci více uživatelů nebo týmů. Integruje se s Active Directory (AD) a jeho oprávnění jsou namapovány do skupin AD uživatelů. Přístup do oblastí vč. editace, generování výstupů a správy může být omezeno nastavením práv. Základní MDC role jsou: správce aplikace, BI architekt, data modeler, BI analytik a ETL developer.
Extrakt/view definice
Zdrojové systémy plněnící datový sklad jsou definovány buď rozhraním nebo datovými exktrakty. MDC může importovat definice z aplikací Excel a Sybase PowerDesigner nebo z SQL souborů prostřednictvím formulářů či webových služeb API. Definice lze exportovat do Excelu nebo pomocí uživatelsky definovaných skriptů (viz dále).
Další operace zahrnují tvorbu definic (včetně definic polí a technických informací), správu verzí, validaci, vyhledávání, porovnávání, označení změnového řízení a generování výstupu (např. XML kód pro Informatica PowerCenterem, kód SQL – DDL i DML, check plans, parametrické soubory).Stejně tak lze definovat a spravovat indexy.
Definice mapování dat
MDC podporuje definice mapování dat pro tabulky nebo extrakty používané v v DW. Tato mapování obsahují jednoduchá i komplexní transformační pravidla. MDC umožňuje definice importovat z SQL nebo Excelu, nebo je přímo vytvářet. Stejně jako u extraktů, definice mapování zahrnují správu verzí, validaci, porovnávání,označení změnové řízení a generování výstupů. Formulář mapování lze použít rovněž pro definice komplexních view.
Definice tabulek
Definice tabulek v Power Designeru lze importovat přímo nebo voláním webové služby (VBScript). Tyto definice jsou importovány do několika oblastí jen pro čtení, ale mohou se použít jako cílové objekty v mapování dat. Správa verzí, porovnání a generování výstupů jsou opět k dispozici.
Skripty
Validace a generování skriptů se provádí prostřednictvím formuláře pro správu skriptů, který používá vlastní jednoduchý jazyk, podobající se VB skriptu. Kontrola a zvýraznění syntaxe je k dispozici pro textový editor PSPad. To uživateli umožňuje vytvořit skript v textovém editor PSPad a poté jej nahrát..
Validace skriptů
MDC obsahuje skriptovací “engine”, který se používá pro validaci extraktů,tabulek a mapování. Skripty lze plně přizpůsobit. Mimo jiné je možné ověřit logické vztahy mezi entitami nebo, ve složitějších případech, kontrolovat definované vlastnosti proti vzdáleným databázím. Z důvodu optimalizace výkonu jsou skripty zkompilovány. Správu zajišťuje správce aplikace a MDC je aplikuje automaticky..
Generování skriptů
MDC skriptovací “engine” se používá rovněž pro generování výstupů, což je jedna z hlavních výhod aplikace.
Stejně jako u validace lze generování skriptů plně přizpůsobit, předkompilovat a přístup k nim regulovat. Hlavními výstupy jsou:
- Definiční SQL skripty (tabulky, statistiky, indexy, view, atd.).
- SQL historizace.
- SQL dotazy.
- Definice zdrojů/cílů pro Informatica PowerCenter.
- Parametrické soubory a “check plans”pro Informatica PowerCenter.
- Mapování a workflows pro Informatica PowerCenter.
Správa verzí, uzamykání
Všechny hlavní objekty jsou součástí MDC správy verzí.Aplikace umožňuje definovat buď konečné nebo pracovní verze. Každá verze sebou nese auditní informace: autora verze, časovou značku, číslo verze, označení změnového řízení a archivní časovou značku. Upravovaná verze je uzamčena pro ostatní uživatele, kteří ji mají k dispozici pouze pro čtení nebo generování výstupů.
ETL soubory
MDC podporuje definici odvozených ETL souborů. Soubory jsou založeny na definicích extraktů, tabulek nebo jejich kombinací. Obvykle jsou používány pro obohacení extraktů o cílové primární klíče.
Release management
Prostřednictvím dynamicky definovaných formulářů MDC podporuje procesní řízení. Poskytují podporu pro SLA, rozšíření systému nebo řízení změn. Funkčnost zahrnuje správu verzí, porovávání, seznam odpovědných osob, dynamické formuláře, pohledy, generování výstupů atd.
Všechny významné objekty mohou nést označení změnového řízením a podporovat tak “release management”. Mapování lze “zamknout”do vývojového stavu, a efektivně je tak sdílet mezi analytiky a vývojáři.
API
MDC API pokrývá dvě hlavní oblasti: import definic tabulek a generování skriptů.