Časopis: Bankovnictví 2009/09
Autor: Vlastimil Bardoň
Klíčová slova: Datové migrace, centralizace dat, akvizice
O migracích slýcháme často v televizi, v rozhlase nebo čteme v novinách. Nejčastěji se hovoří o migraci lidí. Lidé migrují (stěhují se) z různých důvodů, někdy utíkají ze strachu, jindy hledají lepší budoucnost. Migrují také zvířata, hmyz, ryby i rostliny se šíří na nová stanoviště. A proč migrují data? Odpověď nabízejí následující řádky.
V tomto příspěvku bychom se rádi zmínili o migraci datové. Data jsou neživá, za stěhováním je nepudí strach ani víra v lepší budoucnost. Pohyb pro ně není přirozenou součástí života. Proč se tedy data stěhují? Na příkladu velké banky, která působí v České republice, si můžeme ukázat několik různých příčin datových migrací a nástrah, která na putující data číhají.
PROČ MIGROVAT DATA?
Prvním z důvodů stěhování dat je náhrada některého systému novou verzí. Život přináší tolik nových změn, že některý se systémů banky již nedokáže uspokojit potřeby bez rozsáhlé změny uspořádání dat, s nimiž pracuje.
Občas nezůstane u náhrady systému novou verzí, někdy se z různých důvodů rozhodne o jeho náhradě zcela novým systémem. Způsob uložení dat v obou systémech může být výrazně odlišný a stěhování dat pak nabývá nových dimenzí. Může dojít i k významné změně vnitřní logiky uložení dat a může nastat situace, kdy ani není možné jednoznačně odvodit nový stav ze stavu původního a migrace dat musí pracovat s jistou mírou nepřesnosti.
Zajímavým případem je náhrada starého systému, který sloužil k obsluze jednoho typu produktu, novým systémem, v rámci kterého se již obsluhuje více typů produktů. Jeden klient může mít oba typy produktů, pak nejde jen o stěhování dat, ale musí se také dohledat klient ve druhém systému a upravit rozdílné údaje téhož klienta v obou systémech.
Specifickým důvodem datové migrace je potřeba centralizovat data o všech osobách, které musí banka ze zákona identifikovat. Má-li mít banka úplný přehled o všech osobách, které musí prokazovat svou totožnost, a o úplnosti informací, vedených o těchto osobách podle zákona číslo 253/2008 Sb. o některých opatřeních proti legalizaci výnosů z trestné činnosti a financování terorismu, potřebuje centralizovat data o všech osobách do jediné databáze. V opačném případě by nevěděla, že již identifikovala daného klienta jako statutárního zástupce a nemusí jej znovu identifikovat jako majitele produktu, či disponenta.
Posledním důvodem k migraci dat je akvizice. Zakoupí-li banka některého ze svých konkurentů, je v jejím zájmu co nejdříve převést všechny klienty a produkty ze systémů koupené společnosti do systému svých systémů.
DATOVÁ MIGRACE A JEJÍ ÚSKALÍ
Datová migrace pro potřeby nové verze systému může být velmi rozsáhlá, zpravidla ale návrh nové verze od počátku počítá s nutností migrace dat a nové datové struktury bývají navrženy tak, aby transformace dat z původního tvaru do nového nepřinesla závažné problémy. Největší nástrahou pak může být nutnost zachovat funkčnost všech navazujících systémů. Jednou z cest, jak se s tím vyrovnat, je vybudovat nad novou datovou strukturou nástavbu, která simuluje chování datové struktury původní. Přináší to řadu problémů, nicméně praxe ukázala, že při dobře promyšlené architektuře je tato cesta s jistými obtížemi schůdná a dává bance čas postupně přizpůsobit novému stavu všechny spolupracující systémy.
Dalším úskalím, které musí datové migrace překonat, je organizační postup nasazování nového systému. Po akceptačních testech nastává zpravidla pilotní provoz. To znamená, že vybrané pobočky již pracují s produkty (klienty) v novém systému, zatímco ostatní stále pracují se systémem starým. Velkou výhodou pilotního provozu je fakt, že se včas ověří všechny systémové i organizační souvislosti nasazení nového systému. To je pro banku se stovkami poboček velmi důležité, nečekané problémy by mohly mít velmi závažné důsledky.
Pilotní provoz ale přináší i komplikace při datové migraci. Která data migrovat pro pilotní provoz? Jen data patřící vybraným pobočkám, které se pilotního provozu účastní? Ale klient může dorazit na libovolnou pobočku, co pak? Co když na jednu z vybraných poboček přijde klient, který si produkt koupil jinde? Jak bude obsloužen, když dosud nebyl migrován do nového systému?
V praxi se ukazuje, že nejlepším postupem je migrovat již pro pilotní provoz všechna data z původního systému do nového. Protože však od zahájení pilotního provozu dochází ke změnám dat jak v systému starém, tak i v systému novém, musí být připraven v rámci datové migrace způsob, jak tyto rozdíly srovnat.
KONKRÉTNÍ PŘÍKLADY
Dochází-li v bankovních systémech ke slučování různých dat o stejných subjektech, typicky o klientech, musí migrace řešit zcela nové otázky. Jak spolehlivě poznat, že se jedná o totožného klienta? Jaké dopady má nerozpoznání totožnosti klienta? Jaké dopady má falešná identifikace (případ, kdy se zdá, že se jedná o totožného klienta, ale ve skutečnosti tomu tak není)? Dlouhodobé zkušenosti ukázaly, že původní optimistický předpoklad, že jednoznačným kritériem pro identifikaci klienta je rodné číslo (RČ) nebo identifikační číslo (IČ), nebyl realistický. I malé procento chybovosti v identifikačních údajích může mít závažné dopady.
Dovolte dva příklady za všechny. Narazili jsme na případ dvou klientů, kteří měli totožné rodné číslo a totožné příjmení, lišili se jen tím, že jeden z nich se jmenoval Josef a druhý Jozef. Všichni jsme věřili, že se jedná o jednoduchý překlep, dokud se klient neozval, že je něco v nepořádku. Ukázalo se, že se skutečně jedná o dvě různé osoby, jeden z nich byl Slovák a druhý Čech.
Nicméně překlepy ve jménech, příjmeních ba i v rodných číslech a IČ existují a pokud se je nepodaří odhalit, pracovníci na pobočkách marně hledají u klienta produkt, který potřebují obsloužit, protože klient je v databázi vícekrát a různé produkty má u svých různých instancí. Najít optimální rovnováhu tak, abychom nesloučili různé subjekty ale současně aby procento správného sloučení bylo co nejvyšší, je velkou výzvou a náročnou úlohou.
I v případě, kdy se podaří správně spárovat totožné osoby, není vyhráno. V různých systémech mohou mít různé údaje. Nejčastěji jde o adresy, neboť nejen data, ale i lidé se stěhují. U žen dochází často také ke změnám příjmení. Která adresa (příjmení) je správná? Ukázalo se, že dokonce ani datum poslední aktualizace nemusí být vždy spolehlivým znakem pro rozhodnutí o novějším a tedy správnějším údaji. Spletemeli se u 0,1 % procenta údajů, představuje to při datové základně 5,5 milionu klientů, pět a půl tisíce nesprávných údajů!
Datové migrace v ČSOB
V ČSOB proběhla v posledních třech letech řada datových migrací. Jaké byly jejich cíle a s jakými úskalími se musely potýkat?
Všechny datové migrace byly součástí rozsáhlejších projektů, které sledovaly různé konkrétní cíle. Migrace dat, tj. stěhování dat z jednoho místa na jiné, nemá samo o sobě žádný přínos, je však často nezbytnou součástí jiných projektů, které nemohou být bez kvalitně provedené migrace dat úspěšně dokončeny. V pozadí většiny projektů stálo vedle jiných cílů také postupné budování úplné databáze osob, které mají přímý (smluvní), či nepřímý vztah s bankou (disponenti, držitelé platebních karet).
Centrální klientská databáze byla v rámci několika projektů postupně doplňována o nové datové struktury, které umožňují rozšířit práci s klientem o potřeby dalších oblastí, například oslovení klientů novými nabídkami nebo správy dispozičních oprávnění. Centrální klientská databáze komunikuje s dalšími produktově orientovanými systémy tak, aby umožnila vytvoření jednotného uživatelského rozhraní využívaného pracovníky poboček i centrálních útvarů (tzv. back office) k většině práce nezbytné pro běžnou obsluhu klienta.
Bezprostřední cíle jednotlivých projektů zahrnovaly nasazování nových verzí systémů se současnou podstatnou změnou organizace uložených dat (například nová verze právy elektronického bankovnictví a nová verze systému na správu základních klientských údajů z přelomu let 2006 a 2007), náhradu některých systémů novými (například správa dispozičních oprávnění nebo náhrada systému pro oslovení klientů marketingovými nabídkami), připojování produktově orientovaných systémů k centrální klientské databázi (například systému pro správu bankovních účtů a úvěrů, systému pro správu platebních karet) i migraci klientů a produktů Istrobanky, která je od července 2009 právně součástí ČSOB, do vlastních systémů ČSOB.
- Největší úskalí a hlavní cíle
Každá z datových migrací musela řešit své specifické úkoly. Nejobtížnější úkoly vyplývaly vždy ze zvláštního charakteru migrovaných dat. Většina projektů měla několik společných znaků. Musela být vyřešena migrace dat s minimálním dopadem na běh všech systémů. Rovněž bylo třeba vyrovnat se s postupným nasazováním nových řešení do produkčního prostředí nejdříve v pilotním provozu, kdy některé pobočky banky již pracují s novým systémem, zatímco jiné stále pracují postaru. Migrace musí řešit rozdíly, které pilotním provozem vznikají.
Významným úkolem bylo vyrovnat se s různou kvalitou dat, zejména u systémů, které byly využívány dlouhou dobu a ze starších dob obsahovaly často neúplná a z dnešního pohledu nesprávná data. Bylo potřeba vyrovnat se co nejlépe s chybějícími hodnotami, které mohly být někdy nahrazeny výchozí (tzv. defaultní) hodnotou, někdy odvozeny z jiných dat a jindy musely zůstat prázdné. Nejzajímavějším úkolem pak nejčastěji bylo spárování klientů zdrojových systémů s centrální databází. Dohledávání totožných klientů probíhalo pomocí celé řady kritérií, vyladěných podle charakteru vstupních dat.
Cílem bylo najít co nejvíce totožných klientů, aniž by hrozilo nebezpečí, že budou omylem ztotožněni klienti, kteří ve skutečnosti nejsou totožní. Párovací kritéria se musela vypořádat s faktem, že i nejdůležitější identifikační údaje, jako jsou rodné číslo (RČ), identifikační číslo organizace (IČO), jméno či příjmení osoby a název firmy, obsahují překlepy. Občas se dokonce objevily případy záměrně nesprávných údajů, kdy bylo například dítě uvedeno s RČ rodiče, nebo disponující žena s RČ svého manžela, majitele účtu.
Dodatečnou komplikací byl i fakt, že ČSOB je bankou česko-slovenskou a v centrální databázi spravuje klienty obou národních větví. Bylo nutné pečlivě vážit, že různé osoby mohou mít stejná RČ nebo IČ přidělená jedné osobě v Čechách a druhé na Slovensku. Přitom ani údaj o státním občanství nebyl vždy stoprocentně spolehlivý.
Centrální klientská databáze ČSOB má dnes řádově 5,5 milionu klientů. Z toho nejméně dvě třetiny byly do této databáze migrovány z jiných systémů. Jednotlivé migrace zpracovávaly různé objemy dat, v případě párování klientů je ale nutné si uvědomit, že i migrace malého počtu klientů znamená, že každý z nich musí být pro potřeby párování vyhledán v celé centrální databázi čítající výše zmíněných 5,5 milionu záznamů.
Z dlouhodobého hlediska představuje centrální klientská databáze velký marketingový potenciál. V kratším horizontu je centrální databáze nezbytná pro ověřitelné splnění všech podmínek zákona číslo 253/2008 Sb. o některých opatřeních proti legalizaci výnosů z trestné činnosti a financování terorismu.
Připojování jednotlivých, produktově orientovaných systémů k centrální klientské databázi umožnilo bance postupně budovat jednotné uživatelské rozhraní pro obsluhu klientů, jehož cílem je zkvalitnit a zjednodušit obsluhu klientů na pobočkách a v neposlední řadě z dlouhodobého hlediska povede ke snížení celkových nákladů na údržbu informačních systémů.