Big data

Dodejte vašim datům širší perspektivu díky big data řešením. Připravujte informace byznysovým týmům na míru. A začněte díky nim generovat větší zisk.

Mám zájem

Propojte datová sila

Navrhněte architekturu datových řešení

Sdílejte velké množství dat napříč firmou

Mějte po ruce data pro inovativní a moderní řešení

Stavíme hybridní, cloudové/multi-cloudové i on-premise platformy

Datové a analytické platformy big data jsou základem pro váš další růst.

Zpracovávejte nejen strukturovaná, ale i nestrukturovaná a semi-strukturovaná data. Ať už mají podobu logů, transakcí, signálních dat, senzorických dat, textů, obrázků, hlasů či videí. Na big data platformách je všechna můžete zpracovávat v jakémkoli množství a přiblížit koncovým uživatelům ve formě datamartů, feature storů a vizualizačních vrstev. Díky tomu je začnete efektivně byznysově využívat.

Zprostředkujte uživatelům data dávkově i v reálném čase, na jednom místě, aby mohli realizovat projekty pokročilé analytiky a AI na co nejvyšší úrovni. Když už dnes očekáváte růst, umožněte jim datová a analytická řešení škálovat. A vyřešte i to, kam data archivovat.

ikona_red_outline2-12

On-premise

ikona_red_outline2-58

Cloud

Hybrid_ikona_colour-4

Hybrid

Zjistěte, která z technologií, se kterými nejčastěji pracujeme, je pro vás nejlepší

10+

on-premise platforem big data postavených v ČR

120+

aplikačních a analytických projektů nad big daty

Důvěřují nám ti nejlepší

Vodafone_logo_colour

Těžte z předností datových a analytických platforem

ikona_red_outline1-27

Pořizujte a ukládejte data z různých interních nebo externích zdrojů

ikona_red_outline1-72

Pracujte s rychle generovanými daty

ikona_red_outline2-63

Udržujte dlouhodobou historii používaných dat

ikona_red_outline2-39

Sjednoťte datová úložiště do jednoho světa

ikona_red_outline2-12

Snižte zátěž na datové sklady

ikona_red_outline1-62

Zrychlete prototypování a nasazení nových obchodních řešení

5 zásad jak využít AI v oblasti dat: Aplikujte umělou inteligenci při práci s daty a šetřete čas i peníze

Seznamte se s aktuálními trendy z konference Big Data London

Výsledky generativní umělé inteligence závisí na kvalitě vašich dat

Zapojte umělou inteligenci do každodenních úkolů, zejména do repetitivních nebo nízkonákladových aktivit.

Generativní AI nemůže správně fungovat bez kvalitních dat. Zaměřte se na to.

Používejte GenAI v oblastech, ve kterých jste si jistí, např. se vyhněte generování kódu, pokud v tom nejste expert.

Přejděte na hybridní cloudová prostředí

Získejte flexibilitu při využívání cloudových služeb.

Najděte podporu pro používání otevřených formátů dat, včetně Iceberg a Deltalake.

Spravujte jednoduše více prostředí z jednoho místa.

Objevte lakehouse

Vytvořte odolnou moderní datovou architekturu a oddělte se tak od datových sil.

Zvyšte efektivitu a snižujte náklady pomocí oddělení storage a compute vrstvy.

Demokratizujte data

Zahrňte metadata a data governance mezi klíčové prvky při vytváření programu pro demokratizaci dat.

Rozhodujte se na základě dat ve všech úrovních organizace.

Vytvářejte nové pozice pro demokratizaci dat, jako jsou Data Access Governance manažeři.

Odpovědně a v souladu s legislativu

ESG: Měřte celospolečenské dopady vašeho podnikání a vyčíslete odpovědné chování firem.

FinOps: Zaměřte se na finanční odpovědnost za infrastrukturu cloud computingu.

Upřednostňujte etický přístup k datům před jejich množstvím.

Kompletní služby: od návrhu až po zabezpečení

Zajistěte vašim byznys uživatelům spolehlivou datovou platformu pro big data. Nechte si navrhnout a vybudovat řešení pro strukturovaná i nestrukturovaná data, dávková i toková.

Návrh firemní datové infrastruktury IT

  • na míru ušitá architektura na základě současných a plánovaných technologií
  • podpora privátních cloudů a dockerizace

Hodnocení výkonnosti a návrhy vylepšení stávajícího prostředí

  • s ohledem na typy uložených dat, jejich toky a intenzitu
  • efektivní design hardwaru pro specifické případy použití

Administrace platforem

  • efektivní správa clusterů a uživatelů
  • managment ETL jobů
  • zajištění konektivity
  • nasazování pipeline
  • monitorování
  • provádění aktualizací

Automatizace a CI/CD pipeliny

  • rychlejší životní cyklus vývoje
  • zachování konzistence kódu a bezpečnosti

Datové integrace

  • integrace různých datových zdrojů do jednoho místa
  • správa datových zdrojů

Aplikační vývoj pro škálovatelné zpracování dat

  • od získávání dat přes jejich transformaci a manipulaci, ukládání a sdílení na datové platformě
  • výkonné aplikace řízené metadaty

Tipy na zabezpečení platformy

  • s využitím robustních protokolů a bezpečnostních přístupů
  • garantované a negarantované zóny
  • anonymizační řešení
  • soulad s GDPR

Jak postupujeme u big data projektů

Evangelizace a workshopy

Vytvoření LABu

Využití LABu pro konkrétní úlohy

Návrh architektury na míru

Nová produkční platforma

Platforma pro každodenní použití

Navrhujeme a implementujeme specifická řešení

Přidejte svým datům hodnotu

Adoki: replikace dat

Přesun dat do datových skladů, na on-premise platformy, na cloud i multi-cloud. Díky našemu nástroji Adoki.

Detaily

Anonymizace dat

Anonymizujeme datové sady, využíváme k tomu vlastní anonymizační framework.

DETAILY

Data science

Realizujeme projekty využívající pokročilé analytiky a machine learningu.

Detaily

CoDET: externí zdroje dat

Vyvíjíme řešení pro byznysové uživatele – aplikaci na obohacování dat z externích zdrojů.

DETAILY

Categoo: kategorizace transakcí

Vyvíjíme specifickou aplikaci pro banky na štítkování/kategorizaci bankovních transakcí.

DETAILY

Všechny typy dat na jednom místě: Datové platformy budoucnosti spojí síly datových skladů, data lakes i real-time analytiky (Podcast)

Konzultanti Michal Stašek a Vít Šklebený z Big Data týmu Adastry navštívili v září 2023 v Londýně jednu z největších konferencí na světě zaměřenou na velká data. Poznatky, trendy a budoucí výhledy z konference Big Data London sdílí v rámci společného rozhovoru. Nechte se inspirovat!

  • Nastává konec velký dat? Kam se celý koncept posouvá?
  • Jaký je potenciál data lakehousu, o kterém se stále častěji hovoří?
  • Jak se mění potřeby zákazníků v otázce práce s big daty?
  • Multicloud a big data: Jak se ovlivňují?
  • Rostoucí tlak na data governance a kvalitu dat.
  • Vznik nových pracovních rolí. – Big data vs. AI vs. ESG.

Technologie, které používáme

Cloudera

Vybudujte s námi datovou a analytickou platformu pro Big Data na technologii Cloudera. Použijte technologii číslo 1 pro on-premise a hybridní Big Data platformy.

ikona_red_outline2-02

Vyberte si top technologii

Datová platforma Cloudera patří mezi nejlepší technologie, které velké společnosti v dnešních propojených světech on-premise a cloudu využívají.

ikona_red_outline2-13

Vyberte si flexibilitu

Datovou platformu Cloudera lze implementovat do jakéhokoli firemního prostředí a infrastruktury, kterou zákazník používá.

ikona_red_outline2-39

Vyberte si spolehlivost

Technologii Cloudera lze snadno a rychle integrovat, je navržená tak, aby vyhověla jakýmkoli zvyklostem a standardům velké organizace.

Cloudera

Adastra je stříbrným partnerem Cloudera

Vsaďte na jistotu, že datovou platformu na technologii Cloudera úspěšně vybudujete a budete i provozovat a rozvíjet.

20+

Cloudera certifikací/konzultantů certifikovaných na technologie Cloudera  

10+

datových platforem postavených na Cloudeře

8

let spolupracujeme s Clouderou

Zajímají vás technologie Cloudera?

Kontaktujte Tomáše Pláničku nebo Víta Šklebeného a prodiskutujte, zda je vhodná i pro váš IT ekosystém a jaké výhody by vám přinesla.

Seznamte se s projekty, na nichž jsme použili technologie Cloudera

V jedné z TOP 5 českých bank se od roku 2017 významně podílíme na návrhu a vývoji analytické datové platformy zpracovávající velké objemy dat. Platforma je on-premise. Součástí našich dodávek je trvalý rozvoj řešení a servisní podpora.

Od labu do produkce, od dávek k near-real-time a myslíme i na upgrady

Spolupráce započala již při návrhu, podíleli jsme se na výběru vhodného hardwaru, na kapacitním plánování, nastavení integrací na datové sklady, definici ETL úloh.

Začali jsme „laboratorním řešením“ Cloudera, ze kterého vznikla produkční platforma s dávkovým nahráváním dat. U produkčního provozu jsme od začátku zajišťovali administraci, vyhotovili jsme dokumentaci k obsluze a dodnes pokrýváme podporu L2.

Aktuálně zajišťujeme dlouhodobý provoz včetně upgradů na nejnovější verze Cloudera distribuce, obnovu HW a complience s novými standardy banky při adopci nových nástrojů nebo nároků na bezpečnost.

Desítky aplikací a stovky úloh pokročilé analytiky využívají data z BigData platformy

Platforma na sebe navazuje celou řadu aplikačních řešení, mj.:

  • automatická kategorizace transakcí
  • kontaktní historie
  • transakční historie
  • aplikace na zpracování nestrukturovaných formátů dat – obchodní rejstřík, finanční reporty, apod.

Nad platformou běží celá řada úloh pokročilé analytiky, např.:

  • analýza textu
  • segmentace zákazníků
  • odhad příjmu klienta
  • predikce zůstatku na běžném účtu
  • určení nezkreslené bonity klienta
  • nabídka kontokorentu
  • analýza lokací (geolokace) apod.

300

aktivních uživatelů, z toho téměř 100 analytiků a datových vědců  

700+

databází

100 tisíc

tabulek uložených v úložišti Hive

Databricks

Postavte s námi v cloudu Databricks Lakehouse, unifikovanou platformu spojující data warehouse a data lake.

ikona_red_outline2-04

Vyberte si cloud

Databricks funguje nad jakýmkoli cloudem, který používáte, ať už se jedná o Amazon Web Services (AWS), Microsoft Azure, Google Cloud nebo dokonce jejich kombinaci, tj. multicloudem.

ikona_red_outline2-26

Vyberte si jednoduchost

Databricks zjednodušuje správu clusterů a prostředí, ve kterém se postará o instalace, konfigurace a údržbu Sparku, dodatelčných balíčků a ML modulů

ikona_red_outline2-39

Vyberte si škálovatelnost

Databricks automaticky škáluje clustery v rámci vašich předem definovaných limitů, clustery vznikají pouze tehdy, když je potřebujete, a mizí, když je nepoužíváte.

Databricks-partner-Badge-1

Jsme partnerem Databricks

Vsaďte na jistotu, že lakehouse na technologii Databricks úspěšně vybudujete a budete dále provozovat a rozvíjet.

10+

Databricks certifikací/konzultantů certifikovaných na technologie Databricks  

3

lakehousy vybudované na technologii Databricks

2

roky používáme Databricks

Zajímá vás technologie Databricks?

Zajímá vás Lakehouse, který spojuje nejlepší vlastnosti data laku a datového skladu? Kontaktujte Lukáše Voseckého a prodiskutujte, jak ho využít v konkrétních podmínkách vaší organizace.

Seznamte se s projekty, na nichž jsme použili Databricks

V cloudu zákazníka z oblasti automotive jsme během několika měsíců vybudovali Lakehouse platformu, která zastřešuje všechny nové datové projekty. Začlenili jsme ji do stávající enterprise architektury, která se skládá z mnoha on-premise i cloud řešení, včetně Hadoop platformy. Díky multi-cloudovému Databricks Lakehousu jsme jednoduše a rychle propojili všechny datové systémy.

Přínosy:

  • Spojená multi cloud enterprise architektura platforem
  • Zjednodušená migrace dat
  • Připravené prostředí i data pro jakýkoli byznysový use case

Pomocí našeho Adoki snadno a efektivně přenášíme data přímo do Databricks Lakehousu. Zdrojový systém může být libovolný (relační databáze, NoSQL, Hadoop…).

Vyvinuli jsme automatizovaný proces překladu konverzací, který převádí písemnou korespondenci mezi zákazníkem a dodavatelem z různých světových jazyků do angličtiny a následně identifikuje témata konverzace.

K rozpoznání klíčových slov provádíme hloubkovou analýzu frekvencí a využíváme předškolené modely strojového učení. Tím zajišťujeme, že jsou témata konverzací stále aktuální a tým péče o zákazníky dokáže reagovat na nové podněty hned, jakmile se vyskytnou.

Přínosy:

  • Sentiment konverzace se zákazníkem
  • Textové shrnutí žádosti
  • Klasifikace tématu konverzace a výstupu z konverzace
  • Vizualizační dashboard

Z Hadoopu do platformy Databricks jsme migrovali stovky tabulek z klíčových IT systémů automobilky oddělení výroby, lidských zdrojů. Využili jsme pokročilé analytické schopnosti Databricks a optimalizovali výkon. Týmy HR, IT a výroby mohly okamžitě pracovat s daty v moderním prostředí a využívat výhod unifikované Lakehouse platformy.

Přínos:

  • O několik desítek minut se zkrátily nápočty dat
  • Zjednodušená Governance s Databricks Unity Catalog
  • Vyšší datová kvalita díky automatizovaným kontrolám na vstupní vrstvě

Ve významné české bance jsme migrovali několik desítek propensity-to-buy modelů z platfromy Hadoop do cloudu. Cílové řešení jsme zasadili do groupové Databricks platformy, konkrétně s využitím Databricks Mlflow a Databricks feature store funkcionalit.

Přínosy:

  • Začlenění platformy do celkového groupového řešení
  • Zrychlení nápočtů
  • Zjednodušená governance modelů

Vytvořili jsme robustní Databricks platformu, která kontinuálně extrahuje data ze zákaznického datového skladu. Data dále zpracovává, obohacuje a ukládá do Databricks feature store. Následně data vstupují do churn predikčního modelu a propensity-to-buy modelu. Nové modely včasně a přesněji doručují klíčové indikátory pro rozhodování specialistů týmu marketingu a péče o zákazníky.

Přínos:

  • Databricks Lakehouse připravený pro další projekty
  • Pravidelné výstupy z churn a propensity-to-buy modelů
  • Možnosti pokročilých datových analýz

Naše případové studie

ŠKODA AUTO: datové přenosy na analytické platformě komplexně řídí a monitoruje nástroj Adoki od Adastry

Adastra ve ŠKODA AUTO vybudovala v letech 2018-19 on-premise Datovou analytickou platformu (DAP) pro vizualizaci dat a realizaci sofistikovaných úloh pokročilé analytiky a umělé inteligence, která pracuje s velkými datovými objemy.

serverů využívá řešení implementované Adastrou

TB činí celková kapacita datového úložiště

měsíce zabralo napojení nástroje Adoki na požadované datové zdroje

Číst více

Poskytovatel internetu – platformu pro big data s kapacitou 3 PB jsme vybudovali za 3 měsíce

Významnému českému poskytovateli internetu jsme postavili big data platformu na ukládání provozních síťových dat. Cílem bylo dodat řešení, které není vázáno na konkrétního výrobce...

Číst více

Bankovnictví – data na jediném místě, přenášíme 4 TB dat denně

V bance jsme vytvořili big data platformu, která byznys uživatelům poskytuje streamovaná a batchová data z různých bankovních aplikací. Aby byla dávková data na...

Číst více

Automatická kategorizace 98,5 % karetních bankovních transakcí

Banka s miliony klientů, kteří denně uskuteční několik milionů transakcí, potřebovala automaticky přiřadit každé bankovní transakci (karetní i nekaretní) unikátní kategorii. Proto jsme vyvinuli aplikaci,...

Číst více

Inspirujte se na našem blogu

Observability platforma vs. observability nástroje

Složité informační systémy selhávají neočekávanými způsoby. Proto IT týmy potřebují jak observability nástroje, tak observability platformu. Abychom pochopili rozdíl mezi nástroji a platformou, začněme...

Číst více

Co je to observabilita? Nejen logy, metriky a transakce

S rostoucí složitostí a škálovatelností dynamických systémových architektur roste tlak na IT týmy, které musí sledovat a vhodně reagovat na změny a problémy v...

Číst více

Dobrý data management a propast mezi IT a byznysem nejvíce pálí velké české firmy  

Za největší výzvu v příštích třech letech považují velké české společnosti dobrý data management a neschopnost využití dat ze strany byznysu. S tím souvisejí...

Číst více

Rádi se s vámi nezávazně potkáme