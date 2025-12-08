;
CIOtrends  »  Těžba dat versus strojové učení

Těžba dat versus strojové učení

Ľuboslav Lacko
Včera
Doba čtení: 6 minut

Sdílet

Autor: Depositphotos
Databáze obsahují obrovské množství informací, ale problémem je, jak je odhalit, nebo přesněji řečeno, jak je vytěžit. K analýze informací se používají dvě související, ale odlišné oblasti: těžba dat a neuronové sítě z oblasti umělé inteligence.

Každá z těchto technologií má své místo, výhody a omezení. Správná volba nástroje často určuje, zda analýza přinese praktické výsledky, nebo zůstane pouze akademickým experimentem.

Co se dozvíte v článku
  1. K jakým úkolům použít datovou analýzu a k jakým úkolům použít neuronové sítě
  2. Podobnost procesů
  3. A ještě jedna věc…

Těžba dat je proces analýzy dat z různých perspektiv a jejich transformace na užitečné informace, které podporují rozhodování. Z matematického a statistického hlediska jde o hledání korelací, tj. vzájemných vztahů nebo vzorců v datech. Tento proces je založen na heuristických algoritmech, neuronových sítích a dalších pokročilých softwarových technologiích a metodách umělé inteligence.

I v této obecné definici, pocházející z doby před dvaceti lety, jsme se posunuli od datové analýzy k umělé inteligenci. Spojujícím prvkem jsou neuronové sítě, které jsou jedním z mnoha algoritmů pro klasickou datovou analýzu a také základním pilířem umělé inteligence.

Kyberbezpečnost a zákony bez obalu
Kyberbezpečnost a zákony bez obalu
0:00/

S pomocí datové analýzy a v dnešní době zejména s pomocí umělé inteligence je v zásadě možné studovat, porozumět a pravděpodobně i zlepšit prakticky jakýkoli proces ve velmi odlišných oblastech, jako jsou analýza chování spotřebitelů, řízení výrobních procesů, lidské zdroje, analýza lékařských vzorků, analýza signálů… Zjednodušeně řečeno, kdekoli, kde je možné shromažďovat data z procesů.

Typické postupy datové analýzy jsou:

  • Klasifikace – rozdělení záznamů do kategorií podle konkrétních kritérií umožňuje cílený a personalizovaný přístup. Tato skupina úkolů zahrnuje hledání odpovědí na otázky jako „je klient banky bonitní?“, „jaké typy kampaní a členských karet by měla obchodní společnost nabízet?“, „jakou skupinu zájemců osloví reklamní a marketingová kampaň?“, „proč společnost ztrácí zákazníky?“, „bude zamýšlený produkt úspěšný?“.
  • Shlukování – algoritmus vyhledává přirozené shluky dat, přičemž kritéria shlukování nejsou předem daná, ale vyplývají z přirozené struktury dat. Případy v rámci klastru jsou si v něčem podobné. Jednotlivé klastry se mohou překrývat, ale nemusejí. Algoritmus je vhodný například pro identifikaci segmentů zákazníků na základě společných charakteristik, jako jsou demografické, sociální, profesní a podobné.
  • Asociační pravidla – hledání vztahů „pokud – pak“. Nejen vztahy, jež jsou na první pohled zřejmé, jako například zákazník, který často kupuje chléb, kupuje také máslo, ale také skryté vztahy. Například klient, který kupuje dětské plenky, často kupuje také pivo. Spotřebitel plen, tj. batole, je samozřejmě nad podezření. Velká balení plen obvykle kupují otcové, protože matky jsou zaneprázdněné péčí o své potomky, a jakmile je tato skutečnost identifikována, nákup piva spolu s plenkami již není záhadou.
  • Regrese – statistická metoda, která kvantifikuje závislost mezi dvěma proměnnými: závislou proměnnou, již je třeba předpovědět, a nezávislou, tj. prediktivní proměnnou. Používá se například k odhadu prodeje.

Těžba dat se obecně zaměřuje na interpretovatelnost. Výsledky mají formu jasných pravidel, stromů nebo statistických modelů.

Autor článku

Ľuboslav Lacko

Témata:

Mohlo by vás zajímat

Kvíz týdne

Otestujte své znalosti digitální transformace: Výzva nejen pro CIO
1/10 otázek
Spustit kvíz

CIOtrends Newsletter

Objednejte si zdarma náš pravidelný informační newsletter se souhrnem nejzajímavějších zpráv a článků.

Objednat


HP Knowledge HUB
pro moderní firemní IT

Zobrazit všechny články

Krátce

  • 8. 10.  Rezignace kvůli eDokladům

    Ředitel Digitální a informační agentury Martin Mesršmíd rezignoval na svou funkci k 23. říjnu 2025. Mesršmíd nabídl svou funkci během minulého víkendu, kdy se DIA potýkala s problémy eDokladů, které některým občanům znepříjemnili využití možnosti prokázat se digitální občanku u volebních komisí při volbách do Poslanecké sněmovny.

  • 9. 9.  Seyfor k nezastavení

    Společnost Commander Services, která je součástí skupiny Seyfor, uzavřela akvizici 100% podílu ve firmě Radium, vývojáři systému Fleetware pro GPS monitoring vozidel, správu flotil a integrované IoT scénáře. 

    Transakce významně rozšiřuje působnost Commanderu na českém trhu a posiluje jeho vývojové kapacity v oblasti softwaru i hardwaru. Rovněž otevírá nové příležitosti pro nasazení pokročilých telematických řešení ve specifických odvětvích od municipálních a technických služeb až po logistiku či bezpečnostní složky.

  • 22. 7.  Prodaná Adastra

    Adastra Group má nového majoritního vlastníka. Stává se jím globální investiční skupina Carlyle. Uzavření akvizice v některých dotčených zemích podléhá schválení ze strany regulátora. Adastra byla založena v roce 2000, má centrály v Praze a Torontu. Specializuje se především na správu dat, cloud a umělou inteligenci. V regionálních pobočkách působících na klíčových trzích a v globálních delivery centrech zaměstnává přes 2 000 lidí.

  • 14. 7.  Radiokomunikace nabízejí AI

    České Radiokomunikace (CRA) spouští nové služby v oblasti umělé inteligence. Zahrnují škálu možností, od volby GPU výkonu přes výběr natrénovaného AI modelu až po trénink vlastních AI služeb. Firma slibuje vysokou úroveň bezpečnosti a tvrdí, že zákaznická data neopustí Českou republiku. Samozřejmostí je support v českém jazyce.

  • 3. 7.  Akvizice Algotechu

    Algotech rozšiřuje své portfolio o další služby a akvíroval firmu Expinit, která se zabývá IT službami, čímž získává dalšího hráče s hlubokou expertízou v oblasti Microsoft SharePoint a vývoje vlastních produktů, zejména v segmentu e-learningu.

    Obě společnosti budou i nadále úzce spolupracovat. Expinit zůstává samostatnou jednotkou v rámci skupiny Algotech a bude se i nadále věnovat svým klientům a projektům, přičemž nově získá zázemí silné skupiny a možnosti dalšího růstu.

Další krátké zprávy

Anketa

Jste spokojeni se schopnostmi aktuálně dostupných genAI modelů?

Zobraz výsledek

SPECIÁLNÍ PROJEKTY

Z našich webů

Dále u nás najdete

V roce 2026 nevzrostou OSVČ jen odvody. Co dál se mění?

Pětina lidí leží v nemocnicích zbytečně, ale není je kam přemístit

Těžba dat versus strojové učení

Proč přichází éra suverénních datových center?

Zdravotní a sociální pojištění 2026 u OSVČ: Opět výrazný růst záloh

Zapomínání může být příznakem mozkové mlhy. Jak se řeší?

Máte záložní plán, pokud byste chtěli odjet z ČR?

Zdravotní pojišťovny přispějí na sport, prevenci i helmu na lyže

Přehled změn v důchodech, které začnou platit v roce 2026

Copilot+ rok poté: Víc zmatků než užitku

Babišův střet zájmů potvrdil soud, Agrofert už přišel o stovky milionů

Zenbook Duo: elegán se dvěma displeji a několika kompromisy

Česká televize chystá projekt Tak moment pro mladé

Celková anestezie u zubaře bude na pojišťovnu, ale jen pro někoho

Firmy nejsou připraveny na změny. Čeká je krize komunikace

Kdy se hodí a jak funguje prodloužená záruka

V Praze jídlo rozváží roboti. „Kurýři nebudou mít co žrát,“ zní na sítích

Evropa už utíká od amerických cloudů

Změny v sociálním pojištění v roce 2026 v oblasti zaměstnávání

Generace Z není akvarijní rybka. Co vědět o marketingu pro ni?

Objednejte si nejnovější vydání magazínu CIOtrends
Obsah
předplatné PŘEDPLATNÉ