<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/">
<channel>
<image>
<link>https://www.ciotrends.cz/</link>
<title>CIOtrends</title>
<url>https://i.iinfo.cz/bw/rss-88x31.gif</url>
<width>88</width>
<height>31</height>
</image>
<title>CIOtrends - články a aktuality autora Lukáš Civín</title>
<link>https://www.ciotrends.cz/autori/lukas-civin/</link>
<description>CIOtrends - IT strategie pro manažery</description>
<language>cs</language>
<pubDate>Wed, 21 Feb 2007 23:00:32 GMT</pubDate>
<item>
<title>S neuronovou sítí na data mining</title>
<link>https://www.ciotrends.cz/aktuality/s-neuronovou-siti-na-data-mining/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>Vzpomenete si je&amp;#353;tě na fungování bank v nedávné minulosti? Při žádosti o úvěr vás převzal bankovní úředník. Po získání v&amp;#353;ech potřebných dokumentů vás přeměřil přísným pohledem a rozebral mnoha zvídavými otázkami. Na základě svých zku&amp;#353;eností, denní doby, aktuální rodinné a firemní atmosféry rozhodl, zda banka úvěr poskytne, či nikoliv. 

Rozhodl jeho mozek. Jsme ve světě počítačů, tak proč nenahradit rozhodovací mechanismus jeho mozku umělými neurony, které dnes umíme velmi úspě&amp;#353;ně tvořit? Že je to složité?

Základem v&amp;#353;eho je neuron

Možná si říkáte, že vytváření umělého mozku tu už několikrát bylo. Ale v na&amp;#353;em případě nejde o celý mozek. Chceme totiž nahradit pouze jednu rozhodovací dráhu, která má na starosti přidělování úvěrů. Inspirací nám bude biologický neuron. Proč také vymý&amp;#353;let něco nového, když příroda vyvinula kvalitně fungující aparát? Pouze jeho základní podobu převedeme do struktur počítače a začneme s ním operovat.

Informace do neuronu vstupuje dendrity, každý impulz může mít jinou sílu. Rozhodnutí o informaci, kterou neuron zasílá axonem dál, poskytuje jádro (soma).

Jakmile jsme nuceni o něčem rozhodovat, což provádíme tisíckrát denně, aktivujeme mozkové trasy, které se skládají z neuronů. Ty přená&amp;#353;ejí informace a zároveň provádějí dílčí rozhodné operace. Příkladem může být nakupování. Představme si, že máme v mozku jeden neuron specializovaný na nakupování vína. Samotná koupě je ovlivněna zku&amp;#353;enostmi, preferencí druhu, náklonností ke značce a finančním obnosem, který jsme ochotni obětovat. Při pohledu na láhev vína pak vstupují do hry na&amp;#353;e vjemy (zaujme nás etiketa, zhodnotíme barvu, zpozorujeme cenovku). Ná&amp;#353; životní styl a zku&amp;#353;enosti celkově rozhodují, které podněty budou mít na samotnou koupi klíčový vliv. V mozku je to zaji&amp;#353;těno silněj&amp;#353;í dráhou k na&amp;#353;emu neuronu. Zjednodu&amp;#353;eně řečeno, pokud máme neomezené finanční zdroje, cenové hledisko do rozhodného neuronu ani nemusí doputovat díky oslabené dráze reprezentující vliv ceny. Samotné rozhodnutí je poměrně snadné &amp;#8211; vstupy ovlivněné významností trasy se sečtou, a pokud je součet silněj&amp;#353;í než práh rozhodování, láhev vína zakoupíme.

Nerozhodujeme se v&amp;#353;ak jen o koupi vína, ale uzavíráme například i poji&amp;#353;tění. Skupina klientů, kteří uzavřeli určité životní poji&amp;#353;tění, se obvykle vyznačuje podobnými vlastnostmi. Pokud je odhalíme, nic nám nebrání této znalosti využít. Čím významněj&amp;#353;í je atribut/vlastnost klienta, tím silněj&amp;#353;í je dráha k neuronu, který o zakoupení rozhoduje.

Umět rozhodnout o čemkoliv

Umělý neuron v podstatě kopíruje svojí strukturou biologický neuron. Informace do něj vstupují podobným způsobem a rozhoduje se opět na základě prahu. Jaká informace je pro rozhodnutí nejpodstatněj&amp;#353;í, určuje váha každého vstupu.

Při rozhodování o přidělení úvěru je například vý&amp;#353;e platu ohodnocena vysokou váhou, protože toto hledisko je důležité. Aktuální počasí má váhu nulovou. Když jsou váhy &amp;#353;ikovně rozdělené, může neuron velmi jednodu&amp;#353;e a automaticky ře&amp;#353;it zadaný úkol. Často jsou úlohy složitěj&amp;#353;í a například samotné přiznání úvěru není jednoduchým rozhodnutím, které by nejlépe vyře&amp;#353;il jediný neuron. Proto se obvykle neurony seskupují a spojují do sítí, které již dokáží rozhodnout o čemkoliv, pokud tedy rozhodnout mohou (rozhodovat o přidělení kreditní karty pouze na základě pohlaví obvykle nelze).


Neuronová síť se skrytou vrstvou, jedna z možných architektur.
Obrázek: Wikipedia, licence GNU Free Documentation License

Učit se, učit se

Když je v&amp;#353;e tak jednoduché, naskýtá se otázka, proč se s umělými neurony nesetkáváme na každém kroku? Trochu jsme totiž zanedbali otázku přidělení důležitosti jednotlivým vstupním informacím. Na&amp;#353;e zku&amp;#353;enosti se utvářejí po celou dobu života &amp;#8211; učíme se. Že oheň pálí, jsme si vyzkou&amp;#353;eli snad v&amp;#353;ichni. Podobné je to s umělými neurony &amp;#8211; žádná učená neuronová síť z nebe nespadla a bohužel jednodu&amp;#353;e nespadne. Je třeba ji učit na základě historických zku&amp;#353;eností, které jsou ukryty v datech. Tím se dotýkáme technik data miningu, které se snaží získat z dat znalosti a vložit je do umělého modelu. Na&amp;#353;ím modelem je neuronová síť a znalosti ukládáme do vah vstupních informací, podobně jako je tomu v na&amp;#353;em mozku. Stejně jako se učíme my, učí se i síť a na základě vkládaných informací průběžně upravuje důležitost vstupů. Nám trvá učení celý život, síť je schopná zachytit informace v datech v reálném čase. Člověk zapomíná, síť zapomínat nemusí, i když je to často vítanou vlastností.

Samotné učení sítě skutečně není úplně jednoduchým procesem, ale lze jej pochopit. Úspěch učení je obvykle podmíněn několika faktory. Zku&amp;#353;enosti ukazují, že klíčovou část tvoří kvalitní příprava dat a následně velmi pomalé učení.

Umělé neuronové sítě při získávání zku&amp;#353;eností disponují několika parametry, které ovlivňují rychlost, s níž se učí. Když se setkáte s neurony, téměř nikdy neuděláte chybu, pokud rychlost učení snížíte téměř k nule. Ztracený čas je kompenzován vy&amp;#353;&amp;#353;í kvalitou získané sítě.

Učit se, učit se?

Existuje tedy postup, jak do umělých neuronů vkládat informace. Jenže informací je nedostatek. O klientech toho stále víme málo, známe pouze střípky z vlastností a životního stylu. A neuronovou síť tedy učíme pouze z útržků, které jsou ukryté v datech. To v některých případech vede k tzv. přeučení.

Přeučený model správně rozpozná pouze vzory, které se učil. Vzory, které se jen mírně li&amp;#353;í, již rozpoznat nemusí. Příklad vydá za odstavce vysvětlování. Pokud by se &amp;#353;kolák učil písmena z jediné učebnice a nesetkal by se s jiným typem písma, měl by v reálném světě se čtením určité problémy. Dokázal by rozpoznat pouze ten typ písma, které se naučil, nebo nějaké jemu podobné, ale například rukou psaný text by nemusel správně rozlu&amp;#353;tit. Reálný svět nám poskytuje bezpočet různých typů písem, které v životě poznáme. Proto k přeučení nedochází. Umělý model ale čerpá jen z informací, které mu poskytneme. Proto je klíčové dbát na to, aby data obsahovala co nejvíce relevantních informací a hlavně aby jejich kvalita byla vysoká. Přeučení lze obvykle velmi snadno omezit pomalým učením a jeho zastavením ve správný moment. Identifikace správného momentu nebývá složitá, postačuje k tomu reprezentativní vzorek testovacích dat.

Neuronová síť není černá skříňka

Velmi často se setkáváme s postojem, že není vhodné používat umělé neurony, protože není zřejmé, jak rozhodují. Neuronová síť je proto označována za černou skříňku, která na předkládaný vzor odpoví, ale není jasné, proč takto odpověděla. Již víme, že se o rozhodování starají jednotlivé neurony, důležitost jejich vstupů a práh neuronu. V síti je neuronů často vět&amp;#353;í množství a rozhodování je kooperativní.

Lze tedy vůbec identifikovat, proč síť nějakým způsobem rozhoduje? Vraťme se k úloze s nákupem vína. Nakonec si nějakou láhev koupíme, ale často nevíme proč. Jedná se o složitěj&amp;#353;í souhru vjemů, náhod a aktuálního rozpoložení člověka, které poskládají výsledné rozhodnutí. Proto ani v neuronové síti nelze identifikovat pravidla jednoduchým způsobem. Ale o černou skříňku rozhodně nejde. Složitý model z ní vytváří velké množství spojovacích hran. Není nic jednodu&amp;#353;&amp;#353;ího než nedůležité vstupy odřezat. Jednodu&amp;#353;e se to říká a skutečně se to i jednodu&amp;#353;e provede. Nakonec zůstane neuronová síť, do níž vede jen několik důležitých vstupů, mezi neurony existuje taktéž pouze omezené propojení.

Složitá struktura neuronové sítě může být prořezána. Získáme tak jednodu&amp;#353;&amp;#353;í síť, ze které je již zřejmé, jak dochází k rozhodnutí. Prořezaná síť často rozhoduje jen nepatrně hůře.Váhy jednotlivých spojení ukazují na důležitost cest. Jejich poskládáním pak získáme soubor pravidel, na jejichž základě neurony rozhodují. Je pravdou, že například rozhodovací stromy poskytují snaz&amp;#353;í cestu k pochopení rozhodování, av&amp;#353;ak jejich potenciál automatického rozhodování není tak vysoký.

A zpět k rozhodování

Vraťme se ale k použití umělých neuronů v data miningu. Pomocí získané neuronové sítě můžeme ře&amp;#353;it mnoho úloh a podporovat rozhodování. Analyzovat &amp;#8222;Propensity to buy&amp;#8220; úlohy (tj. úlohy, které identifikují skupiny zákazníků, jež mají tendenci pořídit si nový produkt nebo službu), případně přímo cross-selling (jehož cílem je přesvědčit zákazníka ke koupi souvisejících produktů a služeb) a up-selling (tj. přesvědčit zákazníka ke koupi nového/vy&amp;#353;&amp;#353;ího modelu produktu či ře&amp;#353;ení nebo ke zvý&amp;#353;ení jeho hodnoty). Rozhodovat o poskytnutí úvěru, kreditní karty či slevy.

Neuronová síť může také napomoci při odhalování pojistných podvodů, lékařům může naznačit nastupující chorobu, může rozpoznávat klíčové sekvence DNA.Úloh data miningu existuje skutečně značné množství. Proces rozhodování je velmi blízký historickému my&amp;#353;lenkovému přístupu. Umělý model v&amp;#353;ak není náchylný k rozmarům počasí ani k rodinným problémům. Rozhoduje stále stejně a doučit ho případně nové podněty je také možné.

Autor je Business Consultantem společnosti Adastra Corporation.</description>

<author>redakce@ciotrends.cz (CIOtrends: Lukáš Civín)</author>
<pubDate>Wed, 21 Feb 2007 23:00:32 GMT</pubDate>

<guid isPermaLink="false">www.ciotrends.cz-actuality-3424</guid>


</item>
</channel>
</rss>