Sieci neuronowe - Skrypt rozdzial 10.PDF - Systemy Inteligentne - todbuda

Ćwiczenie 10

SIECI NEURONOWE I – SIECI JEDNOKIERUNKOWE

Celem ćwiczenia jest zaznajomienie studentów z podstawowymi

pojęciami z zakresu sieci neuronowych, takimi jak: neuron, sieć neuronowa,

funkcja aktywacji, struktura sieci neuronowej, uczenie sieci neuronowej.

Podczas ćwiczenia badana jest wielowarstwowa jednokierunkowa sieć

neuronowa (wielowarstwowy perceptron) wraz z jej algorytmem uczenia -

algorytmem propagacji wstecz. W szczególności badana jest możliwość

aproksymacji dowolnej funkcji za pomocą tego typu sieci.

I. WSTĘP

Początki badań nad modelami biologicznych (naturalnych) sieci

neuronowych sięgają lat czterdziestych dwudziestego wieku, kiedy to

sformułowano matematyczny model pojedynczego neuronu. Od tego czasu do

chwili obecnej dziedzina wiedzy zajmująca się modelami sieci neuronowych

(sztucznymi sieciami neuronowymi) rozwinęła się w sposób, który z pewnością

zadziwił wielu luminarzy współczesnej nauki. Rozwój ten dotyczy zarówno

samej teorii sztucznych sieci neuronowych, a więc ich struktur i algorytmów

uczenia, jak również dziedzin ich zastosowania. Prawdopodobnie łatwiej

obecnie wymienić obszary nauki, w których sieci neuronowych nie usiłowano

jeszcze zastosować niż te, w których z mniejszym lub większym powodzeniem

sztuczne sieci neuronowe są wykorzystywane.

Obecnie w wyrażeniu "sztuczne sieci neuronowe", określającym

software'ową lub (rzadziej) hardware'ową implementację matematycznego

modelu sieci neuronowej, najczęściej pomija się przymiotnik "sztuczne",

mówiąc po prostu "sieci neuronowe". My również w niniejszej instrukcji

przyjmiemy taką konwencję.

II. PODSTAWOWE POJĘCIA

1. Sieć neuronowa i jej elementy składowe

Sieć neuronowa

Siecią neuronową nazywamy układ wzajemnie połączonych

podstawowych elementów nazywanych neuronami.

Model neuronu

Neuron jest elementem statycznym posiadającym N wejść i jedno wyjście.

Został przedstawiony na rysunku 1a. Sygnał wyjściowy neuronu zależy od

sygnałów wejściowych i wyraża się następującym wzorem 1 :

⎛

⎜

∑ 1

⎞

⎟

wx b

(1)

gdzie:

- sygnał wyjściowy neuronu,

x x

1 , , , K

x N

- sygnały wejściowe neuronu,

f (⋅

- funkcja aktywacji neuronu,

K - wagi neuronu,

b - składnik stały (przesunięcie).

Wielkość występująca we wzorze (1) w nawiasie, będąca ważoną sumą

sygnałów wejściowych i składnika stałego, nazywana jest pobudzeniem neuronu

i oznaczana tutaj będzie symbolem v .

ww w N

1 , , ,

a )

b )

x 1

w 1

w 2

x 2

∑

w T

x N

w N

Rys.1. Model neuronu

1 W literaturze spotykane są również inne, bardziej złożone, modele neuronu.

Dla uproszczenia wzoru (1) często zakłada się istnienie dodatkowego sygnału x 0

stale równego jedności, który wchodzi do ważonej sumy z wagą

0 = b

. Mamy

wtedy

⎛

⎜

∑ 0

⎞

⎟

w jj

Przesunięcie b można więc traktować jako zerową wagę neuronu.

Po wprowadzeniu zapisu wektorowego sygnałów wejściowych i wag

x T

= [, ,

xx x

, w T

= [, , ,

ww w

12 K

] uzyskamy następującą postać wzoru

(1):

= +

( wx )

(2)

Graficznie zależność (2) została przedstawiona na rysunku 1b. Sygnał

wektorowy x został na nim zaznaczony pogrubioną linią.

Funkcja aktywacji

Funkcja aktywacji neuronu może być dowolną (w ogólności nieliniową)

funkcją przekształcającą pobudzenie neuronu v w sygnał wyjściowy y

y f v

= ().

(3)

Przykłady takich funkcji zostały przedstawione na rys. 2

W sieciach neuronowych uczonych przy użyciu metod gradientowych

wykorzystuje się neurony, których funkcje aktywacji są różniczkowalne ze

względu na v . Spośród prezentowanych na rys.2. funkcji aktywacji cechę taką

posiadają funkcje a ), e ) i f ), a więc funkcja liniowa, tangens hiperboliczny i

funkcja sigmoidalna. Funkcje te ponadto charakteryzują się cechą wygodną ze

względów obliczeniowych. Mianowicie wartości ich pochodnych w prosty

sposób zależą od wartości tych funkcji. Dla funkcji a ), e ) i f ) mamy

odpowiednio:

y f vv

= =

⇒ ′ =

f v

()

yf v v

() ()

⇒ ′ =+−

f v

() ( )( )

y y

(4)

yf v

= =

⇒ ′ =−

fv y y

() ( )

−

12 K

()

= =

()

a )

d )

−1

y v

⎪

gdy v

vyv

gdy v

< −

≤

b )

e )

−1

= =

sgn( )

⎩

−

gdy v

≥

= =

th( )

−

c )

f )

⎩

gdy v

≥

−

Rys. 2. Przykłady funkcji aktywacji neuronu

−

⎧

1 ()

Warstwa neuronów

Często wygodnie jest wydzielić spośród wszystkich neuronów sieci

pewne grupy nazywane warstwami. Cechą wspólną neuronów należących do

jednej warstwy jest to, że posiadają te same sygnały wejściowe.

Rozpatrzmy warstwę złożoną z M neuronów - rysunek 3a.

a )

x 1

∑

y 1

b 1

b )

x 2

∑

y 2

b 2

M M

x N

∑

y M

b M

Rys.3. Warstwa neuronów

Sygnał wyjściowy i -tego neuronu dany jest wzorem

⎛

⎞

∑ 0

⎜

wxb i

⎟ =

, , K , .

(5)

⎝

ij j

⎠

Podobnie jak wcześ

niej możemy zastosować zapis macierzowy. Jeśli

wprowadzimy oznaczenia:

⎡

⎤

⎡

⎤

⎡

M M OM

⎤

⎡

⎤

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

(6)

M M

⎣

⎦

⎣

⎦

⎣

⎦

⎣

⎦

uzyskamy macierzową postać równania (5)

= +

f (

Wx b

(7)

Ilustruje to rysunek 3b.

Sieci neuronowe - Skrypt rozdzial 10.PDF

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika: