Rozpoznawanie choroby Parkinsona na podstawie głosu przy wykorzystaniu sztucznych sieci neuronowych



Pobieranie 332.6 Kb.
Strona3/5
Data27.04.2016
Rozmiar332.6 Kb.
1   2   3   4   5

2Wstęp do choroby Parkinsona


Choroba Parkinsona jest niebywale popularnym terminem w medycnie ostatnich lat. Naukowcy prowadzą szeregi badań mających na celu lepsze zrozumienie mechanizmów działania tej choroby. Schorzenie to zawiera jednak ciągle wiele tajemnic i dotąd nie są znane metody prowadzące do jego wyleczenia. Obecnie odkryto jedynie sposoby pozwalające na znaczne spowolnienie skutków postępowania choroby.

W rozdziale tym postaram się przedstawić podstawowe terminy związane z tą chorobą oraz opiszę przebieg jej leczenia. Omówię również powiązanie choroby Parkinsona z podstawowymi parametrami akustycznymi głosu.


.2.1Podstawy


Choroba Parkinsona to schorzenie neurologiczne, które objawia się w zaburzeniach ruchowych różnych części ciała. Nazwa i początki zdiagnozowania tej choroby pochodzą od londyńskiego lekarza Jamesa Parkinsona, który jako pierwszy zauważył i opisał jej objawy w swoim artykule w 1817 roku. [AnSNoPark] Ludzie zapadający na chorobę Parkinsona często mają problemy z prowadzeniem normalnego życia, ponieważ nie pozwala im ona na wykonywanie wielu podstawowych czynności życiowych (szczególnie, gdy jest w bardzo zaawansowanym stadium).

Choroba Parkinsona rozwija się na przestrzeni kilku lat. Początkowo chorzy zauważają problemy z niezgrabnym poruszaniem się oraz występuje u nich zjawisko tzw. „spowolnienia ruchowego”. Po pewnym czasie pojawiają się również istotne zaburzenia równowagi. Mają problemy ze wstaniem z krzesła lub łóżka. [AnSNoPark] Z trudnością przychodzi im wykonywanie wielu prostych ruchów, z którymi dotychczas nie mieli problemów.

U podstaw tej choroby leży proces polegający na stopniowym, systematycznym zmniejszaniu się liczby komórek istoty czarnej, umiejscowionej w śródmózgowiu pnia mózgu (rys. 10). [AnParkZDR, AnPastPark]. Komórki wchodzące w skład istoty czarnej wytwarzają specyficzną substancję zwaną dopaminą. [AnParkZDR] Dopamina stanowi chemiczny neuroprzekaźnik odpowiedzialny za możliwość pracy mięśni i koordynację ruchu. [AnSenPark] Obumieranie komórek z istoty czarnej powoduje zaburzenia w produkcji tego związku, co w konsekwencji prowadzi do nieprawidłowego funkcjonowania układu nerwowego. Mózg ma bardzo duże zdolności do kompensacji. Kliniczne objawy choroby Parkinsona występują z reguły, gdy obumrze blisko ok. 80 procent komórek odpowiedzialnych za wytwarzanie dopaminy.


Rys. 10 Zmiany w mózgu powstałe w wyniku choroby Parkinsona. Zmniejszona aktywność dopaminy w jądrach podstawowych. [AnParkImgZm]

Jak wykazały dotychczasowe badania choroba Parkinsona z reguły występuje u osób starszych po 50. roku życia (2/3 chorych ma ponad 65 lat). [AnSNoPark] Do innych czynników ryzyka zachorowania można zaliczyć również płeć. Większość chorych stanowią zazwyczaj mężczyźni. [AnSenPark]

.2.2Leczenie i przyczyny powstawania choroby Parkinsona


Choroba Parkinsona jest niewyleczalna. Istnieją obecnie metody o mniejszym lub większym stopniu inwazyjności, jednakże pozwalają one tylko na spowolnienie procesu postępowania choroby. Wcześnie wykryta choroba Parkinson przy obecnych metodach leczenia umożliwia opóźnienie o kilka lat występowania nasilonych objawów. W większości przypadków istnieje możliwość na wydłużenie czasu przeżycia do czasu średniego przeżycia w populacji generalnej i znacznego poprawienia jakości życia pacjenta. Zasadniczym lekiem stosowanym w terapii choroby Parkinson jest Lewodopa. [AnSNoPark]

Przyczyny powstawania choroby Parkinsona (obumierania komórek dopaminowych) są dotychczas nieznane. Istnieje duże prawdopodobieństwo, że są one następstwem uszkodzeń mechanicznych organizmu lub czynnikami genetycznie odziedziczonymi.


.2.3Głos ludzki a choroba Parkinsona


Badania wykazały, że blisko 90% ludzi cierpiących na chorobę Parkinsona wykazuje pewne nieprawidłowości głosowe. Zniekształcenia głosowe mogą być również jednym z pierwszych objawów, świadczących o chorobie. Problemy z głosem często są związane z dysfonią (zaburzenia głosowe, związane z problemami z jego wytwarzaniem) lub dyzartrią (jedno z najcięższych zaburzeń mowy. Objawia się problemami z czynnościami aparatu wykonawczego mowy: mięśni, języka, gardła, krtani. Istotę dyzartrii stanowią problemy z poprawną artykulacją.) Dysfonia w przypadku choroby Parkinsona jest zauważalna, ponieważ głosy większości chorych mają takie cechy jak: zmniejszenie głośności, zmieniony oddech, chropowatość, zmniejszenie energii w wyższych partiach harmonicznego widma oraz zbyt intensywne drżenie głosu. [LmaxSNPark, MjusZABM].

Rys. Na rysunkach przedstawione są widma głosu chorego na Parkinsona (lewy obrazek) oraz osoby zdrowej (prawy obrazek) [KTanhPDLP].


3Detekcja choroby Parkinsona przy wykorzystaniu sieci neuronowych


SSN doskonale nadają się do do znajdowania zależności oraz predykcji w wielu sytuacji medycznych.

W rozdziale tym zostanie omówiona detekcja choroby Parkinson na podstawie głosu przy wykorzystaniu sieci neuronowych.


.3.1Metodyka badań


Badania na podstawie których został uzyskany zbiór danych [LmaxZBDAT] (wykorzystywany w programie), polegały na wypowiadaniu i podtrzymywaniu przez ludzi głosek „a” tak długo, jak tylko byli w stanie. Tego typu badanie nosi również nazwę analizy krótkoterminowej. Każdy człowiek wykonywał od 5 do 7 prób.

Istnieją również inne metody badań głosowych jak np. analiza długoterminowa. Polega ona na wypowiadaniu przez osoby poddające się badaniu jednakowego zdania. Detekcja dysfonii jest jednak najlepsza jeżeli polega na jedonstajnym podtrzymywaniu głoski, ponieważ nie jest zakłócona poprzez efekty artykulacyjne oraz różnorodność językową. [LmaxSNPark]


.3.1.1Warunki środowiskowe


Przeprowadzone badania odbywały się w środowisku nie powodującym większych zakłóceń. Badania pozyskiwane były na dwóch rodzajach urządzeń nagrywających.

Idealnymi warunkami do badań byłoby przeprowadzanie ich w środowisku, w którym zjawiska szumu i pogłosu byłyby zredukowane do minimum. Istotne jest również wykorzystywanie wysokiej jakości sprzętu do nagrywania dźwięku.


.3.1.2Przedmiot badań


Grupa przebadanych składała się z 35 osób w przedziale wiekowym od 22 do 85 lat. Badani byli zróżnicowani pod względem płci – 21 mężczyzn i 14 kobiet - oraz stadiów choroby. Dwanaścioro z badanych nie było chorych. Dokładny opis badanych osób znajduje się w poniższej tabeli (tabela 1):

Przedmiot badań

Płeć

Wiek

Stopień zaawansowania choroby

Years since diagnosis

S01

M

78

3.0

0

S34

K

79

2.5

¼

S44

M

67

1.5

1

S20

M

70

3.0

1

S24

M

73

2.5

1

S26

K

53

2.0



S08

K

48

2.0

2

S39

M

64

2.0

2

S33

M

68

2.0

3

S32

M

50

1.0

4

S02

M

60

2.0

4

S22

M

60

1.5



S37

M

76

1.0

5

S21

K

81

1.5

5

S04

M

70

2.5



S19

M

73

1.0

7

S35

K

85

4.0

7

S05

K

72

3.0

8

S18

M

61

2.5

11

S16

M

62

2.5

14

S27

M

72

2.5

15

S25

M

74

3.0

23

S06

K

63

2.5

28

S10 (zdrowy)

K

46

-

-

S07 (zdrowy)

K

48

-

-

S13 (zdrowy)

M

61

-

-

S43 (zdrowy)

M

62

-

-

S17 (zdrowy)

K

64

-

-

S42 (zdrowy)

K

66

-

-

S50 (zdrowy)

K

66

-

-

S49 (zdrowy)

M

69

-

-

S50(zdrowy)

M

22

-

-

S51(zdrowy)

M

48

-

-

S52(zdrowy)

K

48

-

-

S53(zdrowy)

K

25

-

-

Tabela 1. Dane osób, biorących udział w badaniu. [LmaxSNPark]

.3.2Analiza akustyczna głosu


Analiza akustyczna badanego głosu polega na rozłożeniu go na odpowiednie parametry. W przypadku programu rozkład dokonywany jest na: jitter, shmmer, HNR oraz NHR. Do rozkładu głosu na parametry akustyczne zostało wykorzystane oprogramowanie Praat. [BpauPRAT]

.3.2.1Podstawowe parametry


Wszystkie analizowane parametry oceniają względną zmianę częstotliwości lub amplitudy sygnału akustycznego. Są uzyskane na podstawie analizy krótkoterminowej głosu.
.3.2.1.1Jitter

Parametr określający względne zmiany podstawowej częstotliwości pomiędzy okresami w zakresie analizowanej próbki głosu. [NewaOCANA]
.3.2.1.2Shimmer

Parametr związany ze względną zmianą amplitudy pomiędzy okresami (dokładniej amplitudy składowej harmonicznej o częstotliwości równającej się częstotliwości podstawowej). [NewaOCANA]
.3.2.1.3HNR

Parametr zwany również Harmonics-To-Noise Ratio. Określa stosunek sygnału do szumu oraz stopień akustycznych okresowości. Wyrażany jest w dB.

HNR doskonale nadaje się do badania stanu zdrowia danego romówcy. Zdrowa osoba wytwarza sygnał na poziomie od 20 dB do około 40 dB. Ludzie ze schorzeniami głosowymi wytwarzają sygnał akustyczny na poziomie zdecydowanie niższym niż 20 dB. [NewaOCANA, BpauPRATHNR]


.3.2.1.4NHR

Parametr przedstawiający zawartość szumu w danym sygnale akustycznym. Określa stosunek nieharmonicznej części (hałasu) obejmującej zakres powyżej 1500 Hz do części harmonicznej sięgającej poniżej 1500 Hz. [NewaOCANA]

.3.2.2Rozkład głosu na parametry akustyczne


W programie do rozkładu głosu na parametry akustyczne został wykorzystany skrypt napisany w języku specjalnie utworzonym do oprogramowania Praat (patrz rozdz. 4.2.2.1).

form Plot a pitch contour

word inarg "filed"

endform


if (inarg$="")

echo Usage: praatcon analyse_voice.praat

exit

endif


inputFileName$ = inarg$

outputFileName$ = inputFileName$ + ".txt"

echo Loading file 'inputFileName$'

Read from file... 'inputFileName$'

echo 'inputFileName$' is loaded

# Create sound object

##############################

voiceFileName$ = selected$ ("Sound")

# Create pitch object

select Sound 'voiceFileName$'

pitch = To Pitch (cc)... 0 60 15 yes 0.03 0.45 0.01 0.35 0.14 600

# Create Point Process object

##########################

select Sound 'voiceFileName$'

plus pitch

pp = To PointProcess (cc)

# Extract voice report

##########################

select Sound 'voiceFileName$'

plus pitch

plus pp

voiceReport$ = Voice report... 0 0 75 500 1.3 1.6 0.03 0.45



jitter_ddp = extractNumber (voiceReport$, "Jitter (ddp): ")

shimmer_apq3 = extractNumber (voiceReport$, "Shimmer (apq3): ")

shimmer_apq5 = extractNumber (voiceReport$, "Shimmer (apq5): ")

shimmer_dda = extractNumber (voiceReport$, "Shimmer (dda): ")

meanHNR = extractNumber(voiceReport$, "Mean harmonics-to-noise ratio: ")

meanNHR = extractNumber(voiceReport$, "Mean noise-to-harmonics ratio: ")

echo Demanded parametres are successfully calculated: jitter (ddp), shimmer (apq3), shimmer (apq5), shimmer (dda), hnr, nhr

fileappend 'outputFileName$''tab$''jitter_ddp''tab$''shimmer_apq3''tab$''shimmer_apq5''tab$''shimmer_dda''tab$''meanHNR''tab$''meanNHR''newline$'

echo All parametres are written to file 'outputFileName$'
Skrypt rozpoczyna się od pobrania argumentów wiersza poleceń. Podawane są w nim: nazwa skryptu do analizy głosu oraz plik z głosem osoby badanej. Jeżeli te parametry nie zostaną podane, to na wyjściu pojawi się stosowana informacja. Następnie za pomocą funkcji Read from file... odbywa się wczytanie pliku z dźwiękiem. Polecenie voiceFileName$ = selected$ ("Sound") powoduje utworzenie obiektu Sound i przypisanie zmiennej voiceFileName jego unikalnego id. Niezbędne jest również utworzenie obiektów Pitch oraz Point Process. Kiedy są już utworzone wszystkie wymagane obiekty należy dodać je do aktualnego wyboru przy użyciu komendy plus. Po wykonaniu opisanych operacji można dokonać rozkładu głosu na odpowiednie parametry, wykorzystując VoiceReport. Na samym końcu skryptu wartości powstałe z analizy akustycznej głosu są zapisywane do pliku.

Język skryptowy Praat ma również wiele innych zastosowań. W skrypcie zostały uwzględnione tylko najbardziej podstawowe odnoszące się do analizy sygnału akustycznego.



.3.3Algorytm detekcji choroby Parkinsona


W tej sekcji przedstawiono algorytm detekcji choroby Parkinsona. Omówione zostaną również zbiory danych wykorzystywane w programie oraz proces uczenia się SSN.

.3.3.1Opis ogólny


Detekcja choroby Parkinsona przy wykorzystaniu stworzonego w ramach pracy programu odbywa się schematycznie (rys. 11). Rozpoczyna się od wczytania danych z formularza wypełnionego przez użytkownka. W zależności od wybranego formularza wybierana jest odpowiednia nauczona sieć neuronowa. Głos jest rozkładany na poszczególne parametry akustyczne, które następnie są analizowane pod kątem posiadania cech charakterystycznych dla choroby Parkinsona. Ostatecznie użytkownik otrzymuje informację o tym czy jest chory.

Rys. 11 Schemat algorytmu detekcji choroby Parkinsona wykorzystany w programie (TODO:// do poprawy).


.3.3.1.1Zbiór danych

W celu osiągnięcia jak najlepszych wyników niezbędna była ich wcześniejsza analiza. Dane w zbiorze pochodzą z dwóch źródeł: jedna część została otrzymana z dostępnego zbioru danych medycznych w Internecie [LmaxSNPark] oraz drugą część stanowią dane uzyskane z badań wykonanych na potrzebę pracy (24 próbki). Dane podzielono na 6 grup: ludzi chorych na Parkinsona, zdrowych, wszystkich przebadanych, wszystkich przebadanych z wyłączeniem danych z badania dodatkowego, zdrowych z wyłączeniem danych z badania dodatkowego, oraz z badania dodatkowego. Dane analizowane były metodami statystycznymi, polegającymi na wyliczaniu wartości minimalnej i maksymlanej, średniej oraz odchylenia standardowego.




ŚR. Jitter:DDP

ŚR.. Shimmer:APQ3

ŚR. Shimmer:APQ5

ŚR. Shimmer:DDA

ŚR. HNR

ŚR. NHR

ŚR. AGE

CHORZY

0,011244

0,017753

0,020387

0,053260

21,07472

0,029655

68,02837

ZDROWI

0,005315

0,012826

0,014845

0,038478

23,96782

0,012510

51,67123

WSZYSCY

0,009222

0,016072

0,018497

0,048217

22,06162

0,023807

62,44860

WSZYSCY (bez danych dod.)

0,009855

0,015658

0,017878

0,046974

21,99003

0,025040

66,05291

ZDROWI (bez danych dod.)

0,005776

0,009504

0,010509

0,028511

24,67875

0,011483

60,25000

DANE DODATKOWE

0,004431

0,019205

0,023171

0,057614

22,60284

0,014483

35,20000




























MAX Jitter:DDP

MAX Shimmer:APQ3

MAX Shimmer:APQ5

MAX Shimmer:DDA

MAX. HNR

MAX NHR

MAX AGE

CHORZY

0,064330

0,056470

0,079400

0,169420

29,92800

0,314820

85,00000

ZDROWI

0,018730

0,049050

0,059240

0,147140

33,04700

0,107150

69,00000

WSZYSCY

0,064330

0,056470

0,079400

0,169420

33,04700

0,314820

85,00000

WSZYSCY (bez danych dod.)

0,064330

0,056470

0,079400

0,169420

33,04700

0,314820

85,00000

ZDROWI (bez danych dod.)

0,018730

0,023360

0,024980

0,070080

33,04700

0,107150

69,00000

DANE DODATKOWE

0,010470

0,049050

0,059240

0,147140

28,60700

0,040992

48,00000




















































MIN Jitter:DDP

MIN Shimmer:APQ3

MIN Shimmer:APQ5

MIN Shimmer:DDA

MIN HNR

MIN NHR

MIN AGE

CHORZY

0,002040

0,004550

0,005700

0,013640

8,44100

0,002310

48,00000

ZDROWI

0,001900

0,004680

0,006060

0,014030

16,70300

0,000650

22,00000

WSZYSCY

0,001900

0,004550

0,005700

0,013640

8,44100

0,000650

22,00000

WSZYSCY (bez danych dod.)

0,002040

0,004550

0,005700

0,013640

8,44100

0,000650

46,00000

ZDROWI (bez danych dod.)

0,002760

0,004680

0,006060

0,014030

17,88300

0,000650

46,00000

DANE DODATKOWE

0,001900

0,006610

0,008430

0,019830

16,70300

0,002624

22,00000




























OS Jitter:DDP

OS Shimmer:APQ3

OS Shimmer:APQ5

OS Shimmer:DDA

OS HNR

OS NHR

OS AGE

CHORZY

0,009921

0,010978

0,013086

0,032934

4,40220

0,045336

9,60353

ZDROWI

0,003009

0,008115

0,010070

0,024343

3,61500

0,016903

15,45878

WSZYSCY

0,008700

0,010342

0,012400

0,031026

4,36407

0,038908

14,20622

WSZYSCY (bez danych dod.)

0,009031

0,010281

0,012195

0,030843

4,45585

0,041043

9,82817

ZDROWI (bez danych dod.)

0,003199

0,003456

0,003231

0,010368

3,43454

0,019088

8,09649

DANE DODATKOWE

0,002426

0,010473

0,013189

0,031419

3,62663

0,011723

12,59960

Tabela 2. z wynikiami analizy statystycznej danych

Wnioski, które można wyciągnąć po przeanalizowaniu powyższej tabeli [nr tabeli]:

- ludzie chorzy na Parkinsona charakteryzowali się posiadaniem największej średniej wartości parametru akustycznego Jitter:DDP, Shimmer:APQ3, Shimmer:APQ5 oraz Shimmer:DDA,

- u chorych występowała najniższa wartość średnia HNR oraz najwyższy NHR,

- cierpiący na Parknsona posiadali najwyższą średnią wieku. Wśród ich grupy znajdowała się osoba najstarsza: 85 lat. Najmłodsza osoba chora na Parkinsona posiadała 48 lat (tabela 1),

- wśród grupy chorych na Parkinsona wszystkie parametry podlegające badaniu z wyjątkiem wieku mają najwyższą wartość odchylenia standardowego.


.3.3.1.2Uczenie sieci

Uczenie sieci odbywało się w programie Statistica. W aplikacji występują dwa tryby uczenia i znajdowania optymalnej sieci. Jeden z nich polega na całkowicie automatycznym doborze parametrów sieci. Program sam dobiera liczbę neuronów w warstwie ukrytej, znajduje najbardziej optymalną funkcję aktywacji oraz ustala warunek stopu. Drugi tryb oparty jest na szeregu własnych ustawień sieci. Sieć tworzona jest na podstawie manualnie dobieranych parametrów.

W przypadku trybu automatycznego w celu korzystania z sieci o jak najbardziej optymalnej liczby warstw ukrytych i najlepszej funkcji aktywacji, wybór polegał na sprawdzeniu kilkudziesięciu sieci. W przypadku projektu wybierane były wartości 40 i 100 sieci.



Id testowanej siec

Typ sieci (we-wuk-wyj)

Korelacja (zbiór treningowy)

Korelacja (zbiór testowy)

Korelacja (zbiór walidacyjny)

Błąd zbiór treningowy

Błąd zbiór testowy

Błąd zbiór walidacyjny

Algorytm uczenia

Funkcja błędu

Funkcja aktywacji (warstwa ukryta)

Funkcja aktywacji (wyjście)

Sn_1

MLP 6-111-1

0,705902

0,856582

0,549795

0,056163

0,022511

0,097617

BFGS 78

SOS

Exponential

Tanh

Sn_2

MLP 6-57-1

0,751648

0,829594

0,432424

0,048713

0,021043

0,124585

BFGS 60

SOS

Tanh

Logistic

Sn_3

MLP 6-8-1

0,723166

0,881818

0,611021

0,053803

0,012394

0,088883

BFGS 79

SOS

Exponential

Logistic

Sn_4

MLP 6-70-1

0,720038

0,889890

0,589611

0,055727

0,011339

0,094673

BFGS 64

SOS

Exponential

Logistic

Sn_5

MLP 6-92-1

0,710160

0,712885

0,373284

0,054631

0,055003

0,118388

BFGS 81

SOS

Exponential

Tanh

Tabela 3. przedstawiająca uczenie sieci w trybie automatycznym

Sieci testowane były z wykorzystaniem zbiorów uczącego, testowego oraz walidacyjnego. Propoprcje danych zbiorów rozłożone były zgodnie z tabelą [nr tabeli].



Id testowanej sieci

Testowana ilość sieci

Zbiór walidacyjny (%)

Zbiór testowy(%)

Zbiór uczący (%)

Sn_1

40

15

10

75

Sn_2

40

15

10

75

Sn_3

100

15

10

75

Sn_4

100

15

10

75

Sn_5

40

10

10

80

Tabela 4. przedstawiająca rozkład zbiorów, biorących udział w programie

Testowane sieci, których parametry uczenia były dobierane automatycznie wykazywały zbliżone właściwości, nawet pomimo różnych struktur (każda z sieci była wielowarstwowym perceptronem jednakże posiadały różne ilości neuronów w warstwie ukrytej). Jako funkcję aktywacji w warstwie ukrytej zazwyczaj obierały funkcję wykładniczą. Jedynie sieć, która posiadała mniejszy zbiór walidacyjny i większy uczący, cechuje się znacznie gorszą korelacją dla zbioru testowego i walidacyjnego. Każda sieć stosowała funkcję sumy kwadratów (miara błędu równa się sumie różnic wartości przewidywanych – przez model i rzeczywistych - obserwowanych) jako funkcję błędu. Wykorzystywana jest ona zarówno w trakcie uczenia sieci, jak i przy określaniu jej błędnego działania. Wszystkie sieci obierały jako algorytm uczenia metodę Quasi-Newtona (metoda zmiennej metryki BFGS. Wykorzystuje w trakcie uczenia sieci odwrotność macierzy drugich pochodnych funkcji błędu liczonych względem kolejnych wag). [JJakARTSTATIS]



Do nauki sieci w projekcie wykorzystano również tryb uczenia konfigurowanego manualnie. Przetestowano kilka konfiguracji SSN. W tableli 3 przedstawione są dane otrzymane w wyniku przeprowadzania procesu nauczania w programie Statistica. W porównaniu do nauczania w trybie automatycznym można zauważyć tutaj znacznie gorsze korelacje w przypadku kilku sieci, pomiędzy wartością pożądaną na wyjsciu, a wartością otrzymwaną w wyniku testów na danym zbiorze. Wszystkie sieci były typu wielowarstwowego perceptronu o 6 wejściach i 1 wyjściu. Zawierały 50 lub 100 neuronów w warstwie ukrytej. Sieci uczone wykorzystywały różne algorytmy: metody Quasi-Newtona, najszybszego spadku (ang. Gradient descent) oraz gradientu sprzężonego (ang. Conjugate descent) . Jednakże tylko w przypadku algorytmu metody Quasi-Newtona uzyskiwano zadowalające rezultaty. Podobnie jak w przypadku sieci nauczanych w trybie automatycznym funkcję błędu statnowiła funkcja sumy kwadratów (SOS).

Id sieci

Typ sieci (we-wuk-wyj)

Korelacja (zbiór treningowy)

Korelacja (zbiór testowy)

Korelacja (zbiór walidacyjny)

Błąd zbiór treningowy

Błąd zbiór testowy

Błąd zbiór walidacyjny

Algorytm uczenia

Funkcja błędu

Funkcja aktywacji (warstwa ukryta)

Funkcja aktywacji (wyjście)

Sn_6

MLP 6-50-1

0,799743

0,858570

0,505760

0,041054

0,015405

0,116860

BFGS 71

SOS

Tanh

Logistic

Sn_7

MLP 6-50-1

0,717712

0,877964

0,540337

0,055553

0,012149

0,105094

BFGS 53

SOS

Exponential

Logistic

Sn_8

MLP 6-100-1

0,710284

0,879633

0,547011

0,056383

0,012183

0,102741

BFGS 54

SOS

Exponential

Logistic

Sn_9

MLP 6-50-1

0,306320

0,134943

0,373347

0,326195

0,324693

0,257540

Gradient descent 30

SOS

Tanh

Identity

Sn_10

MLP 6-100-1

0,417860

0,353660

0,388346

0,298574

0,290732

0,234934

Gradient descent 162

SOS

Tanh

Identity

Sn_11

MLP 6-50-1

0,275845

0,164641

0,407896

0,113872

0,114987

0,124427

Gradient descent 2

SOS

Tanh

Logistic

Sn_12

MLP 6-50-1

0,501405

0,626563

0,494365

0,082780

0,068259

0,103307

Conjugate gradient 81

SOS

Logistic

Logistic

Tab. 5 Tabela przedstawiająca wyniki sprawdzania sieci neuronowych w trybie manualnym.

.3.3.2Wykorzystana sieć neuronowa


W programie jest wykrzystana SSN posiadająca wejścia w postaci parametrów częstotliwościowych głosu. Na wyjściu otrzymywana jest wartość logiczna (prawda lub fałsz) świadcząca o tym, czy badany podmiot jest chory.

Typ sieci (we-wuk-wyj)

Korelacja (zbiór treningowy)

Korelacja (zbiór testowy)

Korelacja (zbiór walidacyjny)

Błąd zbiór treningowy

Błąd zbiór testowy

Błąd zbiór walidacyjny

Algorytm uczenia

Funkcja błędu

Funkcja aktywacji (warstwa ukryta)

Funkcja aktywacji (wyjście)

MLP 6-50-1

0,799743

0,858570

0,505760

0,041054

0,015405

0,116860

BFGS 71

SOS

Tanh

Logistic

Tabela. 6 Podsumowanie nauki sieci neuronowej z programu Statistica.

Sieć neuronowa w programie jest typu wielowarstwowego perceptronu o 6 wejściach, 50 warstwach neuronow ukrytych oraz 1 wyjściu (rys). W sieci występuje stosunkowo silna korelacja pomiędzy wartością osiąganą na wyjściu, a zamierzonym celem. W przypadku zbioru zbioru treningowego korelacja wyniosła okolo 0,8, a w przypadku zbioru testowego ok. 0,86. SSN wykorzystywana w programie opiera swoje działanie na funkcji aktywacji typu exp. Błędy uzyskane na zbiorze testowym i treningowym oscylują w granicach wartości 0,05.







Rys. Konfiguracja wykorzystywanej przez aplikację projektową sieci neuronowej w programie Statistica.


1   2   3   4   5


©absta.pl 2016
wyślij wiadomość

    Strona główna