|
|
|
|
|
|
|
|
|
||
|
|
|
|
||
|
||
|
||
|
||
|
||
|
||
|
1 Inleiding
2 opzet
2.1 Methodiek
2.2 Verbetering datasets
2.3 Training neurale netwerken
3 Resultaten
BIJLAGEN
Het afgelopen jaar hebben de waterbeheerders hard gewerkt om de waterlichamen, doelen en maatregelen aan te passen en vast te stellen voor hun waterbeheerplannen en SGBP2. Het Planbureau voor de Leefomgeving (PBL) gaat net als in 2007 en 2009 voor SGBP1 analyseren in hoeverre de geplande maatregelen leiden tot het bereiken van de doelen (in de zogenaamde Ex Ante evaluatie). Dit gebeurt in samenwerking met Deltares waarbij met de KRW-verkenner de effecten van de maatregelen op de ecologische toestand worden doorgerekend. Om dit mogelijk te maken, is echter eerst een aanpassing van de ecologische rekentools in de KRW-verkenner noodzakelijk. Deze zijn namelijk nog opgesteld op basis van de oude maatlatten en waterlichaamkarakterisering. De ecologische rekenregels zijn ondergebracht in een rekenmodule Expertsystseem Ecologische Effecten. Waarbij voor dit project de versie 3 is aangepast naar versie 4 (EEE4)
Royal HaskoningDHV heeft van PBL opdracht gekregen om voor de KRW-Verkenner:
In deze korte rapportage wordt de methodiek, opzet en resultaten van de neurale netwerken beschreven. In bijlagen 1 t/m 8 worden de concrete resultaten van deze netwerken voor elk van de acht watertypen gegeven.
Met de aangevulde en verbeterde datasets zijn nieuwe neurale netwerken getraind met de Neural Network Toolbox V7.0 (R2010b) in Matlab V7.11 (R2010b) van Mathworks ®. Het daarbij gebruikte type neurale netwerk is een zogenaamd feed forward back propagation netwerk dat ook toegepast is voor het trainen van de EEE2 [1] en EEE3 [2] netwerken. Voor elk te trainen netwerk zijn de datasets verdeeld in een set met 80% wateren voor de training en validatie en een set met 20% wateren voor het testen. Deze zelfde 20% worden ook bij de andere tools (PUNN en Regressiebomen) gebruikt om te testen. Deze 20% testdata is in het verleden wel eens (foutief) validatiedata genoemd, maar wordt dus enkel gebruik voor het testen en onderling vergelijken van de drie rekentools.
De aldus verkregen netwerken zijn vervolgens gecompileerd tot de executable EEE4.exe met Matlab Compiler V4.14 (R2010b). Deze executable leest een csv-invoerbestand in en genereert twee uitvoerbestanden, te weten:
Deze executable is aan Deltares geleverd voor koppeling aan de KRW-verkenner.
Uitgangspunten
Bij de verbetering van de dataset zijn de volgende uitgangspunten van toepassing:
Veranderingen in dataset
Voor het trainen van nieuwe neurale netwerken ten behoeve van EEE4 zijn de datasets voor de acht verschillende watertypen zoals gebruikt voor de verdere ontwikkeling van EEE3 in 2012 aangevuld en verbeterd. Tabel 2.1 geeft hiervan een overzicht.
Voor zes watertypen zijn de datasets uitgebreid, voor één watertype is de dataset gelijk gebleven in aantal records en voor één watertype is er één record minder.
Van de uitgebreide datasets springen de watertypes langzaam stromende beken, ondiepe meren en kanalen erbovenuit met aardig wat meer records, om precies te zijn 10, 11 en 13 records. Na deze update is voor alle watertypenclusters op de diepe meren na een dataset van voldoende omvang (circa 190-200) verkregen. Het aantal diepe meren dat in Nederland als waterlichaam is aangewezen is echter zo laag dat een dataset met vergelijkbare omvang niet mogelijk is op dit moment. Ondanks de relatief kleine dataset waren er voor alle kwaliteitselementen van dit type waterlichaam toch goede netwerken te trainen.
Samenvattend zijn er iets meer records beschikbaar en meestal hetzelfde of meer echte metingen. Bij meer records kan dat soms tot een iets lager percentage ‘echte waarnemingen’ leiden.
Tabel 2.1: Aantal records in de datasets voor ontwikkeling EEE4 en aandeel monsters dat getoetst is aan de KRW-maatlatten (uit Limnodata, Piscaria of uit het WKP), eventueel aangepast n.a.v. ontbrekende data of andere gegevens. Resterend aandeel ingevuld op basis van expert judgement. Tussen () het aantal records c.q. percentage getoetst bij EEE3
Watertypencluster |
Aantal records |
Percentage records gebaseerd op echte biologische monsters die aan KRW-maatlatten getoetst zijn. |
|||
Fytoplankton |
Overige waterflora |
Macrofauna |
Vissen |
||
Langzaam stromende beken |
212 (202) |
|
96 (93) |
97 (97) |
69 (66) |
Snel stromende beken |
195 (195) |
|
63 (56) |
97 (97) |
62 (54) |
Ondiepe meren |
204 (193) |
66 (66) |
56 (58) |
90 (90) |
28 (30) |
Diepe meren |
129 (128) |
79 (80) |
39 (39) |
84 (85) |
22 (21) |
Kanalen |
211 (198) |
71 (66) |
75 (74) |
95 (94) |
52 (41) |
Sloten |
195 (193) |
|
69 (75) |
93 (93) |
26 (31) |
Zwak brakke wateren |
209 (203) |
94 (93) |
59 (59) |
93 (96) |
23 (15) |
Brakke tot zoute wateren |
185 (186) |
95 (95) |
23 (24) |
97 (96) |
10 (10) |
Verandering in oordelen na aanpassing maatlat
In beide clusters stromende wateren was het verwerken van de nieuwe maatlatten voor overige waterflora (specifiek de macrofyten) en vis het meest ingrijpend. Met name voor vis zijn de oordelen op dezelfde locaties nu een stuk lager dan voorheen.
In de zwak brakke wateren heeft de aangepaste maatlat voor macrofauna het meeste effect op de EKR’s. In het zoete bereik (<1000 mg Cl/l) zijn de oordelen hoger dan voorheen en in het zoute bereik (>2000 mg Cl/l) juist lager.
In de diepe zoete meren heeft de aanpassing van de deelmaatlat voor chlorofyl geleid tot hogere EKR’s voor fytoplankton. De nieuwe maatlatten voor overige waterflora en vis leiden in de meeste gevallen tot wat lagere EKR’s.
In de sloten en kanalen zijn met de maatlataanpassingen (vis en overige waterflora) hoofdzakelijk fouten opgelost. Dit heeft niet geleid tot een structurele verhoging of verlaging van de EKR. De maatlatfouten spelen uiteraard niet in de expertoordelen en zijn dan ook niet aangepast. Dit geldt ook voor overige waterflora in de ondiepe meren. Bij vis in de ondiepe meren is wel overwogen om de expertoordelen wat te verlagen. De relaties tussen de EKR’s van oude en nieuwe maatlatten was echt niet goed genoeg om een juiste factor af te kunnen leiden. Daarom is eerst getraind en zijn vervolgens expert oordelen aangepast waar de berekende oordelen die duidelijk afwijken van de ingevoerde waarden.
De volgende codes zijn gebruikt in de trainingsets om de herkomst van de gegevens te kunnen herleiden en of het betreffende record is gebruikt voor training (+ validatie) of testen:
De Matlab scripts die zijn opgesteld om de neurale netwerken te trainen zijn geupdate, waarna nieuwe neurale netwerken zijn getraind met de datasets die ten opzichte van de sets in 2012 zijn aangevuld en verbeterd.
In tabel 2.2 is een overzicht gegeven van de watertypen, de verschillende neurale netwerken en het aantal trainingscycli dat is uitgevoerd.
Tabel 2.2: Watertypen, neurale netwerken en trainingscycli
Watertype |
Neuraal netwerk voor |
Aantal trainingscycli |
|
Codering |
Omschrijving |
||
R4, R5, R6 en R12 |
Langzaam stromende beken |
|
Elk netwerk 11 000
|
R13, R14, R15, R17 en R18 |
Snel stromende beken |
|
Elk netwerk 11 000
|
M20 |
Diepe meren |
|
Elk netwerk 11 000 |
M14, M23 en M27 |
Ondiepe meren |
|
Elk netwerk 11 000
|
M3, M4, M6a/b, M7a/b en M10 |
Kanalen |
|
Elk netwerk 55 000 |
M1a/b, M2 en M8 |
Sloten |
|
Elk netwerk 11 000
|
M30 |
Zwak brakke wateren |
|
Elk netwerk 55 000
|
M31 |
Brak tot zoute wateren |
|
Elk netwerk 55 000
|
In Tekst box 1 is de opbouw van een training en de bijbehorende begrippen verder toegelicht.
Tekst Box 1 De opbouw van een training
Met het trainen van een neuraal netwerk wordt in eerste instantie het complete proces bedoeld waarmee het beste neuraal netwerk wordt bepaald dat gebruikt kan worden in de KRW-verkenner. Echter binnen deze training zitten onderliggende trainingen. Elke training (complete proces) bestaat namelijk uit herhalingen van een trainingscyclus. Binnen één trainingscyclus bestaat er ook weer een training van een netwerk. Deze training in de trainingscyclus bestaat uit maximaal 100 epochs (default). Een epoch is één training met meteen daaropvolgend de validatie van het getraind netwerk. In figuur 2.1 is een voorbeeld te zien van een performance grafiek van de training van een netwerk binnen een trainingscyclus. Te zien is dat voor elke epoch gekeken wordt naar de mean squared error (mse), de netwerkfout, van de traindata en validatiedata. In dit specifieke geval gaf de 7 e epoch de laagste mse voor de validatiedata. Als de mse de volgende zes epochs niet lager is (default), wordt dit netwerk gekozen als het beste netwerk uit deze trainingscyclus. Afhankelijk van de bijbehorende R 2 en RC wordt het netwerk wel of niet opgeslagen.
Figuur 2.1: Voorbeeld van een performance grafiek van de training van een neuraal netwerk.
Trainen, valideren en testen
Zoals al is aangegeven in paragraaf 2.1 is de dataset willekeurig verdeeld in 80% (train-) en 20% (test-)data. De 80% data is vervolgens voor elke trainingscyclus opnieuw willekeurig verdeeld in 80% voor de training en 20% voor de validatie. Tijdens de training worden de netwerkfout in de trainingset en de netwerkfout in de validatieset continu gecontroleerd. Beide fouten nemen tijdens de eerste fase van de training gewoonlijk af. Wanneer het netwerk zichzelf overtraint (‘overfitting’), zal de fout in de
validatieset meestal groter worden. De netwerkparameters worden dan vastgelegd op het minimum van de validatiefout.
De verdeling van de dataset in training + validatie (80%) en testen (20%) van de uiteindelijk vastgestelde neurale netwerken zijn vervolgens ook beschikbaar gesteld voor het trainen van de andere twee typen expertsystemen (PUNN’s bij Witteveen en Bos en regressieboomanalyses bij Planbureau voor de Leefomgeving). In deze datasets is de testset zoals eerder gesteld nog aangegeven met een ‘V’.
Voor een specifiek neuraal netwerk is telkens één trainingscyclus [4] ingezet. De cyclus is gericht op:
Dit houdt in dat na het bepalen van het netwerk met de laagste validatiefout de R 2 wordt berekend en vergeleken met de R 2 van het voorgaande beste netwerk. Als de R 2 beter is wordt ook de RC berekend en vergeleken met de RC van het voorgaande beste netwerk. Als de RC en dus ook de R 2 beter is wordt dit netwerk opgeslagen en de daarvoor gebruikte training- en validatieset bewaard. Tijdens de training van een netwerk wordt de trainingscyclus minimaal 11 000 en maximaal 55 000 keer herhaald afhankelijk van het watertype. Bij elke trainingscyclus wordt de dataset opnieuw willekeurig verdeeld in training- en validatiedata en de maximale R 2 en RC tot dan toe wordt meegenomen. Aan het eind van de training is het netwerk met de beste R 2 en RC opgeslagen. De daarbij behorende trainings- en validatiesets zijn daarna verstuurd aan de trainers van de andere twee expertsystemen.
Tabel 2.3 geeft een overzicht van de stuurfactoren die bij de training van de verschillende watertypen als invoerparameter zijn gebruikt.
Tabel 2.3: Watertypen en de gekozen hydromorfologische en chemische stuurvariabelen
Watertype
|
Langzaam stromende beken |
Snel stromende beken |
Diepe meren |
Ondiepe meren |
Kanalen en vaarten |
Sloten |
Zwak brakke wateren |
Brakke tot zoute wateren |
Stuurvariabele |
||||||||
Oeverinrichting |
|
|
X |
X |
X |
X |
X |
X |
Peildynamiek |
|
|
X |
X |
X |
X |
X |
X |
Onderhoud |
|
|
|
|
X |
X |
X |
X |
Connectiviteit |
|
|
|
|
|
|
X |
X |
Meandering |
X |
X |
|
|
|
|
|
|
Verstuwing |
X |
X |
|
|
|
|
|
|
Beschaduwing |
X |
X |
|
|
|
|
|
|
Scheepvaart |
|
|
|
|
X |
|
|
|
BZV |
X |
X |
|
|
|
|
|
|
Chloride zgem |
|
|
|
|
|
|
X |
X |
Totaal P zgem |
X |
X |
X |
X |
X |
X |
X |
X |
Totaal N zgem |
X |
X |
X |
X |
X |
X |
X |
X |
In tabel 2.4a-e worden de waarden van de stuurvariabelen per watertypencluster verder uitgewerkt naar klasse-indeling en eenheden.
Tabel 2.4a: Stuurvariabelen langzaam en snel stromende beken uitgesplitst naar hydromorfologische en chemische parameters
Hydromorfologische parameters |
Klassen |
Waarden en omschrijving |
Meandering [5] |
5 |
1=recht + normprofiel, 2=gestrekt + natuurlijker dwarsprofiel, 3=zwak slingerend, 4=slingerend, 5=vrij meanderend |
Verstuwing |
3 |
1=sterk gestuwd zonder vistrappen, 2=gestuwd met vistrappen, 3=ongestuwd |
Beschaduwing |
3 |
1=onbeschaduwd zonder ruigte op de oevers, 2=gedeeltelijk beschaduwd of ruigte op de oever en 3=grotendeels of geheel beschaduwd (opgaande begroeiing/bos) |
Chemische parameters |
Eenheid |
|
BZV* |
mg O 2 /l |
Zomergemiddelde (april-september), maat voor organische belasting |
Totaal P |
mg P/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
Totaal N |
mg N/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
* BZV is Biochemisch Zuurstofverbruik (maat voor de organische belasting van een water).
Tabel 2.4b: Stuurvariabelen zoete ondiepe en diepe meren uitgesplitst naar hydromorfologische en chemische parameters
Hydromorfologische parameters |
Klassen |
Waarden en omschrijving |
Oeverinrichting |
3 |
1=beschoeid of steil en onbegroeid, 2=riet/helofyten, 3=moeras+riet/helofyten |
Peildynamiek |
3 |
1=tegennatuurlijk, 2=stabiel, 3=natuurlijk |
Chemische parameters |
Eenheid |
|
Totaal P |
mg P/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
Totaal N |
mg N/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
Tabel 2.4c: Stuurvariabelen kanalen uitgesplitst naar hydromorfologische en chemische parameters
Hydromorfologische parameters |
Klassen |
Waarden en omschrijving |
Oeverinrichting |
3 |
1=beschoeid, 2=steil, 3=flauw/moerassig (NVO*) |
Peildynamiek |
3 |
1=tegennatuurlijk, 2=stabiel, 3=natuurlijk |
Onderhoud [6] |
2 |
1=intensief, 2=extensief |
Scheepvaart |
2 |
1=intensief bevaren, 2 niet of nauwelijks bevaren |
Chemische parameters |
Eenheid |
|
Totaal P |
mg P/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
Totaal N |
mg N/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
* NVO staat voor Natuurvriendelijke oevers.
Tabel 2.4d: Stuurvariabelen sloten uitgesplitst naar hydromorfologische en chemische parameters
Hydromorfologische parameters |
Klassen |
Waarden en omschrijving |
Oeverinrichting |
3 |
1=beschoeid, 2=steil, 3=flauw/moerassig (NVO*) |
Peildynamiek |
3 |
1=tegennatuurlijk, 2=stabiel, 3=natuurlijk |
Onderhoud |
2 |
1=intensief, 2=extensief |
Chemische parameters |
Eenheid |
|
Totaal P |
mg P/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
Totaal N |
mg N/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
* NVO staat voor Natuurvriendelijke oevers.
Tabel 2.4e: Stuurvariabelen zwak brakke en brakke tot zoute wateren uitgesplitst in hydromorfologische en chemische parameters
Hydromorfologische parameters |
Klassen |
Waarden en omschrijving |
Oeverinrichting |
3 |
1=beschoeid, 2=steil, 3=flauw/moerassig (NVO*) |
Peildynamiek |
3 |
1=tegennatuurlijk, 2=stabiel, 3=natuurlijk |
Onderhoud |
2 |
1=intensief, 2=extensief |
Connectiviteit |
3 |
1=geïsoleerd, 2=periodiek geïsoleerd, 3=open verbinding |
Chemische parameters |
Eenheid |
|
Chloride gehalte |
mg Cl/l |
Zomergemiddelde (april-september), maat voor verzoeting |
Totaal P |
mg P/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
Totaal N |
mg N/l |
Zomergemiddelde (april-september), maat voor eutrofiëring |
* NVO staat voor Natuurvriendelijke oevers.
Hierna wordt in tabel 3.1 een samenvatting gegeven van de resultaten van de netwerktrainingen voor de kwaliteitselementen van de verschillende watertypen.
Naast determinatiecoëfficiënt R 2 en richtingscoëfficiënt RC zijn in de tabel opgenomen:
In deze formule staat y
i
voor de gemeten EKR en
voor de met het expertsysteem voorspelde EKR in water i. Bij een perfecte voorspelling geldt dat de RMSE-waarde gelijk is aan nul.
Met ‘var(y i )’ de variantie van de metingen in de testset.
Voor de gedetailleerde resultaten van de getrainde netwerken voor de verschillende watertypen wordt verwezen naar bijlagen 1 t/m 8.
De EEE4-resultaten zijn vergelijkbaar tot beter dan die van EEE3 (tabel 3.1). Zowel de R 2 als de RC is in alle gevallen verbeterd of zo goed als gelijk gebleven (-0.01 tot -0.06 afname). De RMSE is in alle gevallen kleiner geworden en het percentage binnen 0.1 is op twee netwerken na (-1 en -3 afname) gelijk gebleven of toegenomen met zelfs een toename van 24%. De CoD is heel wisselend met verschillen tussen de -0.48 en +0.45. De resultaten van beide EEE-versies zijn statistisch niet verder met elkaar vergeleken. We bevelen aan om dit weer gecombineerd voor alle drie de rekentools uit te voeren.
De met deze netwerken gecompileerde executable EEE4.exe dient als invoer een inputdata.csv bestand te hebben zoals weergegeven in tabel 3.2.
De beide uitvoerbestanden van deze EEE4 tool – outputdata.csv en outliers.csv - zijn weergegeven in tabel 3.3 en 3.4.
Tabel 3.1: Statistische kenmerken van getrainde neurale netwerken voor de verschillende watertypen tussen () waarden van EEE3
Watertype |
Kwaliteitselementen |
Trainingset |
Testset |
|||
|
|
R 2 |
RC |
RMSE |
% afwijking EKR < 0.1 |
CoD |
Langzaam stromende beken |
Overige waterflora |
0.81 (0.81) |
0.81 (0.83) |
0.063 (0.066) |
88 (88) |
0.71 (0.56) |
Macrofauna |
0.91 (0.88) |
0.91 (0.91) |
0.052 (0.060) |
96 (91) |
0.54 (0.74) |
|
Vissen |
0.89 (0.87) |
0.88 (0.91) |
0.059 (0.061) |
91 (90) |
0.50 (0.84) |
|
Snel stromende beken |
Overige waterflora |
0.92 (0.91) |
0.89 (0.95) |
0.058 (0.063) |
93 (87) |
0.82 (0.76) |
Macrofauna |
0.81 (0.75) |
0.78 (0.75) |
0.094 (0.104) |
67 (68) |
0.51 (0.60) |
|
Vissen |
0.88 (0.82) |
0.88 (0.82) |
0.066 (0.093) |
90 (72) |
0.67 (0.84) |
|
Diepe meren |
Fytoplankton |
0.82 (0.66) |
0.83 (0.64) |
0.108 (0.158) |
56 (54) |
0.48 (-0.06) |
Overige waterflora |
0.93 (0.87) |
0.92 (0.87) |
0.040 (0.081) |
99 (75) |
0.50 (0.56) |
|
Macrofauna |
0.92 (0.86) |
0.92 (0.88) |
0.048 (0.068) |
94 (89) |
0.50 (0.56) |
|
Vissen |
0.91 (0.85) |
0.91 (0.89) |
0.062 (0.071) |
87 (85) |
0.21 (0.69) |
|
Ondiepe meren |
Fytoplankton |
0.87 (0.78) |
0.86 (0.77) |
0.097 (0.117) |
65 (61) |
0.65 (0.64) |
Overige waterflora |
0.90 (0.84) |
0.90 (0.85) |
0.068 (0.086) |
85 (79) |
0.76 (0.42) |
|
Macrofauna |
0.81 (0.73) |
0.78 (0.75) |
0.074 (0.089) |
81 (72) |
0.44 (0.57) |
|
Vissen |
0.87 (0.83) |
0.84 (0.87) |
0.077 (0.086) |
81 (75) |
0.57 (0.35) |
|
Kanalen |
Fytoplankton |
0.86 (0.86) |
0.86 (0.86) |
0.066 (0.076) |
85 (82) |
0.69 (0.64) |
Overige waterflora |
0.77 (0.68) |
0.78 (0.75) |
0.081 (0.099) |
74 (67) |
0.02 (-0.21) |
|
Macrofauna |
0.80 (0.78) |
0.80 (0.78) |
0.083 (0.090) |
73 (72) |
0.62 (0.27) |
|
Vissen |
0.85 (0.81) |
0.86 (0.81) |
0.067 (0.070) |
89 (86) |
0.68 (0.23) |
|
Sloten |
Overige waterflora |
0.88 (0.79) |
0.92 (0.76) |
0.067 (0.089) |
87 (73) |
0.63 (0.49) |
Macrofauna |
0.78 (0.77) |
0.78 (0.79) |
0.089 (0.093) |
70 (69) |
0.57 (0.49) |
|
Vissen |
0.90 (0.89) |
0.90 (0.91) |
0.056 (0.057) |
90 (93) |
0.79 (0.71) |
|
Zwak brakke wateren |
Fytoplankton |
0.88 (0.70) |
0.86 (0.79) |
0.077 (0.119) |
81 (72) |
0.02 (-0.18) |
Overige waterflora |
0.90 (0.81) |
0.92 (0.84) |
0.066 (0.084) |
84 (81) |
0.33 (0.55) |
|
Macrofauna |
0.77 (0.66) |
0.77 (0.68) |
0.068 (0.104) |
83 (75) |
0.00 (0.06) |
|
Vissen |
0.88 (0.71) |
0.87 (0.79) |
0.059 (0.091) |
90 (77) |
0.00 (0.35) |
|
Brak tot zoute wateren |
Fytoplankton |
0.85 (0.74) |
0.85 (0.82) |
0.064 (0.100) |
84 (67) |
0.45 (-0.13) |
Overige waterflora |
0.90 (0.84) |
0.93 (0.88) |
0.052 (0.063) |
91 (88) |
0.35 (0.45) |
|
Macrofauna |
0.76 (0.68) |
0.73 (0.70) |
0.109 (0.123) |
60 (58) |
0.36 (0.40) |
|
Vissen |
0.88 (0.68) |
0.88 (0.75) |
0.055 (0.086) |
92 (83) |
0.35 (0.36) |
Tabel 3.2: Voorbeeld van invoerbestand EEE4
Tabel 3.3: Voorbeeld van uitvoerbestand outputdata.csv
Tabel 3.4: Voorbeeld van uitvoerbestand outliers.csv
Neurale netwerken (EEE4) voor watertypen R4 R5 R6 R12 Langzaam stromende beken
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Overige waterflora |
Macrofauna |
Vissen |
COD testset |
Coëfficiënt of determination 1 |
0.71 |
0.54 |
0.50 |
R |
Correlatie coëfficiënt |
0.90 |
0.96 |
0.95 |
R2 |
Kwadraat corr. coeff. |
0.81 |
0.91 |
0.89 |
RC |
Richtingscoëfficiënt regressielijn |
0.81 |
0.91 |
0.88 |
Std RC |
Standaard afwijking van RC |
0.011 |
0.011 |
0.018 |
Int |
Intercept van regressielijn |
0.09 |
0.03 |
0.03 |
ME |
Gemiddelde fout |
0.000 |
0.000 |
0.001 |
MSE |
Gemiddelde van gekwadrateerde fouten |
0.004 |
0.003 |
0.004 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.063 |
0.052 |
0.059 |
% binnen 0,1 EKR |
|
88 |
96 |
91 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
Neurale netwerken (EEE4) voor watertypen R13 R14 R15 R17 R18 Snelstromende beken
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Overige waterflora |
Macrofauna |
Vissen |
COD test set |
Coëfficiënt of de termination 1 |
0.82 |
0.51 |
0.67 |
R |
Correlatie coëfficiënt |
0.96 |
0.90 |
0.94 |
R2 |
Kwadraat corr. coeff. |
0.92 |
0.81 |
0.88 |
RC |
Richtingscoëfficiënt regressielijn |
0.89 |
0.78 |
0.88 |
Std RC |
Standaard afwijking van RC |
0.011 |
0.016 |
0.016 |
Int |
Intercept van regressielijn |
0.046 |
0.11 |
0.034 |
ME |
Gemiddelde fout |
0.000 |
-0.004 |
-0.003 |
MSE |
Gemiddelde van gekwadrateerde fouten |
0.003 |
0.009 |
0.004 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.058 |
0.094 |
0.066 |
% binnen 0,1 EKR |
|
93 |
67 |
90 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
Neurale netwerken (EEE4) voor watertypen M16 en M20 Diepe meren
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Fytoplankton |
Overige waterflora |
Macrofauna |
Vissen |
COD test set |
Coëfficiënt of determination 1 |
0.48 |
0.50 |
0.50 |
0.21 |
R |
Correlatie coëfficiënt |
0.91 |
0.96 |
0.96 |
0.95 |
R2 |
Kwadraat corr. coeff. |
0.82 |
0.93 |
0.92 |
0.91 |
RC |
Richtingscoëfficiënt regressielijn |
0.83 |
0.92 |
0.92 |
0.91 |
Std RC |
Standaard afwijking van RC |
0.019 |
0.010 |
0.011 |
0.016 |
Int |
Intercept van regressielijn |
0.100 |
0.030 |
0.040 |
0.035 |
ME |
Gemiddelde fout |
0.000 |
0.000 |
0.000 |
0.000 |
MSE |
Gemiddelde van gekwadrateerde fouten |
0.012 |
0.002 |
0.002 |
0.004 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.108 |
0.040 |
0.048 |
0.062 |
% binnen 0,1 EKR |
|
56 |
99 |
94 |
87 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
Neurale netwerken (EEE4) voor watertypen M14 M23 en M27 Ondiepe meren
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Fytoplankton |
Overige waterflora |
Macrofauna |
Vissen |
COD test set |
Coëfficiënt of determination 1 |
0.65 |
0.76 |
0.44 |
0.57 |
R |
Correlatie coëfficiënt |
0.93 |
0.95 |
0.90 |
0.93 |
R2 |
Kwadraat corr coeff |
0.87 |
0.90 |
0.81 |
0.87 |
RC |
Richtingscoëfficiënt regressielijn |
0.86 |
0.90 |
0.78 |
0.84 |
Std RC |
Standaard afwijking van RC |
0.016 |
0.012 |
0.013 |
0.014 |
Int |
Intercept van regressielijn |
0.063 |
0.045 |
0.100 |
0.062 |
ME |
Gemiddelde fout |
-0.002 |
0.000 |
-0.004 |
-0.007 |
MSE |
Gemiddelde van gekwadrateerde fouten |
0.010 |
0.005 |
0.006 |
0.006 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.097 |
0.068 |
0.074 |
0.077 |
% binnen 0,1 EKR |
|
65 |
85 |
81 |
81 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
Neurale netwerken (EEE4) voor watertypen M3 M6ab M7ab en M10 Kanalen
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Fytoplankton |
Overige waterflora |
Macrofauna |
Vissen |
COD testset |
Coëfficiënt of determination 1 |
0.69 |
0.02 |
0.62 |
0.68 |
R |
Correlatie coëfficiënt |
0.93 |
0.88 |
0.90 |
0.92 |
R2 |
Kwadraat corr coeff |
0.86 |
0.77 |
0.80 |
0.85 |
RC |
Richtingscoëfficiënt regressielijn |
0.86 |
0.78 |
0.80 |
0.86 |
Std RC |
Standaard afwijking van RC |
0.011 |
0.018 |
0.015 |
0.011 |
Int |
Intercept van regressielijn |
0.072 |
0.067 |
0.088 |
0.070 |
ME |
Gemiddelde fout |
-0.002 |
-0.016 |
-0.001 |
0.001 |
MSE |
Gemiddelde van gekwadrateerde fouten |
0.004 |
0.006 |
0.007 |
0.004 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.066 |
0.081 |
0.083 |
0.067 |
% binnen 0,1 EKR |
|
85 |
74 |
73 |
89 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
Neurale netwerken (EEE4) voor watertypen M01 M02 M08 Sloten
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Overige waterflora |
Macrofauna |
Vissen |
COD testset |
Coëfficiënt of determination 1 |
0.63 |
0.57 |
0.79 |
R |
Correlatie coëfficiënt |
0.94 |
0.88 |
0.95 |
R2 |
Kwadraat corr coeff |
0.88 |
0.78 |
0.90 |
RC |
Richtingscoëfficiënt Regressielijn |
0.92 |
0.78 |
0.90 |
Std RC |
Standaard afwijking van RC |
0.015 |
0.017 |
0.009 |
Int |
Intercept van regressielijn |
0.026 |
0.100 |
0.053 |
ME |
Gemiddelde fout |
-0.004 |
0.005 |
0.000 |
MSE |
Gemiddelde van gekwadrateerde fouten |
0.004 |
0.008 |
0.003 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.067 |
0.089 |
0.056 |
% binnen 0,1 EKR |
|
87 |
70 |
90 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
Neurale netwerken (EEE4) voor watertype M30 Zwak brakke wateren
(R2010b)
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Fytoplankton |
Overige waterflora |
Macrofauna |
Vissen |
COD testset |
Coëfficiënt of determination 1 |
0.02 |
0.33 |
0.00 |
0.00 |
R |
Correlatie coëfficiënt |
0.94 |
0.95 |
0.88 |
0.94 |
R2 |
Kwadraat corr. coeff. |
0.88 |
0.90 |
0.77 |
0.88 |
RC |
Richtingscoëfficiënt regressielijn |
0.86 |
0.92 |
0.77 |
0.87 |
Std RC |
Standaard afwijking van RC |
0.013 |
0.017 |
0 .013 |
0.013 |
Int |
Intercept van regressielijn |
0.061 |
0.020 |
0.100 |
0.040 |
ME |
Gemiddelde fout |
-0.003 |
-0.004 |
-0.001 |
-0.006 |
MSE |
Gemiddelde van gekwadrateerde fouten |
0.006 |
0.004 |
0.005 |
0.003 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.077 |
0.066 |
0.068 |
0.059 |
% binnen 0,1 EKR |
|
81 |
84 |
83 |
90 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
Neurale netwerken (EEE4) voor watertype M31 Brak zoute wateren
Resultaat neuraal netwerk op trainingset
Resultaat neuraal netwerk op validatieset
Resultaat neuraal netwerk op testset
Gevoeligheid voor verandering stuurfactoren
Statistische gegevens
Parameter |
Betekenis |
Fytoplankton |
Overige waterflora |
Macrofauna |
Vissen |
COD testset |
Coëfficiënt of determination 1 |
0.45 |
0.35 |
0.36 |
0.35 |
R |
Correlatie coëfficiënt |
0.92 |
0.95 |
0.87 |
0.94 |
R2 |
Kwadraat corr coeff |
0.85 |
0.90 |
0.76 |
0.88 |
RC |
Richtingscoëfficiënt regressielijn |
0.85 |
0.93 |
0.73 |
0.88 |
Std RC |
Standaard afwijking van RC |
0.012 |
0.011 |
0.018 |
0.011 |
Int |
Intercept van regressielijn |
0.067 |
0.028 |
0.13 |
0.045 |
ME |
Gemiddelde fout |
0.012 |
0.011 |
0.018 |
0.011 |
MSE |
Gemiddelde van gekwadrateerde fouten |
-0.002 |
0.000 |
-0.012 |
-0.007 |
RMSE |
Standaard deviatie (wortel van MSE) |
0.004 |
0.003 |
0.012 |
0.003 |
% binnen 0,1 EKR |
|
84 |
91 |
60 |
92 |
1 COD is een maat voor de voorspellingswaarde van een ANN. Waarde dient groter te zijn dan 0 en zo dicht mogelijk bij 1 te liggen.
[1] Rapport ‘ Verdere ontwikkeling Expertsysteem Ecologische Effecten en evaluatie gebruik in de Ex ante evaluatie KRW’, voor Planbureau voor de Leefomgeving, Royal Haskoning, 16 april 2009.
[2] Rapport ‘Verbetering kennisregels ecologische effecten ten behoeve van de KRW-verkenner’, voor STOWA, Royal HaskoningDHV, 6 februari 2013.
[3] Werd bij EEE3 validatie genoemd, maar dit was eigenlijk het testen. Nu wordt het ook testen genoemd in het rapport, maar de V komt nog van Validatie in de opgeleverde sets (zodat die overeenkomen met de vorige versie). Zie ook paragraaf 2.3.
[4] Bij het trainen van EEE3 was dit opgesplitst in 2 cycli. Echter, tijdens het updaten van de scripts bleek het efficiënter om dit te combineren in één cyclus.
[5] De mate van meandering wordt uitgedrukt in sinuositeit. Sinuositeit is de lengte van de beek gedeeld door de lengte van het stroomdal. Op basis van sinuositeit kunnen 5 klassen in meandering worden onderscheiden, te weten: 1. Recht (sinuositeit 1), 2. Gestrekt (sinuositeit 1.01-1.05), 3. Zwak slingerend (sinuositeit 1.06-1.25), 4. Slingerend (sinuositeit 1.26-1.5), 5. Meanderend (sinuositeit >1.5).
[6] De mate van intensiteit van het onderhoud was meestal alleen kwalitatief beschikbaar. Wanneer als KRW maatregel extensief onderhoud is opgenomen, is aangenomen dat het in de huidige situatie intensief is.