Hybridní dlouhodobá krátkodobá paměť s algoritmem optimalizace velryb a rozkladem variačního režimu pro měsíční odhad evapotranspirace
Nov 17, 2023
Udržitelnost umělé vegetace vázající písek je určena vodní bilancí mezi evapotranspirací (ET) a srážkami v pouštních oblastech. V důsledku toho je přesný odhad ET kritickým předpokladem pro určení typů a prostorového rozložení umělé vegetace indiferentních písčitých oblastí. Pro tento účel byl navržen nový hybridní model odhadu pro odhad měsíčního ET spojením hlubokého učení dlouhodobé krátkodobé paměti (LSTM) s variačním modedecomposition (VMD) a algoritmem optimalizace velryb (WOA) (tj. VMD-WOA-LSTM) s odhadnout měsíční ET na jihovýchodním okraji pouště Tengger.
V posledních letech mnoho zpráv o mimozemšťanech a UFO vzbudilo v lidech nejen zvědavost a nadšení, ale také v lidech vzbudilo obdiv a touhu prozkoumat mimozemský život.
Jedním z témat, které přitahovalo velkou pozornost, je úroveň inteligence mimozemšťanů. Mnoho lidí věří, že mimozemšťané mají inteligenci, která daleko převyšuje inteligenci lidí, a tato myšlenka byla široce rozšířena ve sci-fi románech a filmech. Jsou ale mimozemšťané inteligentnější než lidé? Pokud ano, budou mít silnější vzpomínky?
Za prvé, musíme přiznat, že náš koncept mimozemské inteligence je stále velmi povrchní. Nemůžeme si být jisti, zda jsou nám mimozemšťané podobní v inteligenci, natož zda jsou lepší než my. Vztah mezi pamětí a inteligencí však můžeme jednoduše přemýšlet a odhadovat z lidské perspektivy.
Z lidské perspektivy víme, že existuje korelace mezi inteligencí a pamětí. Lidé s vyšší inteligencí mají obecně lepší paměť. Je to proto, že lidé s vysokou úrovní inteligence věnují více pozornosti myšlení a logickému uvažování a pravděpodobněji integrují a spojují informace prostřednictvím různých korelačních metod. Tento způsob myšlení pomáhá zlepšit paměť. Existuje tedy korelace mezi úrovní inteligence výkonu mozku a pamětí.
Tuto korelaci bychom však neměli jednoduše aplikovat na mimozemšťany. Protože si nemůžeme být jisti, zda je struktura inteligence a mozková struktura mimozemšťanů podobná lidem. Mimozemšťané mohou mít jiné inteligenční struktury a paměťové struktury než lidé, takže vztah mezi jejich inteligencí a pamětí může být velmi odlišný.
Konečně bychom si měli být jisti, že objev mimozemského života bude mít velký dopad na rozvoj lidské vědy a filozofie. Výzkum mimozemské inteligence a paměti musí být také veden na vědeckém základě. Doufáme, že s neustálým rozvojem vědy a techniky budou lidé schopni prozkoumat více mimozemského života a pokračovat v postupu v procesu řešení svých záhad a zkoumání pravdy vesmíru. Je vidět, že potřebujeme zlepšit paměť a Cistanche deserticola může výrazně zlepšit paměť, protože Cistanche deserticola je tradiční čínský léčivý materiál, který má mnoho jedinečných účinků, jedním z nich je zlepšení paměti. Účinnost mletého masa vychází z různých účinných látek, které obsahuje, včetně kyselin, polysacharidů, flavonoidů atd. Tyto složky mohou různými způsoby podporovat zdraví mozku.

Klikněte na možnost poznat způsoby, jak zlepšit funkci mozku
Převaha LSTM byla vybrána díky své schopnosti automaticky extrahovat nelineární a nestacionární vlastnosti ze sekvenčních dat, WOA byla použita k optimalizaci hyperparametrů LSTM a VMD byla použita k extrakci vnitřních vlastností ET časových řad. Odhadované výsledky VMD-WOA-LSTM byly porovnány se skutečným ET a odhadem jiných hybridních modelů z hlediska standardních výkonnostních metrik. Výsledky ukázaly, že VMD-WOA-LSTM poskytuje přesnější a spolehlivější výsledky odhadů než LSTM, podpůrný vektorový stroj (SVM) a varianty těchto modelů. Proto lze VMD-WOALSTM doporučit jako základní pomocnou metodu pro odhad ET v pouštních oblastech.
Evapotranspirace (ET) je vysoce nelineární fyzikální a biologický proces, který propojuje ekologické a hydrologické procesy vodní bilancí1,2. Je ústřední složkou regionální vodní a energetické bilance a slouží jako významné spojení v systému půda–rostlina–atmosféra (SPA)3. Přesný odhad ET je kritickým předpokladem environmentálního managementu4–6, zejména v pouštních oblastech s velkými plochami umělé vegetace vázající písek, kde je udržitelnost umělé vegetace vázající písek určována vodní rovnováhou mezi ET a srážkami5,7. Kromě toho změna klimatu, zejména změny v oteplování a srážkových vzorcích, budou mít nevyhnutelně hluboký dopad na udržitelnost umělé vegetace7,8.
Na rozdíl od přirozené vegetace je umělá vegetace vázající písek založena se speciálním účelem a funkcí, přesný odhad ET může poskytnout referenci pro pochopení vodní bilance a určení složení, struktury, prostorového rozložení a rozsahu umělé vegetace vázající písek v pouštní oblasti9,10.Avšak aplikace fyzikálně založených metod (např. Priestley-Taylorova metoda, Hargreavesova metoda, korigovaná FAO-24 Penmanova metoda, FAO-56 Penman-Monteithova metoda atd.) je silně omezeno kvůli nedostatku požadovaných meteorologických parametrů (např. latentní výparné teplo, sluneční záření, relativní vlhkost, teplota vzduchu atd.) v pouštních oblastech4,6,2–12. Proto je vysoce žádoucí konstruovat jiné typy datově řízených modelů pro získání přesných výsledků odhadů.
V poslední době jsou modely strojového učení (ML), včetně neuronových sítí se zpětnou propagací (BPNN)13, vícevrstvého perceptronu (MLP)2, vícevrstvých umělých neuronových sítí (MLNN)6, podpůrného vektorového stroje (SVM)7,12, stroje pro extrémní učení (ELM) 6, modelový strom (MT)14,15, náhodný les (RF)6, vlnkové neuronové sítě (WNN)16, funkce radiální báze (RBF)17 atd., byly dramaticky použity k odhadu odpařování nebo ET způsobených na jeho schopnost automatického učení funkcí a nevyžaduje žádné předpoklady. Protože ML modely mají vady, že se hyperparametry samy o sobě obtížně upravují, což výrazně snižuje přesnost výpočtu. K překonání nedostatků modelů ML se používají meta-heuristické algoritmy, jako je algoritmus opylování květin (FPA)6, algoritmus světlušek (FFA)11, algoritmus inteligentních vodních kapek (IWD)12, algoritmus optimalizace velryb (WOA)18, algoritmus optimalizace šedého vlka (algoritmus pro optimalizaci šedého vlka GWO)19,20 atd. byly použity ke stanovení optimálních hyperparametrů ML modelů. Studie ukázaly, že modely ML spojené s metaheuristickými algoritmy mají vyšší výpočetní výkon než jednotlivé modely ML a fyzikálně založené metody12,16,18,21,22.
Protože ET je úzce ovlivněný meteorologickými parametry, vlhkostí půdy a vegetačními znaky12, naměřená časová řada ET nabývá mnoha ostrých a kolísavých bodů, což významně snižuje přesnost odhadu12. Pro získání věrohodnějších výsledků odhadu byly k rozkladu použity techniky předběžného zpracování dat, včetně diskrétní vlnové transformace (DWT)23, dekompozice v empirickém režimu (EEMD)14,15 a dekompozice ve variačním režimu (VMD)7,24 atd. ET frekvenci časových řad do různých složek a získat požadované informace na více úrovních7,14,23,24. Přehled literatury ukazuje, že techniky předběžného zpracování dat hybridizované s modely ML mohou významně zlepšit výkonnost modelu16,25. V tomto ohledu Gocićet al.22 spojil SVM s DWT a algoritmem světlušky (FFA) pro odhad referenční ET v Srbsku, kde byla FFA použita k určení hyperparametrů SVM. Výsledky ukazují, že DWT-FFA-SVM je nejlepší metodou odhadu pro referenční odhad ET. Pammar a Deka[24]navrhli hybridní DWT-SVM k odhadu denního odpařování v Karnatace v Indii. Výsledky také potvrzují, že SVM v kombinaci s DWT může zlepšit přesnost odhadu. Rezaie-Balf et al.15 integrovali EEMD s SVM a modelovým stromem M5 (M5T), aby samostatně odhadli měsíční modely odpařování na stanici Siirt a stanici Diyarbakir v turečtině a navrhované modely vykazovaly mnohem vyšší přesnost. Fu et al.7 navrhli hybridní modely kombinováním DWT, EEMD a VMD s SVM a GWO-SVM odděleně pro odhad měsíčního ET. Výsledky ukázaly, že VMD a DWT vykazovaly lepší výkon předzpracování než EEMD a přesnost odhadu VMDGWO-SVM byla vyšší než u DWT-GWO-SVM a EEMD-GWO-SVM.
Předchozí práce jsou zaměřeny především na použití mělkých modelů ML k odhadu ET2,4,6,7,2–18,21–23. Je dobře známo, že mělké ML modely mají nevýhody, které nedokážou dostatečně extrahovat skryté nelineární a nestatické rysy z časových řad ET25. K odhadu ET nebo vypařování na základě omezených meteorologických údajů byly tedy použity dlouhá krátkodobá paměť (LSTM)3,26, hluboká neuronová síť (DNN)27, temporální konvoluční neuronová síť (TCN)27 a rekurentní neuronová síť (RNN)28. data. Majhi et al.3 použili LSTM, MLNN, Hargreavesův vzorec a Blaney-Criddleův vzorec k odhadu denního pan evaporation státu Chhattisgarh v Indii. Výsledky naznačují, že LSTM může dosáhnout přesného odhadu evapotranspirace a má lepší odhad než jiné modely. . Chen et al.27 odhadli denní referenční ET v severovýchodní pláni Číny pomocí LSTM, DNN, TCN, SVM, RF, Hargreavesova modelu, Ritchieho metody, Priestley-Talorova modelu, Makkinkova vzorce, Romanenkova modelu a Schendelova vzorce. Výsledky ukazují, že LSTM, TCN a DNN mají při absenci meteorologických parametrů lepší odhady než mělké modely ML a empirické modely. Granata a Di Nunno28 použili LSTM a NARX k odhadu ET Cypress Swamp a Kobeh Valley v USA. Výsledky ukazují, že modely hlubokého učení mají vyšší přesnost než mělké modely ML díky vysoké hierarchické struktuře.
Hyperparametry ML modelů přímo určují výpočetní přesnost, ale m. Přesto většina modelů neumí sama o sobě optimální hyperparametry a LSTM není výjimkou. Hyperparametry LSTM, včetně počtu skrytých vrstev (HL), počtu skrytých jednotek (HU), epoch a rychlosti učení (LR)26, významně ovlivňují odhadovaný výkon LSTM. Podle nejlepšího vědomí autorů je však použití LSTM ve spojení s metaheuristickými algoritmy pro odhad vypařování nebo ET velmi minimální.
Studijní oblast a data
Výzkum byl proveden na jihovýchodním okraji pouště Tengger (37° 32'N, 105° 02'E). Primárním typem krajiny jsou hustě rozmístěné mřížovinové duny9,10. Aby se předešlo škodám písečných bouří na Baotou-Lanzhourailway, Čínská akademie věd a příslušné jednotky železnic zřídily v roce 1956a uměle znovu vegetované pásy a rozšířily je v letech 1964a, 1981a a 1987a. Na mobilní dunu byla instalována mechanická písková zábrana kolmo na směr hlavního větru, za mechanickou pískovou zábranou byly osazeny slaměné šachovnice (rozteč 1 m × 1 m) a dvouleté sazenice xerických keřů byly vysazeny ve stejné konfiguraci opuštěným způsobem. rozteč rostlin a rozteč řádků 1 m × 2 m nebo 2 m × 3 m pod podmínkou bez zavlažování. Po více než půlstoletí po sobě se počet přírodních druhů rostlin zvýšil z 25 na 453 a vegetační pokryv se zvýšil z méně než 1 % na 42,3 %. Postupně se vytvořila biologická fixační zóna větrolamu o délce 16 km a šířce 200-1000 m. Umělá vegetace vázající písek založená v různých letech (1956a, 1964a, 1981a a 1987a) je rozmístěna na obou stranách železnice paralelně, což úspěšně zamezilo poškozování železniční dopravy navátým pískem a výrazně zlepšilo ekologické prostředí. studijní oblasti. Vzhledem k tomu, že stabilita a udržitelnost vegetace závisí na vodní bilanci mezi ET a srážkami7,9,10, má velký teoretický a praktický význam přesně odhadnout ET pro ochranu a využití umělé vegetace vázající písek7,10.

V této studii byla měsíční ET data naměřená od ledna 1991 do prosince 2018, data od ledna 1991 do prosince 2010 považována za trénovací soubor a zbytek byl použit jako testovací soubor. Tabulka 1 ukazuje hlavní statistické metriky měsíčních ET časových řad ve zkoumané oblasti.
Metodologie
Rámec navrhovaných modelů. LSTM je nová neuronová síť s časovým cyklem, která dokáže překonat problém mizení gradientu v RNN přidáním řetězové formy opakujících se modulů neuronové sítě do úložiště relevantních informací25,26. Využívá pracovní princip „dva dovnitř a dva ven“ k vyřešení problému dlouhodobé závislosti26. V této studii byl LSTM vybrán jako hlavní modul pro odhad měsíčního ET duo a LSTM má vynikající schopnost řešit nelineární vzory v časových řadách27,28. Kromě toho byl SVM také použit k odhadu ET, protože SVM má lepší adaptabilitu pro řešení širší třídy nelineárních problémů s přizpůsobením (např. odhad ET) než u jiných mělkých modelů ML (např. BPNN, WNN, ELM, MT a MLP). 29.

Protože DWT je citlivý na vlnkovou bázi a práh, EMD trpí vnitřní nevýhodou modemixingu7,24 a EEMD má koncové efekty7. VMD je robustnější a adaptivnější metoda předběžného zpracování dat než DWT, EMD a EEMD24, účinně překonává nedostatky těchto metod a extrahuje hlavní variační rysy z nepravidelných a nestacionárních časových řad24. V této studii byl VMD použit k extrakci hlavních variačních rysů ze souboru dat ET. Pro srovnání odšumovacího výkonu VMD byl jako referenční vybrán DWT. Výstup časových řad DWT, VMD a shromážděných ET časových řad byl rozdělen do trénovacích sad a testovacích sad a přiváděn do ML modelů pro odhad ET, resp.
Pro zlepšení efektivity tréninku ML modelů byla k normalizaci vstupních a výstupních datových souborů použita metoda min–max normalizace7,22. Vstupní a výstupní sady SVM a LSTM byly určeny metodou longitudinální selekce (LS)7, konkrétně skupina trénovacích vzorků je reprezentována vektorem od I do k − q, trénovací výstup je označen jako vektor z I + d − 1 až k − q, testovací výstupní vektor je reprezentován vektorem od k − q + 1 do k, kde i, d, k a q označují počáteční bod, vstupní rozměr, velikost dat sadu, respektive délku testovacího výstupu. Obrázek 1 ukazuje schematický diagram metody LS s i=1, d=3 a k=336.

WOA je nový účinný a stabilní metaheuristický algoritmus18, který byl široce používán k řešení problémů nelinearoptimizace, včetně optimalizace hyperparametrů mělkých modelů ML pro odhad odpařování nebo ET. Žádný výzkumník však nenavrhl hybridní model spojením LSTM s meta-heuristickými goritmy pro odhad ET. WOA byl tedy použit k optimalizaci hyperparametrů LSTM pro získání přesnějších odhadovaných výsledků. Obrázek 2 ukazuje vývojový diagram WOA-LSTM. WOA-LSTM spojený s VMD je označen jako VMD-WOA-LSTM.
Převaha VMD-WOA-LSTM byla testována porovnáním odhadovaného výkonu s LSTM,SVM, DWT-LSTM, DWT-SVM, VMD-LSTM, VMD-SVM, WOA-LSTM, GWO-SVM, DWT-WOA-LSTM, DWT-GWO-SVM a VMD-GWO-SVM, kde GWO-SVM ukazuje, že nejlepší C a G SVM byly určeny pomocí algoritmu GWO, Obr. 3 ukazuje vývojové diagramy GWO-SVM. V numerických simulačních procesech byla jako fitness funkce použita střední absolutní procentuální chyba (MAPE) ke stanovení optimálních hyperparametrů ML modelů. Je třeba poznamenat, že matematické principy metod použitých v tomto článku, včetně DWT, VMD, SVM, LSTM, GWO a WOA, lze nalézt v příslušné literatuře, takže matematický popis těchto metod je vynechán.
Metriky pro hodnocení výkonu. Analýza chyb se provádí pomocí vyhodnocovacích metrik, včetně střední absolutní chyby (MAE), MAPE, normalizované střední kvadratické chyby (NMSE), střední kvadratické chyby (RMSE) a Nash-Sutcliffeova koeficientu účinnosti (NSCE). Definice těchto hodnotících metrik jsou následující:
kde yi a yi označují požadovaný a odhadovaný výsledek. MAE, MAPE, NMSE a RMSE se obecně používají k měření odchylky mezi požadovaným a odhadovaným výsledkem, výkon odhadu je lepší, když jsou hodnoty těchto hodnoticích metrik menší. Vzhledem k tomu, že MAPE je mezi těmito kritérii relativně stabilnější, NSCE se obecně používá k určení účinnosti modelu v hydrologické oblasti (NSCE blízko 1 znamená, že navrhovaný model má dobrou vhodnost). Proto byly MAPE a NSCE vybrány jako hlavní měřítka pro hodnocení výkonnosti modelu navržených modelů.
Nastavení parametrů. Odhad výkonu různých modelů je primárně určen výběrem parametrů. Tabulka 2 ukazuje klíčové parametry DWT a VMD. Počet vyhledávacích agentů a maximální počet iterací algoritmů WOA a GWO byl 5 a 100, v tomto pořadí. Velikost minidávky všech modelů založených na LSTM byla 128. Rozsah HL, HU, epoch a LR u WOA-LSTM byl [1, 200], [1 200], [10, 100 ], respektive [0,001, 0,01]. Pokud jde o GWO-SVM, rozsah C a G byl [0,01, 100].

Výsledek
Obrázky 4 a 5 ukazují výsledky DWT a VMD. Jak je znázorněno na Obr. 4 a 5, shromážděné měsíční časové řady ET mají mnoho ostrých a kolísavých bodů, které ovlivní odhadovaný výkon. K vyřešení těchto problematických vzorců v procesech odhadování ET byly analyzovány db4 s úrovní 1 a VMD s K=5 a použity k odstranění šumu v ustálených časových řadách ET. Zbytková časová řada ukazuje nízkou amplitudu a vysokofrekvenční fluktuaci, což naznačuje, že bílý šum byl eliminován z původního souboru dat ET. Tabulka 2 ukazuje, že výkon odšumování VMD (s SNR=42.6451 a RMSE=1.7934) je efektivnější než u DWT (s SNR=40.8201 a RMSE{{15} }.2127). DWT má nevýhodu v tom, že základ vlnky by měl být vybrán předem a je také citlivý na výběr prahu. Proto je VMD lepší.
Jak již bylo zmíněno, LSTM a SVM byly použity k odhadu měsíčního ET, resp. Pro každý pevný vstupní rozměr d v d=2, 3, …, 16 byl vybrán minimální MAPE z 5 replikací a optimální hyperparametry WOA-LSTM a GWO-SVM byly zaznamenány podle minimálního MAPE. Tabulka 3 ukazuje optimální vstupní vlastnosti a hyperparametry navrhovaných modelů. Jak ukazuje tabulka 3, MAPE každého modelu založeného na LSTM je menší než u modelu založeného na SVM, což naznačuje, že modely hlubokého učení výrazně překonaly mělké modely ML; MAPE jediného modelu ML byla snížena spojením modelu ML s technikami předběžného zpracování dat, což naznačuje, že výkon modelu ML lze zlepšit použitím předběžného zpracování dat; Všechny MAPE hybridních modelů s optimálními parametry jsou menší než u modelů ML s výchozími parametry, což naznačuje, že modely ML integrované s metaheuristickými algoritmy mají mírně vyšší výpočetní výkon než modely ML s výchozími parametry; MAPE hybridních modelů DWT-GWO-SVM, DWT-WOA-LSTM, VMD-GWO-SVM a VMD-WOA-LSTM je menší než u modelů LSTM, SVM, DWT-LSTM, DWT-SVM, VMD-LSTM, VMD -SVM, WOA-LSTM a GWO-SVM, což naznačuje, že výkon modelu ML lze výrazně zlepšit použitím předzpracování dat a metaheuristického algoritmu.

Odhadované výsledky ML modelů s minimální MAPE a optimálními hyperparametry jsou uvedeny na obr. 6. Obrázek 6 ukazuje, že výsledky všech navržených modelů jsou konzistentní s většinou bodů ve středním rozsahu, ale výchozí a extrémní hodnoty jsou přeceňovány; Měsíční časové řady ET mají období 12 měsíců, optimální vstupní rozměry LSTM, DWT-LSTM, VMD-LSTM, WOALSTM, DWT-WOA-LSTM a VMD-WOA-LSTM jsou přibližně stejné jako období ET času série (tabulka 3), což naznačuje, že LSTM může plně využít historických datových vzorů a účinně překonat nevýhody mělkých modelů ML. Celkově mají hybridní modely DWT-GWO-SVM, DWT-WOA-LSTM, VMD-GWOSVM a VMD-WOA-LSTM lepší odhad výkonu než ostatní navrhované modely.
Tabulka 4 ukazuje metriky hodnocení každého modelu ve fázích školení a testování, kde jsou průměry evaluačních metrik modelů ML optimalizovaných pomocí metaheuristických algoritmů vyznačeny tučně. Jak ukazuje tabulka 4, výkonnost modelu modelů DWT-LSTM, DWT-SVM, VMD-LSTM a VMD-SVM je lepší než výkonnost modelů LSTM a SVM ve fázi testování (tabulka 4), což naznačuje, že předběžné zpracování dat je pomáhá zlepšit odhad výkonu modelů ML. Jak ukazuje tabulka 4, metriky hodnocení včetně MAE, MAPE, NMSE a RMSE pro WOA-LSTM a GWO-SVM jsou všechny menší než u LSTM, SVM, DWT-LSTM, DWTSVM, VMD-LSTM a VMD-SVM. a NSCE se v různé míře zvýšily, což naznačuje, že odhadovaný výkon LSTM a SVM se výrazně zlepšil, když jsou hyperparametry LSTM a SVM optimalizovány pomocí metaheuristických algoritmů.

Metriky hodnocení SVM integrovaného s GWO jsou všechny menší než metriky LSTM spojené s technikami předběžného zpracování dat; MAPE hybridního VMD-GWO-SVM je menší než u jiných modelů založených na SVM a modelů LSTM, DWT-LSTM, VMD-LSTM (tabulka 4), což naznačuje, že mělké modely ML integrované s technikami předběžného zpracování dat a metaheuristickými algoritmy lze použít k odhadu ET. Zatímco výkonnost modelu mělkých modelů ML je stále třeba zlepšit. Jak ukazuje tabulka 4, modely hlubokého učení výrazně překonaly mělké modely ML a výkonnost modelu hybridních WOA-LSTM, DWT-WOA-LSTM a VMD-WOA-LSTM je lepší než u hybridních modelů založených na SVM. Ve srovnání s VMD-GWO-SVM se MAPE DWT-WOA-LSTM snížil z 23,22 % na 18,90 % a NSCE se zlepšil z 0,8754 na 0,8578; MAPE VMD-WOA-LSTM se snížil z 23,22 % na 18,72 % a NSCE se zlepšil z 0,8754 na 0,8917. Tyto výsledky naznačují, že hybridní modely DWT-WOA-LSTM a VMD-WOA-LSTM mají vynikající schopnost odhadovat měsíční ET oproti jiným navrhovaným metodám. MAPE hybridních modelů VMD-WOA-LSTM je nejmenší mezi navrhovanými modely, což naznačuje že VMD-WOA-LSTM je nejpřesnější model pro odhad měsíčního ET mezi navrhovanými modely. Proto lze VMD-WOA-LSTM doporučit jako základní pomocnou metodu pro odhad ET v pouštních oblastech.

Diskuse
Jak již bylo zmíněno, pro odhad ET ve studované oblasti byly navrženy hybridní modely založené na modelech ML, technikách předběžného zpracování dat a metaheuristických goritmech. Obecně je konstrukce hybridních modelů ML složitý a časově náročný postup6,14–18. Hybridní modely ML však mají vyšší přesnost než fyzikálně založené metody20–23. Proto je použití hybridních ML modelů k přesnému odhadu ET základním problémem v hydrologii a ekologii.
Modely hlubokého učení obecně překonaly mělké modely ML3. Avšak pouze použití modelů ML k odhadu ET může vést k velkým chybám, když se neprovádí předběžné zpracování dat7,14–16. Jak je znázorněno na Obr. 4 a 5, shromážděné časové řady ET vykazují nepravidelnost a nestacionaritu, protože ET je určován meteorologickými faktory a úzce souvisí s půdní vlhkostí, geomorfologickými a vegetačními rysy v pouštních oblastech. Technika předběžného zpracování dat by tedy měla být použita k dosažení hlavních variačních znaků ze shromážděných ET časových řad, aby se získaly věrohodné výsledky odhadu. Metody předběžného zpracování dat, jako je DWT a VMD, lze použít k odstranění šumu z nelineárních a nestacionárních časových řad. Zatímco DWT je citlivé na výběr prahové hodnoty, VMD je robustnější a efektivnější metoda předběžného zpracování dat než empirický režim. decomposition (EMD) a EEMD, které lze použít k odstranění šumu z časových řad rozložením nelineárního a nestacionárního signálu na několik funkcí vnitřního režimu s omezeným pásmem (IMF)7,24. Proto je odšumovací výkon u DWT horší než u VMD (tabulka 2).
Literární přehled ukazuje, že modely ML integrované s technikami předzpracování dat jsou efektivní strategií pro získání věrohodnějších výsledků odhadu7,21–23, výsledky našeho výzkumu tento závěr také potvrzují. Jak je znázorněno v tabulkách 3 a 4, průměry vyhodnocovacích metrik modelů ML integrovaných s DWTor VMD jsou všechny menší než u jednotlivých modelů SVM a LSTM. Proto je pro věrohodnější odhadování výsledků nezbytné extrahování užitečných funkcí pomocí techniky předběžného zpracování dat (doplňkový soubor 1).
Odhad výkonu ML modelů lze také výrazně zlepšit spojením ML modelů s meta-heuristickými algoritmy. Do jisté míry je důležitější získat optimální hyperparametry anML modelu než zvolit vhodnou techniku předzpracování dat. Jak je ukázáno v tabulkách 3 a 4, výkon odhadu modelů ML hybridizovaných s technikou předzpracování dat se významně zlepšil, když byly optimalizovány hyperparametry LSTM a SVM. Ve srovnání s DWT-SVM, VMD-SVM, DWT-LSTM a VMD-LSTM jsou pozitivní hodnotící metriky DWT-GW0-SVM, VMD-GWO-SVM, DWT-WOA-LSTM a VMD-WOA -LSTM se snížil a negativní ukazatele se v různé míře zvýšily. Výběr hyperparametrů pro modely ML byl tedy zásadní pro zlepšení odhadovaného výkonu6,7,21–29.
Dále, jak bylo uzavřeno, hlavním cílem této studie bylo navrhnout nový hybridní model pro odhad ET pomocí integrace LSTM s WOA a technik předzpracování dat, včetně DWT a VMD. Výkon VMD-WOA-LSTM byl porovnán s ostatními hybridními modely z hlediska standardních výkonových metrik. Porovnání výkonu navrhovaných modelů ukázalo, že hybridní model VMDWOA-LSTM fungoval lépe než jiné modely založené na ML při odhadu měsíčního ET na jihovýchodních okrajích pouště Tengger.
Závěry
V této studii byly hybridní modely založené na VMD, WOA a LSTM navrženy k odhadu ET pomocí metod analýzy časových řad, kde VMD bylo použito k extrakci vnitřních vlastností časových řad ET a WOA bylo použito k optimalizaci hyperparametrů LSTM. . Výkon modelu byl porovnán se skutečným ET a odhadem ostatních hybridních modelů z hlediska MAE, MAPE, NMSE, RMSE a NSCE. Výsledky naznačují, že VMD-WOA-LSTM má přesnější výsledky odhadů než jiné modely založené na ML, které lze doporučit jako základní pomocnou metodu pro odhad ET v pouštních oblastech.
Dostupnost dat
Všechna data analyzovaná nebo generovaná během této studie jsou zahrnuta v doplňkových informacích a jsou k dispozici od příslušných autorů na přiměřenou žádost.
Reference
1. Keshtegar, B., Piri, J. & Kisi, O. Nelineární matematické modelování denního pan evaporation založené na metodě konjugovaného gradientu. Elektron. Agric. 127, 120–130 (2016).
2. Hashemi, M. & Sepaskhah, AR Hodnocení umělé neuronové sítě a Penman-Monteithova rovnice pro predikci standardní evapotranspirace ječmene v semiaridní oblasti. Teor. Appl. Climatol. 139, 275–285 (2020).
3. Majhi, B. a kol. Vylepšená predikce denního odpařování pánve pomocí modelu Deep-LSTM. Neuronový výpočet. Appl. 32, 7823 (2019).
4. Wen, X. a kol. Modely založené na podpůrných vektorech a strojích pro modelování denní referenční evapotranspirace s omezenými klimatickými daty v extrémně suchých oblastech. Water Resour. Manag. 29, 3195–3209 (2015).
5. Li, XR a kol. Základní ekohydrologie ekologické obnovy a obnovy v písečných pouštních oblastech Číny (Science Press, 2016).
6. Wu, LF a kol. Hybridní extrémní výukový stroj s meta-heuristickými algoritmy pro předpověď měsíčního pan evaporation. Počítač. Elektron. Agr. 168, 105–115 (2020).
7. Fu, TL a kol. Nová integrovaná metoda založená na modelu strojového učení pro odhad evapotranspirace v suché zemi. J.Hydrol. 603, 126881 (2021).
8. Zhang, DH, Li, XR & Zhang, F. Vliv intenzity a přerušování srážek na dřevinný vegetační kryt a hlubokou vlhkost půdy v ekosystémech suchých zemí. J. Hydrol. 543, 270–282 (2016).
9. Li, XR a kol. Ekohydrologický práh pro hodnocení stability pískové vegetace v různých klimatických pásmech.Ekol. Ind. 83, 404–415 (2017).
For more information:1950477648nn@gmail.com






