基于浸沒邊界LB方法和深度強化學習的魚類自主游動行為模擬
本文是一篇決策模擬論文,本文通過高精度、高運算效率的浸沒邊界-格子Boltzmann方法以及柔性演員-評論家深度強化學習算法搭建計算平臺,分別通過數值手段構建魚類肉體、魚類大腦以及流場生境,同時,提出一種用于平臺數據交換的智能接口,保證了整個平臺模擬的一體化、智能化和連續性,通過典型的魚類游泳行為從多方面驗證了計算平臺的可靠性以及魯棒性。
第一章 緒論
1.1 研究背景與意義
自然界中的生物經過上千萬年的進化,已經在各自的生存領域積累了豐富的運動經驗和卓越的運動技能,比如:候鳥能夠精準感知大氣中的環流而完成遷徙,獵豹能夠以極為優異的生物運動學和動力學完成捕食狩獵過程,劍魚在水中的游泳速度能夠達到驚人的130 Km/h等,在漫長的進化中,各種魚類也已經進化出了極為優秀的游泳性能[1],由于魚類身體兩側的側線感受器官對水流的刺激尤為敏感,所以能幫助魚確定水流的速度和識別方向,從而使其在復雜的流場環境下完成捕食、洄游產卵等游泳動作[2]。上述樣本均為人類認識自然提高人類社會生產力提供了寶貴的經驗。魚類作為熟練掌握并運用流體動力學原理的高手之一,在過去的幾十年里一直受到研究者的廣泛關注,魚類靈活、敏捷的運動方式和極高的游泳效率是任何人工載具都無法媲美的,因此,國內外研究人員致力于揭示魚類游動的流體力學機制,以便為智能水下裝備的研究、魚類水生生物的保護等提供理論依據和實驗參考。
對魚類游泳的研究一般通過物理實驗和數值模擬方法進行,傳統物理實驗可以客觀反應真實自然界的魚類行為,但存在著諸多限制,如無法表征魚體受力、非接觸式測量手段受限、實驗成本高等。數值模擬方法因其模擬環境可控性、獲取信息的豐富性等優勢廣受研究人員青睞,然而,傳統數值模擬方法只能模擬魚體的被動運動,魚體行為都是預先通過計算機程式設定的,模擬的魚尚無主動感知、主動決策以及與環境交互的能力,對魚類游動問題的工具和方法有待進一步更新。
...................
1.2 國內外魚類游泳運動的研究方法的研究進展
1.2.1 傳統流體力學實驗
對魚類的游泳運動研究在早期一般通過實驗的方式進行。對于實驗研究,一般討論以下主題:1、湍流對魚類游泳的影響;2、魚類在具有復雜漩渦的流場中的游泳運動學和節能游泳行為;3、量化魚類在湍流中的游泳成本;4、魚群的游泳行為學與動力學機制,研究手段往往通過魚類游泳運動學分析、魚體流場可視化、肌電圖、運動呼吸計量法和感知屏蔽手術等來從多方面研究魚類游泳的物理機制和生物學代價。學者們利用先進的實驗方法,取得了一系列豐富的、具有實踐意義的成果,為大壩生態調度、漁業管理、水下航行機器人研究和生物學領域中種群層次等問題作出了重要的貢獻。
① 湍流對魚類游泳的影響
關于湍流對魚類游泳的影響的結論,目前仍然存在較大的爭議,根據研究中特有的水動力條件,魚可能會被湍流吸引或排斥。有研究表明,魚類不喜歡湍動強度過大、混亂程度過高的水流,而更偏好湍動強度較低、具有較好可預測性的水流。當湍流強度較大時,湍流作為一種極為混亂與無序的流動,已經被證明會增加魚類游泳運動的成本[3–5]。當湍流強度較小時,湍流具有類較高的穩定和可預測性從而能夠被游動的魚類感知和利用。大量的野外和實驗室研究表明,魚類可以通過利用水中的漩渦或其他魚類的游泳產生的漩渦來降低移動成本[6–10]。在上述情況下,湍流對魚類游泳的行為學和動力學是有一定益處的。
河道中往往存在各種各樣的障礙物,當水流達到一定流速時,將在障礙物后方產生同樣的渦街。對于魚類的在卡門渦街中的游泳,Liao等[11]發現魚類將以一定體長的距離作為標準,在非定常卡門渦街中進行穩定的卡門步態,當魚在D形柱后面游泳時,魚能感知流場中的能量變化,這使得它們能夠在不同Strouhal數的渦街中同步它們的身體運動擺動頻率與障礙物后的渦脫落頻率,以達到節省游泳能量的目的。
...........................
第二章 基本理論與方法總結
2.3 強化學習理論
馬爾科夫鏈(Markov Decision Process, MDP)是強化學習的基礎,它可以用(S,A,P,R,?)五元組來描述。其中 S表示狀態矩陣,A表示動作矩陣,P為狀態遷移概率,R為獎勵函數,?表示計算累計獎勵時的折扣因子。對于無模型(Model-free)類問題,一般無法得到狀態轉移概率P,所以用轉移過程四元組()s,a,r,s'來表示每次訓練的基本單元,其中:s'表示經過動作a從狀態s轉移到新的狀態,并在這個過程中得到獎勵r。
傳統強化學習大致可以分為基于值、基于策略和二者結合三大類方法。接下來本文將介紹前兩種基本分類及其對應的代表性算法。
......................
2.4 深度學習理論
2006年,深度學習作為機器學習的一個分支被首次提出。深度學習的模型開發受到了人類大腦中數億個神經元的相互交感的啟發。研究者們通過創建多層隱藏層和多層感知器的深度神經網絡(Deep Neural Network,DNN)來從技術上實現這一模型。相較于淺層神經網絡(Shallow Neural Network,SNN),深度神經網絡的性能得到全面增強,能夠從大量訓練數據中學習到更多特征表示。自從Krizhevsky等[59]在ImageNet圖像分類比賽中獲勝后,深度學習也開始快速發展并廣泛應用于多個領域。多層感知機(Multilayer Perceptron,MLP)是深度學習的核心,相對于單層感知機,它具有更多的隱藏層和輸出層,能夠學習更復雜的特征信息,輸出多個值解決例如分類、回歸、降維和聚類等各類問題,MLP結合不同的激活函數能夠進一步增強模型的表達能力。
決策模擬論文怎么寫
...........................
第三章 智慧魚體自主行為決策模擬平臺設計 .................... 19
3.1 引言 ........................................ 19
3.2 智慧魚體流場生境流固耦合模塊設計 ......................... 19
第四章 魚類捕食游泳行為模擬 ............................ 32
4.1 引言 .......................................... 32
4.2 實驗環境及參數配置 ................................. 32
第五章 復雜渦流場中魚類游泳行為模擬 ........................... 44
5.1 引言 ...................................... 44
5.2 結合側線感知機的智能仿生魚計算平臺搭建 ............................ 44
第五章 復雜渦流場中魚類游泳行為模擬
5.1 引言
本文第四章搭建的智慧魚體自主行為決策模擬平臺對于深度強化學習這一類的智能算法應用還處于較為初級的階段。但是,由于僅僅通過將流場的一些特征參數輸入智慧魚的狀態空間來進行端到端學習,無法使上文初級計算平臺所模擬的智能魚擁有對當前所處的流場環境進行定性識別和分類的能力,而且可能造成算法難以收斂,訓練好的游泳策略也無法多個游泳環境之間順利遷移,從而造成已有計算成果的浪費,這與真實自然界魚類的行為模式也仍然是存在一定出入的。本章參考魚類的側線功能,設計了一種智能仿生魚的流場識別與記憶移植方法,通過側線感知機對當前流場的參數進行初步感知、識別,結合宏動作系統,可使已有的游泳策略在陌生的流場環境下適用,將其引入智慧魚體自主行為決策模擬平臺,得到了一個更加魯棒的、泛化能力更強、模擬行為更接近自然界真實魚類的智能魚體游動控制器。在具有復雜漩渦的紊流場中進行了魚類復雜游泳行為模擬,流場中的非線性漩渦會對魚體的運動造成強干擾,這非常考驗智慧魚的游泳決策能力,在三種不同來流流速的卡門渦街下進行了游動模擬,分別對比了屏蔽所述系統和不屏蔽所述系統的情況下,對魚體的控制效果,結果表明:激活所述系統的魚,維持自身在紊流場中運動的能力顯著增加,運動穩定性顯著增強,魚體在三種工況下的所有回合的運動時間均達到了設置回合上限時間100 T。
決策模擬論文參考
..........................
第六章 總結與展望
6.1 全文總結
6.1.1 主要內容與結論
對于魚類游動的行為學和動力學研究,傳統物理實驗存在著實驗成本高、可采集信息與非接觸式測量手段有限等不足,傳統計算流體力學數值模擬方法存在著無法實現魚體主動感知和決策、智能模擬魚體被動運動等不足。本文目標在于針對以上問題,結合更加先進的人工智能算法搭建與傳統流固耦合算法相結合的計算平臺,并以具體的應用實例佐證計算平臺的優越性。為此,本文通過高精度、高運算效率的浸沒邊界-格子Boltzmann方法以及柔性演員-評論家深度強化學習算法搭建計算平臺,分別通過數值手段構建魚類肉體、魚類大腦以及流場生境,同時,提出一種用于平臺數據交換的智能接口,保證了整個平臺模擬的一體化、智能化和連續性,通過典型的魚類游泳行為從多方面驗證了計算平臺的可靠性以及魯棒性。現將主要工作內容總結如下:
(1)為了解決傳統CFD方法只能模擬魚體被動運動等問題,通過自編程手段構建了智慧魚體自主行為決策模擬平臺。首先,通過高精度、高運算效率的浸沒邊界-格子Boltzmann方法實現魚體游動流固耦合數值模擬模塊,模擬魚類肉體運動和魚類流場生境的相互作用,提供訓練數據和執行游動指令,該模塊采用C++語言編譯;然后,通過基于柔性演員-評論家的深度強化學習算法實現魚腦高效訓練學習和決策任務,該模塊采用基于Python語言的Pytorch開源庫編譯;同時,針對跨平臺、跨語言編程間通信的通信問題,提出一種用于智慧魚體自主行為決策模擬平臺數據交換的智能接口,保證了整個平臺的一體化以及訓練過程的智能化與連續性;
(2)通過水箱里兩小球下沉算例以及柔性體靜水前游算例驗證流固耦合求解器可靠性,通過一級牛頓擺、一級倒立擺兩個控制工程領域的經典非線性控制算例驗證深度強化學習決策模塊的可靠性,為后續模擬奠定基礎;
參考文獻(略)