隨著大數(shù)據(jù)、物聯(lián)網以及5G系統(tǒng)應用的日益廣泛,數(shù)據(jù)傳輸?shù)乃俣群腿萘啃枨蠹眲≡黾?,硅基電子集成芯片的尺度和計算效率逐漸趨近物理極限。而光子集成芯片以光子為信息載體,具有體積小、速度快、集成度高的優(yōu)勢,在光通訊、量子計算、量子信息處理等領域得到了快速發(fā)展。
我們可以把光子比作火車,把光子器件比作火車軌道和火車站,光子在光子芯片中傳輸、處理,就像是火車在鐵軌上行走,并在火車站里實現(xiàn)人員的交換(信號的處理)。
波導是光子芯片器件中最基礎的單元之一,其主要功能是引導光沿著特定路徑傳輸。光子器件中的波導類似于我們常見的光纖,可以對光實現(xiàn)有效束縛。除此之外,利用波導還可以制備多種常見的光功能器件。比如,圖1a所示的是一種定向耦合器(Directional Coupler,DC),通常是由兩根波導構成的光子器件,當光在其中一根波導傳輸時,在某些特定的情況下,光并非完全局域在波導內,有一部分會貼在波導外表面(電磁波的倏逝場效應),如果另一根波導和這根波導靠的很近,那么這些光就可以進入另一根波導(也就是耦合效應)。通常,光信號在兩根波導之間的傳輸具有明確的方向性,因此這種結構被稱作定向耦合器。通過對第二根波導光信號進行分析、處理等,實現(xiàn)特定的功能。圖1b紅色虛線區(qū)域所示的光子器件叫做馬赫曾德爾干涉儀(Mach-Zehnder Interferometer, MZI),也是由兩根波導組成,只不過這兩個波導里的光都是從同一端輸入的,不同的是,在這種結構中,通過對下面的波導進行一定的調制(通常是加電),利用電光效應(改變折射率)可以改變傳輸光的相位,讓上下兩束光產生相位差,進而產生干涉來調節(jié)輸出端口光信號的強度,廣泛用于相位調制、光強度調制和光偏振調制等領域。
圖1:比較常見的幾種光子器件 a定向耦合器[1];b馬赫曾德爾干涉儀[2]
超表面(Metasurface)則是另一類波導器件,其由排列在二維平面的納米結構單元組成,每一個結構單元像一個個微型“光學天線”一樣,能夠在納米尺度上精確調節(jié)光的相位、振幅和偏振狀態(tài)。通過對這些結構的巧妙設計,科學家們可以讓光按照預設的方式折射、反射、聚焦,甚至改變顏色、亮度或者傳播方向,就像給光裝上了“指揮棒”。比如,2011 年美國科學家Capasso團隊所提出了一種V 形天線結構的超表面(圖2a),可以實現(xiàn)電磁波傳輸異常的偏折(圖2b,藍色線段表示正常反射和折射路徑,紅色線段表示異常反射和折射路徑)。
圖2:基于V形天線結構的超表面結構[3]
在這些光子器件中,結構的幾何參數(shù)和外部調控參數(shù),例如波導寬度、耦合區(qū)域長度、波導間間距、外加電信號強度等都會產生不同的功能。在設計此類光子器件時,需要根據(jù)實現(xiàn)的功能,找出特定的參數(shù)。因此,光子器件結構設計顯得尤為重要。
像波導這樣的單個器件設計起來相對容易一些,通過調控某幾個參數(shù),比如波導的幾何尺寸、材料類型等,往往就可以實現(xiàn)想要的功能。不過當這些光子器件集成在光芯片中時,比如超表面結構就包含了多個基本器件單元,不同基本單元之間的相對角度、距離、尺寸等都會影響它們之間的耦合、相互作用,進一步加劇了設計難度。
為了減少加工成本,不得不借助計算機技術在加工器件之前進行模擬仿真,可以減少實驗成本,也有利于設計出功能較為復雜的結構。例如,常用的數(shù)值模擬方法有時域有限差分法(Finite-Difference Time-Domain,F(xiàn)DTD)、有限元法(Finite Element Method,F(xiàn)EM)等。
盡管這類數(shù)值模擬的方法在光子器件設計中獲得了廣泛的應用,但仍存在一定的局限性。以FDTD為例,在模擬時先把要將模擬的區(qū)域劃分出極小的網格,同時將光的傳播過程劃分成無數(shù)個極短的瞬間。然后按照光的傳播規(guī)律(麥克斯韋方程),逐個計算每個網格在不同時刻的光場,最終將這些結果拼在一起,就可以得到光在器件里傳輸時的完整過程了。受限于FDTD數(shù)值方法的固有特性,在模擬光學器件時,單次計算區(qū)域的網格要小于波長。這種超高分辨率的要求使得傳統(tǒng)方法在模擬大尺寸光子器件時就顯得力不從心了。
此外,在設計實現(xiàn)某種特定功能的光子器件時,設計者通常只能對某些特定的參數(shù)進行調整,例如耦合區(qū)域長度,波導寬度等。但實際影響器件性能的因素有很多,這種采用特定結構參數(shù)調整的方法大大限制了設計的自由度。對于較為復雜的器件,往往要通過嘗試大量不同參數(shù)組合以尋找最優(yōu)解,計算成本和時間也隨參數(shù)的數(shù)量指數(shù)級增加,有時需要數(shù)天甚至數(shù)周才能完成一個滿足使用要求的光子器件。比如,想要模擬波導幾何尺寸對光傳輸?shù)挠绊?,就要考慮波導的寬度、高度、長度三個參量,如果每個參量的變化是從11 μm-20 μm,參量改變步長是1 μm,每個維度的可能性就是10種,三個維度就是1000種,相當于計算機要計算1000次才可以模擬完成。因此,上述方法一般可以設計的光子器件尺寸往往只能在百微米量級。
總之,傳統(tǒng)方法不僅會消耗大量的計算資源,也會在集成度上存在限制。
近年來,人工智能(Artificial Intelligence,AI)技術的迅速發(fā)展為科學研究提供了新的契機。2024年諾貝爾物理學獎、化學獎均頒發(fā)給AI領域的科學家。機器學習,尤其是深度學習,已被廣泛應用在微結構的高效率設計和結構優(yōu)化等方面,大大縮短了微結構的設計時間,同時也為大面積結構的設計提供了新的技術手段。
那么,AI是如何做到的呢?
首先,AI通過收集大量的特定光學結構的數(shù)據(jù)以及對應的光學性能,利用這些數(shù)據(jù)對深度學習模型進行訓練。這就好比我們先讓模型學習一本“字典”(稱為正向模型網絡),將結構參數(shù)和光學性能對應起來。訓練完成后,模型就會就會變成一個經驗豐富的設計專家。然后,給模型輸入特定的功能要求,模型會在字典中查找類似的結構。當然這種結構還不能滿足要求,還需要通過對初始設計進行不斷優(yōu)化(稱為逆向設計模型網絡)。
為了實現(xiàn)正向模型網絡對“結構→性能”精準映射和逆向設計模型網絡從“功能→結構”反推優(yōu)化,科學家提出很多優(yōu)化方法。這些方法中,梯度下降算法因為簡單、高效,是目前應用最廣泛的一種。
這種方案就像我們在山頂尋找通往山谷的最短路徑。當你站在山頂上時,這時還不知道最佳的路徑,只有一個粗略的方向。如果是你,你會怎么做呢?
下山時,你需要通過當前的坡度來決定下坡的方向。通常的方案是,你沿著坡度下降的方向不斷前進,每次都朝著最陡的方向走,才會快速接近山谷(圖3)。
圖3:下山尋找最短路徑示意圖[4]
看到這里,大家可以想一下,沿著梯度最大的方向行走,就一定會達到山谷嗎?
實際上,如果走著走著遇到了一個小洼地,無論往哪個方向再邁一步,都是梯度增加的方向,模型以為這就是山谷了,而事實并非如此。
這種遇到“假山谷”的情況就使得AI陷入“局部最小值”,而無法達到“全局最小值”。為了避免這一問題,可以通過調節(jié)步伐大小、引入隨機擾動等方法,盡快讓AI跳出小洼地,找到“全局最小值”, 從而到達山谷。
在設計光子器件時,一般是根據(jù)已有的知識或經驗設計一些可能的器件結構。此時,我們并不清楚哪些結構參數(shù)是最優(yōu)的,光傳輸效率還比較低、損耗還比較大。當前結構的性能(如傳輸效率、光損耗、集成度等)相對于各個設計參數(shù)(如波導寬度、材料折射率等)的變化率為“梯度”,相當于下山時的“坡度”。AI通過計算不同參數(shù)對最終性能的影響,得出“梯度”。比如,從A點出發(fā),通過尋找附近最大的“梯度”,并沿著這一方向就可以走到B點,從而降低目標函數(shù)(如損失函數(shù))的值(圖4)。這就像你在山中根據(jù)坡度來判斷下一步的方向。重復這個步驟,逐步調整模型參數(shù),使目標函數(shù)達到最小值,最終就能到達最低點C點。這個過程幫助AI知道應該如何調整設計參數(shù),使得光子器件的性能逐步提升。
圖4:梯度下降算法示意圖[4]
同樣,在AI設計光子器件時,學習率決定了每次調整設計參數(shù)的步伐。如果學習率太大,模型可能會因為調整過度而陷入不好的設計;如果學習率太小,模型則會慢慢收斂,效率低下或者陷入“局部最小值”。
總之,AI在一個龐大的設計空間中不斷進行優(yōu)化。經過不斷的調整、優(yōu)化,最終找到了最佳的參數(shù)。這時,AI就像是你成功地從山頂下到了山谷的最低點,找到了最合適的光子器件結構,使得光子器件的性能達到了最優(yōu)。利用這種方法就可以根據(jù)我們的需求快速地設計相應的結構,大大縮短了設計時間并提高了設計的準確性,甚至可以設計出很多人類都無法想象的結構。
我們以超表面結構為例解釋AI是如何設計光子結構的。圖5展示的是一種尺度小于波長、具有高品質因子的共振超表面結構[5]。類似于圖2的超表面結構,這種超表面結構也是由許多基本單元結構(圖5藍色結構)排列成的二維平面結構。每個基本單元由兩個相同的硅納米棒組成。高品質因子意味著光可以在這些結構中被強烈地“困住”而不向外輻射,使得光子可以停留更長的時間,大大增強光與材料之間的相互作用效率。利用這種結構的共振特性,可以用于光學傳感、非線性等領域。由于結構的參數(shù)微小變化會劇烈的影響共振光譜的特性,因此要想實現(xiàn)預定的功能,傳統(tǒng)的設計方法通過連續(xù)調節(jié)結構參數(shù)來模擬對應的性能。不過,這種方法往往只能同時優(yōu)化一兩個參數(shù),并且參數(shù)優(yōu)化的范圍和精度有限。而實際上對性能的調控需要同時對材料的屬性、幾何特性等多個變量進行同時優(yōu)化,因此傳統(tǒng)的方法對于共振光譜的線寬、寬度等調控能力有限,并且非常耗時。
圖5:一種硅納米棒超表面結構示意圖[5]
為了提高了結構設計的效率,科學家們首先利用人工神經網絡模型(神經網絡是人工智能的核心技術模型,概念源自于人類大腦的神經元網絡)將一個正向模型網絡(Pretrained forward model network)和一個逆向設計模型網絡(Inverse-design model network)串聯(lián)起來(圖6)。然后使用開源神經網絡庫對正向模型網絡進行訓練,學習超表面結構參數(shù)(圖6中右半部分的y1,y2……)與透射光譜(圖6中右半部分的x1,x2……)的映射關系(“字典”)。其次,逆向設計模型網絡的輸出(圖6中左半部分的y1,y2……)接入已訓練好的正向模型網絡,通過學習這本“字典”,就可以知道如何根據(jù)目標光學響應(圖6中右半部分的x1,x2……)找到合適的超表面結構參數(shù)。也就是利用這本“字典”來輔助逆向設計模型網絡完成從光學響應到結構參數(shù)的預測。最后,逆向設計模型網絡根據(jù)光學目標預測結構參數(shù),并通過比較正向網絡的輸出與目標響應的誤差來更新自身參數(shù)使輸入結果與預測結果的差異達到最?。刺荻认陆邓惴ǎ瑥亩A測出符合條件的超表面結構參數(shù),實現(xiàn)高效、準確的超表面設計。
圖6:由一個逆向設計模型網絡和一個預訓練的正向模型網絡連接而成的TN模型架構[5],其中,X表示輸入和輸出,即透射光譜數(shù)據(jù),而Y表示中間層的輸出,對應的是結構參數(shù)。
通過輸入超表面結構的透射光譜參數(shù):工作波段λ=1500 nm,線寬(共振峰的半高寬)△λ=5 nm,形狀因子(用于描述光譜的不對稱性)q=0.5(對應的光譜如圖7黑色虛線所示),最終,在固定基本單元周期D=900 nm,納米棒厚度150 nm的情況下,神經網絡模型設計的納米棒長寬度w=316 nm,長度L=580 nm,每個基本單元中兩個納米棒的間距2x0=378 nm,該結構對應的透射光譜如圖7紅色實線所示??梢钥闯觯P皖A測結構的光譜和輸入光譜(目標結果)非常接近。
圖7:輸入透射光譜(黑色虛線)和神經網絡模型預測結構的透射光譜(紅色實線)比較[5]
如果利用傳統(tǒng)的數(shù)值模擬方法,需要專業(yè)的計算機,并且至少花費秒量級的時間?;谶@種方法,利用普通的計算機(Intel(R) Core(TM) i7-4770 CPU @ 3.40 GHz, RAM: 16.0 GB)在0.05s的時間就完成了光學超表面結構設計,設計效率得到了顯著提升。
人工智能除了科研輔助研究人員用于光子結構設計,研究人員發(fā)現(xiàn)利用光子芯片還可以用于實現(xiàn)神經網絡的光子結構。相較于傳統(tǒng)的電子芯片,光子神經網絡在計算速度與功耗上具有明顯優(yōu)勢。比如,2022年Firooz等人實現(xiàn)了一個利用片上光子深度神經網絡來實現(xiàn)對手寫字母識別的系統(tǒng)(圖8)。研究團隊將手寫字母圖像每個像素點的光強信息通過光柵耦合器輸入到系統(tǒng)中。通過對輸入信號進行加權處理(Optical attenuator部分,光學衰減器),然后光進入光電探測器(PD部分)完成加法運算,接著由微環(huán)諧振器(Optical modulator部分)實現(xiàn)非線性變換(復雜特征提取),最終將光信號傳遞到下一層神經網絡(Neuron optical output)。
圖8:利用光子芯片識別手寫字母[6]
這些成果展示了人工智能在光子器件中的巨大應用潛力,為開發(fā)新一代高效、功能豐富的光子器件打下了基礎。我們相信,隨著人工智能技術的迅速發(fā)展,微納光子器件設計與應用領域將迎來一場巨大的技術變革。在不久的將來,現(xiàn)在所用的電子設備也許都會變成光子的世界。
我們可以大膽暢想一下,未來世界會是什么樣的呢?
或許那時,憑借光子在高速信息傳輸和處理方面的優(yōu)勢,光量子計算機會像今天的智能手機一樣走進千家萬戶。
參考文獻
[1] WANG Q, HE Y, WANG H, et al. On-chip mode division (de)multiplexer for multi-band operation [J]. Opt. Express, 2022, 30(13): 22779-22787.
[2] DONG B, AGGARWAL S, ZHOU W, et al. Higher-dimensional processing using a photonic tensor core with continuous-time data [J]. Nat. Photon., 2023, 17(12): 1080-1088.
[3] YU N, GENEVET P, KATS M A, et al. Light Propagation with Phase Discontinuities: Generalized Laws of Reflection and Refraction [J]. Science, 2011, 334(6054): 333-337.
[4] 王東,馬少平. 圖解人工智能 [M]. 北京: 清華大學出版社, 2023.
[5] XU L, RAHMANI M, MA Y, et al. Enhanced light–matter interactions in dielectric nanostructures via machine-learning approach [J]. Advanced Photonics, 2020, 2(02): 026003.
[6] ASHTIANI F, GEERS A J, AFLATOUNI F. An on-chip photonic deep neural network for image classification [J]. Nature, 2022, 606(7914): 501-506.
來源:中國光學
編輯:未
轉載內容僅代表作者觀點
不代表中科院物理所立場
如需轉載請聯(lián)系原公眾號
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.