0512-8957 3668 / 18013764755
【文献解读】基于超高密度钙钛矿纳米线阵列忆阻器的多层感知器
来源:https://www.nature.com/articles/s41467-026-71372-5 | 作者:木芮生物 | 发布时间: 2026-05-29 | 4 次浏览 | 🔊 点击朗读正文 ❚❚ | 分享到:
无源忆阻器交叉阵列为神经形态计算提供了高密度、低功耗的平台。与传统氧化物相比,钙钛矿忆阻器具备电化学金属化与价态变化机制间可重构性等优势,但存在均匀性、变异性和丝状体不稳定性等问题,这些问题阻碍了其大规模集成。本研究表明,三维钙钛矿纳米线阵列架构可克服上述局限,其中经精准设计的氧化铟锡(ITO)势垒层有助于实现可控的模拟电导调制。所制备的忆阻器在最佳模拟区间(10-100 微西门子)内呈现出139个不重叠的欧姆导电态、高保持性((>10^{6} ~s))、超过4×10⁵次的耐久性、0.3的非对称非线性系数以及极低的器件间变异性(


题目:Ultra-high density perovskite nanowire array memristor-based multi-layer perceptron

原文链接https://link.wtturl.cn/?target=https%3A%2F%2Farxiv.org%2Fhtml%2F2412.02779v2%2F&scene=im&aid=497858&lang=zh


摘要

无源忆阻器交叉阵列为神经形态计算提供了高密度、低功耗的平台。与传统氧化物相比,钙钛矿忆阻器具备电化学金属化与价态变化机制间可重构性等优势,但存在均匀性、变异性和丝状体不稳定性等问题,这些问题阻碍了其大规模集成。本研究表明,三维钙钛矿纳米线阵列架构可克服上述局限,其中经精准设计的氧化铟锡(ITO)势垒层有助于实现可控的模拟电导调制。所制备的忆阻器在最佳模拟区间(10-100 微西门子)内呈现出139个不重叠的欧姆导电态、高保持性((>10^{6} ~s))、超过4×10⁵次的耐久性、0.3的非对称非线性系数以及极低的器件间变异性(<5%,cycle-to-cycle <1.5% )。研究人员将该忆阻器进一步集成至64×64交叉阵列中,并用于构建用于斑马鱼头部和颌部运动分析的全集成多层感知器,从而为基于钙钛矿的高性能神经形态硬件开辟了可规模化的发展路径。


引言

人工智能日益增长的计算需求,正推动人们加紧寻找冯·诺依曼架构的替代方案,而神经形态计算被视为主要候选方案之一。该范式的核心是忆阻器交叉阵列,神经网络的基本运算——向量-矩阵乘法(VMM),正是通过利用欧姆定律实现乘法、基尔霍夫定律实现求和,在存内完成的¹⁻³。单晶体管单电阻(1T1R)单元虽更易控制,但其密度受限于晶体管尺寸。相比之下,无源(0T1R)交叉阵列通过去除晶体管,有望实现极致的集成密度和能效,但这对忆阻器的性能提出了极高要求,需要其具备高均匀性、线性电导调制能力以及极低的漏电流²⁻⁷。因此,利用任何忆阻器技术在无源交叉阵列配置下实现复杂的多层感知器(MLP),仍是一项重大挑战,因为这需要大阵列中具备可靠的模拟级器件,而相关物理MLP的报道一直十分有限³,⁸⁻¹¹。

卤化物钙钛矿凭借优异的离子传输特性、简便的合成方法以及在电化学金属化(ECM)与价态变化(VCM)机制间的可重构性,近年来作为忆阻材料备受关注。然而,钙钛矿固有的不稳定性以及薄膜中开关过程的随机特性,导致其存在运行寿命短、变异性高、开关可靠性差等普遍问题。这些挑战在很大程度上限制了钙钛矿忆阻器的研究,相关成果多集中于单器件或小型阵列的报道,系统级的演示往往依赖模拟而非物理硬件。因此,实现单台具有潜力的器件与功能化大规模计算系统之间的突破,被视为该领域首要的攻坚难题。

本研究通过展示一种高密度、可靠的钙钛矿纳米线忆阻器阵列来克服这些障碍,该阵列能够实现多层感知机(MLP)以处理复杂的真实世界数据。首先,采用多孔氧化铝膜(PAM)作为模板,构建出结构稳定、垂直排列的甲脒铅溴(MAPbBr₃)纳米线(NWs)阵列,该结构可实现封装并确保器件间的优异均匀性。其次,一种准电化学金属化(quasi-ECM)通过在银电极和钙钛矿之间构建一层15纳米厚的氧化铟锡(ITO)层作为半渗透屏障,引入了开关机制。该屏障充当动态计量阀,经密度泛函理论(DFT)和COMSOL模拟、飞行时间二次离子质谱(ToF-SIMS)以及基于截面透射电子显微镜的能量色散X射线光谱(TEM-EDS)验证,(Ag^{+})离子的注入速率受到限制,从而实现可控的径向丝状物生长。研究实现了高度可控的模拟开关,其特征为:在10微西门子至100微西门子的最佳模拟计算范围内,具备200的高动态范围、139个线性和欧姆导电态,最优非对称非线性系数为0.3,139(<1.5 %)与器件间(<5%)的变异性最小,状态保持时间延长至(>10^{6} ~s),且耐久性超过(4 ×10^{5})次循环。

这一性能支持构建一个64×64的无源交叉阵列(4096个忆阻器),并成功应用于多个高要求场景,包括图像存储、通过编程4095个权重及后续读出完成片外分类任务,同时该阵列构成了物理连线三层感知器的核心(由16 ×16,8 ×8)和4×6阵列组成)。该多层感知器(MLP)实现了斑马鱼幼鱼头角同步回归与颌部运动分类的片上推理,能够处理复杂的生物运动学数据。本研究通过验证一个集成高密度存储、稳健模拟计算、硬件级MLP集成与复杂数据处理的可扩展平台,将卤化物钙钛矿忆阻器从极具潜力的材料体系,提升为可靠神经形态硬件领域具备竞争力的技术方案。


结果

器件结构与材料研究

1a以示意图形式展示了我们的忆阻器阵列架构,其中(MAPbBr_{3})纳米线用于处理斑马鱼的运动学模式。该架构的核心特征是垂直排列的MAPbBr₃纳米线嵌入在聚丙烯酰胺水凝胶(PAM)中,制备于底部铝(Al)电极与顶部银/掺锡氧化铟(Ag/ITO)电极之间。完成PAM模板制备后,通过旋涂MAPbBr₃前驱体溶液形成高度有序的多晶纳米线阵列(制备细节见方法部分)。图1b为纳米线的放大视图,图1c则展示了MAPbBr₃的晶体结构。

通过俯视图扫描电子显微镜(SEM)和能量色散X射线光谱(EDS)mapping(补充图1a-f)证实,纳米线(NW)阵列实现了约(10^{10} ~cm^{-2})的超高密度,填充率接近100%。横截面SEM和扫描透射电子显微镜(STEM)图像(补充图2a、b)进一步验证了这种完全的孔隙填充,而STEM-EDS mapping(补充图3a-h)则表明纳米线整体元素分布均匀、化学计量比一致。所得纳米线直径约为40纳米,长度为1-1.5微米。

 

 

1| 器件结构与原理流程。(a) 示意图展示了基于64×64甲胺铅溴(MAPbBr₃)纳米线(NW)的忆阻器阵列,以斑马鱼撞击图像作为输入,对撞击模式进行分类(比例尺:100微米)。(b) 阵列放大视图,显示纳米线位于多孔氧化铝膜(PAM)中,夹在顶部银/氧化铟锡(Ag/ITO)电极与底部铝(Al)电极之间。断裂的丝状物对应高阻态(HRS),而连接上下电极的完整丝状物对应低阻态(LRS)。(c) MAPbBr₃的晶体结构示意图。

 

PAM 支架为卤化物钙钛矿提供了关键的稳定作用,实现了可靠的忆阻器件运行。与易受材料影响的薄膜钙钛矿忆阻器不同尽管存在降解以及导电性状态不稳定的问题,同时耐久性、保持性和时间抖动较差,但氧化铝基体具备多种保护功能:它可以作为防潮屏障诱导的表面扩散,通过其增强的热导率提升散热效果,并在相邻纳米线之间提供电隔离以防止横向串扰。这种无需光刻工艺实现的垂直纳米线结构,既规避了水平纳米线忆阻器的组装难题,又整合了其他垂直纳米线设计中通常缺失的固有封装特性。

PAM中基于溶液的纳米线生长相较于化学气相沉积法具有额外优势,包括成本效益、低温加工工艺以及更高的器件间均匀性22,23。高分辨率透射电子显微镜(TEM)成像(补充图4a-d)揭示了溶液法制备的钙钛矿纳米线具有多晶特性,可见的(211)、(200)、(110)和(210)晶面的面间距分别为(2.4 AA)、(2.95 ̊)、(4.03 AA)和(2.7 AA),这与X射线衍射(XRD)图谱(补充图5)的结果一致。值得注意的是,从同一PAM样品的四个不同区域采集的XRD图谱显示出几乎完全相同的特征,证明整个阵列的晶体学相、取向和质量均具有一致性。光致发光(PL)表征进一步证实了其光电性能的一致性,该表征显示在532纳米处存在发射峰,且在紫外光激发下,PAM区域的PL强度在空间上分布均匀(补充图6),这也验证了孔道填充的均匀性以及材料的优质性。


器件表征与工作机制

研发出性能可靠的模拟级忆阻器是构建功能性神经形态系统的基石。1T-1R阵列在忆阻器的栅极调制精确电导调谐方面具有显著优势,而这一特性在无源0T1R阵列中并不具备。因此,材料与器件工程是赋予无源交叉阵列忆阻器线性、渐进且对称的权重更新能力,以及在高动态范围内实现低时间抖动多状态存储能力的关键,而这些能力是大规模人工智能加速器的必备条件。图2a展示了基于MAPbBr₃纳米线的忆阻器的电流-电压(I-V)特性,其中渐进式电导调制是突触模拟的核心特征。在0.2 V的读取电压下,器件实现了约70的开/关比。该器件的性能有两个关键指标:全物理动态范围和最佳模拟计算范围。该器件展现出200的宽动态范围(5微西门子至1000微西门子),证明其天生具备覆盖大范围电导值的能力。在此范围内,实验中成功标定了327个不同且不重叠的状态(补充图7),体现了其精细的可调性。然而,为实现稳定且高能效的神经形态应用,我们选择在10微西门子至100微西门子的最佳模拟计算范围内进行器件工作。这一选择基于工程上的权衡:当电导低于10微西门子时,读取噪声和时间抖动的影响更为显著;而当电导高于100微西门子时,功耗则会大幅增加。图2b展示了该最佳范围内的增强-抑制特性,其脉冲方案为2.5 V(写入)/0.05 V(读取)/-2.5 V(擦除)/0.05 V(读取)。优化后的电导窗口展现出139个高度稳定、线性可分的状态(补充图8),这些状态被认为是实现精确神经网络权重赋值的理想选择。为验证这些状态的精细度和保持能力,图2c展示了10微西门子至20微西门子窄电导范围内的10个不同且不重叠的代表性状态,而图2d则展示了10微西门子至100微西门子宽电导范围内的10个代表性状态。在50 mV读取电压、时间抖动(2σ/平均值)小于2%的条件下,这些电导状态可保持超过(10^{6})秒的时间稳定性。图2e展示了在 (>25,000) 个脉冲下保持稳定的耐久性,补充图 9 展示了 (>4 ×10^{5}) 个脉冲的扩展耐久性数据,其在整个模拟计算范围内均表现出可靠的循环稳定性。

 

 

2 | MAPbBr₃纳米线忆阻器的电学表征。(a) MAPbBr₃纳米线忆阻器的I-V特性曲线。(b) MAPbBr₃纳米线忆阻器在最优模拟计算范围内的增强-抑制特性。(c) 展示10 kΩ至20 kΩ范围内10个不重叠电阻态的图谱。(d) 展示10 kΩ至100 kΩ范围内10个不重叠电阻态的图谱。(e) MAPbBr₃纳米线忆阻器在(±)2.5 V/0.05 V和-1.5 V/0.05 V的写入/读取和擦除/读取脉冲方案下,超过25000次脉冲的耐久性测试结果。写入、读取和擦除脉冲的脉冲宽度均为200微秒。

 

与通过改变脉冲数量来调节电导值类似,电导也可通过改变脉冲高度和脉冲宽度来调节,分别如补充图10a、图10b所示。增强-抑制特性(图2b)具有高度的线性度和对称性。这一特性通过非对称非线性(ANL)因子进行量化,该综合指标的定义为(ANL=(G_{p}(N / 2)-G_{D}(N / 2)) (G_{max }-G_{min }),其中(G_{p}(N / 2)为增强半周期内的中位数电导值,(G_{D}(N / 2)为抑制半周期内的中位数电导值,(G_{max })和(G_{min })ₘᵢₙ分别为该周期内的最大和最小电导值。与单独的非线性因子不同,ANL因子的优势在于能同时捕捉单次更新的线性度以及各次更新间的关键对称性,这对于通过反向传播实现稳定的网络训练至关重要。MAPbBr₃纳米线忆阻器件实现了0.3的低ANL值(补充图10c),该数值可与当前最先进的忆阻器件相媲美,表明其能实现平衡且可预测的权重更新(补充表1)。此外,所有编程状态均表现出完美的欧姆导电特性(补充图11),确保了精确的乘累加运算。该器件在电导调节方面还展现出优异的可靠性,如补充图12a、图12b所示,器件间的周期间变异性<1.5%极低;补充图13所示的器件间变异性<5%也较低,这使得跨器件的权重编程能够精准实现。每个突触事件的最低能耗经估算约为7纳焦(编程)和5皮焦(读取),与模拟计算中所用的当前最先进忆阻器件水平相当(补充表2和补充表3)。在此背景下,还需指出的是,通过电化学阻抗谱和电流-时间响应进一步验证了200微秒的编程和读取脉冲宽度,且器件的RC时间常数经确认显著短于该脉冲宽度(补充图14、图15)。

这种性能的提升源于一种准电化学存储器(ECM)机制,该机制巧妙规避了传统ECM单元和垂直电容存储器(VCM)单元的双重局限。传统ECM单元(采用纯银电极)具备欧姆导电状态,且由于低阻态(LRS)与高阻态(HRS)之间存在显著的阻值差异,其具备实现多种导电状态的潜力;但由于银离子的快速注入引发的(Ag^{+}),会导致导电丝的生长突然且不可控,进而阻碍了模拟调谐(补充图16a)。相反,典型的VCM器件可实现渐进式开关和更可控的权重调制(补充图16b),但往往受限于单位脉冲下电导变化被抑制,这限制了其动态范围,同时随机性更强,会加剧状态的时间抖动。在本研究的设计中,我们巧妙融合了两者的优势:保留银源以获得高动态范围,从而实现多种导电状态;同时引入一层经过精确设计的15纳米氧化铟锡(ITO)层作为半透屏障,构建出准ECM单元,使其能够像纯ECM器件那样实现渐进式电导调制。

为评估ITO对整体导电机理的贡献,我们对一个参比Ag/ITO(15纳米)/Al器件进行了电流-电压(I-V)特性表征。直流I-V特性呈现出完美的线性欧姆行为,未观察到迟滞现象或阻变效应(补充图17a),这证实ITO层可作为电子透明但离子电阻的界面。其可忽略的串联电阻避免了显著的势垒两端的电压降,从而确保钙钛矿纳米线两端的电压得到有效控制。

在双对数坐标下对完整器件的SET扫描进行详细分析,揭示了这一离子驱动金属化过程的电子特征(补充图17b)。斜率的变化过程(0.3→1→10→2→1)描绘了钙钛矿纳米线内银丝的动力学控制电化学演变过程:(1)在正向电压扫描开始时,多晶钙钛矿纳米线中热生成的自由载流子主导了最小电流。在此阶段,施加的电压仍不足以驱动电荷通过ITO势垒实现显著注入。(2)随着电压升高,注入的电荷载流子开始占据主导地位。此时,ITO势垒的限流功能开始生效,使得受控通量的离子被注入到钙钛矿中。离子被还原后,会占据纳米线内的有利位点。(3)电流的近垂直跳变标志着离子与电子过程完全耦合的节点:还原银原子(金属成核位点)的密度达到临界渗流阈值,形成首个连续金属团簇。ITO势垒确保了这一转变既陡峭又可控,避免了纯电化学金属化(ECM)器件中常见的随机行为。(4)一旦形成渗流路径,电子传输便通过不断生长、空间受限的金属丝网络进行。ITO持续供应的银离子使得金属丝的横截面积按照无陷阱空间电荷限制传导(SCLC)类动力学规律增大,这是电导模拟式、渐进式调制的基础。(5)后续的反向电压扫描表现出完美的欧姆特性,证实形成了稳定、连续且较厚的金属银丝,完全桥接了两个电极。准电化学金属化(准ECM)这一术语精准描述了这种工程化的动力学路径,其中ITO势垒构建了速率受限、电化学门控的金属化序列。该机制以可预测、可控的过程取代了随机离子漂移,从而实现了模拟式开关特性。

为进一步验证准ECM开关的稳定性,本研究开展了连续的DC (I-V )扫描。如补充图18所示,100次连续循环展现出优异的循环间可重复性,直接证实了该机制的固有稳定性,并凸显了ITO势垒与纳米线结构的协同作用。ITO层充当动力学稳定剂,确保了速率受限的(Ag^{+})注入通道的一致性,同时抑制了纯ECM单元中典型的随机丝状物过度生长。同时,多孔氧化铝膜(PAM)支架为每条钙钛矿纳米线提供了纳米级限域与电隔离作用,将丝状物形成限定在单个通道内,抑制了横向变异性。

通过系统研究(5纳米至100纳米,补充图19),明确了ITO厚度的关键作用。15纳米的厚度被确定为最佳值,它实现了完美的平衡:既足够厚以形成连续层,对(Ag^{+})离子通量起到速率限制作用,又足够薄以实现受控的逐步注入,进而使灯丝得到良好控制的径向生长。研究发现,更薄的层(5纳米)起到筛子的作用,会导致类似ECM的突变型开关;而更厚的层(50-100纳米)会严重阻碍离子流动,不仅限制了电导范围,还会促成随机的类VCM行为。具体而言,将基于100纳米的VCM型设计与基于15纳米的准ECM架构相比,动态范围减半,时间抖动增大约4倍,状态数量减少约3.5倍,且ANL翻倍。这些发现明确证明了准ECM设计的优越性。用于神经形态应用的钙钛矿忆阻器中所采用的传统垂直导电模式(VCM)设计40,41。通过对绝缘氧化物(HfO_{2})、Al_{2} O_{3})和金属(铬、钛)开展对照实验,进一步证实了氧化铟锡(ITO)作为离子-电子混合导体的独特性;所有这些材料均无法复制准电化学金属化(ECM)行为,要么导致离子传输受阻,要么垂直导电模式(VCM)性能不佳(补充图20和补充说明1)。密度泛函理论(DFT)计算阐明了这一调控效应的物理本质,结果显示,与钙钛矿晶格(0.85电子伏特)相比,银(Ag)在氧化铟锡(ITO)中的迁移势垒更高(2.29电子伏特),银离子需通过非晶态氧化铟锡(ITO)氧亚晶格中的通道迁移(补充图21和补充说明(2) )^{22})。这种离子流量控制在时间分辨的COMSOL模拟中得到了直观呈现(补充说明3),该模拟追踪了高阻态(HRS)到低阻态(LRS)过程中(Ag^{+})浓度的变化(补充图22a-f)。模拟结果证实,银/氧化铟锡(Ag/ITO)器件中存在受控的、渐进式的离子注入,这与无势垒对照器件中观察到的剧烈、突然的离子侵入形成鲜明对比(补充图22g-l)。这一可视化证据直接解释了(I-V)曲线中所观测到的渐进式开关行为。此外,补充图23a和补充图23b表明,带有15纳米氧化铟锡(ITO)势垒的低阻态器件,其电解质电位变化远小于纳米线(NWs)与活性银(Ag)电极直接接触的器件,这说明电刺激下器件的电导变化受到更严格的调控。另外,如补充图24所示,基于脉冲操作的时间依赖性模拟显示,连续施加电压脉冲后,离子会逐步、阶梯式地注入钙钛矿纳米线(NW)中(Ag+)。这种丝状体的渐进式生长与准电化学金属化(ECM)器件固有的模拟开关能力直接相关。

该机理模型通过一系列直接的成分分析得到了明确验证。基于扫描电子显微镜的电子能量损失光谱(EELS)扫描结果见补充图25a-c。当切换到低阻态(LRS)时,与以纯银作为顶层接触的器件相比,带有氧化铟锡(ITO)势垒的器件在纳米线(NWs)中银的信号强度更低。此外,补充图26a-f中的透射电子显微镜(TEM)能量色散X射线光谱(EDS)映射结果显示,前者的银原子平均浓度为1.11%,而无势垒器件的银原子浓度则为2.53%。另外,补充图27展示了这两种器件沿纳米线长度方向的飞行时间二次离子质谱(ToF-SIMS)深度映射,进一步证实了带有氧化铟锡势垒的器件中银的注入量有所减少。更关键的是,截面透射电子显微镜-能量色散X射线光谱(TEM-EDS)映射(补充图28、29)提供了银经氧化铟锡渗透进入钙钛矿纳米线的最直观视觉证据,其中低阻态下纳米线内的银浓度经定量后显著高于高阻态。这些多维度的证据无可辩驳地将银的可控物理迁移与器件增强的电学特性关联了起来。

在完成单器件性能评估与工作机制探究后,我们构建了集成MAPbBr₃纳米线忆阻器的交叉阵列。纳米线在独立的PAM中生长,并以64×64的结构夹在纵横交错的Ag/ITO与铝电极之间,如图3a所示(器件制备的更多细节参见方法部分)。如图3b与图3c所示,电极线宽为100微米,线间平均间距为24.5微米。为实现最优的神经形态处理,器件的阈值写入/擦除电压、开关比等关键指标需具备低离散度(2σ/平均值)。图3d展示了4096个纳米线忆阻器的写入电压分布图,其离散度为15.55%;图3e则呈现了擦除电压分布图,离散度为25.8%。

 

 

3 | 64×64 MAPbBr₃ 纳米线(甲胺铅溴纳米线)忆阻器阵列的电学性能。(a) (MAPbBr3) 纳米线忆阻器阵列的照片(比例尺:1毫米)。(b) 显示电极线宽和接触焊盘宽度的扫描电镜(SEM)图像(比例尺:100微米)。(c) 显示电极线间距和线间空隙的放大扫描电镜(SEM)图像(比例尺:50微米)。(d) 4096个MAPbBr₃纳米线忆阻器的置位电压变化图。(e) 4096个MAPbBr₃纳米线忆阻器的复位电压变化图。(f) 在0.2伏读取电压下测得的4096个MAPbBr₃纳米线忆阻器的开关比图。(g-k) 展示在MAPbBr₃纳米线忆阻器阵列中写入“HKUST”标识后其电阻随时间演变的电阻图。

 

适用于所有器件。在0.2伏读取电压下测得的开关比,在所有忆阻器中的变化幅度为15.12%,如图3f所示。图3g-j展示了阵列中忆阻器的编程与保持特性,其中还写入了香港科技大学的校徽。首先,将校徽转换为灰度图像,其像素强度范围为0至255。随后,通过线性变换得出与像素强度对应的电阻值,范围在(10^{4} Omega)欧姆至(10^{5} Omega)欧姆之间。忆阻器采用半偏置方案进行编程,同时利用接地读取方案读取电阻值,以规避旁路问题,具体细节见补充说明4和补充图30。在(10^{6})秒的时间范围内,图案未出现任何衰减,这凸显了交叉阵列出色的保持特性。总体而言,这款64×64的甲脒铅溴纳米线忆阻器阵列是目前卤化物钙钛矿领域报道过的最大尺寸阵列,其开关参数变化极低且保持性能优异,为其在复杂神经形态处理运算中的应用奠定了基础。

头部固定的斑马鱼幼体捕食行为检测分析 斑马鱼因其胚胎透明且发育迅速,成为神经生物学研究中广泛使用的模式生物43。研究斑马鱼幼体在捕食等行为过程中展现出的动态且复杂的运动模式,有助于深入理解神经回路的功能,尤其是脊椎动物中感觉输入与运动输出的整合机制。与MNIST数据集的静态图像不同,斑马鱼头部和颌部的运动是随时间变化且受多种外部因素影响的真实生物数据。这使其成为面向真实世界生物、实验及生态监测应用技术的优质测试平台。

尽管大多数视觉系统都能估算物体距离⁴⁴,但支撑这一能力的神经机制在很大程度上仍未被探索。人类利用深度感知来在环境中导航并完成日常任务,而动物则将其应用于各类视觉行为,例如捕猎。斑马鱼幼体在捕猎过程中表现出多种距离依赖性视觉行为:在中等距离时,它们会通过双眼汇聚和尾部摆动朝向猎物定向;而当猎物处于攻击距离内时,便会发起攻击。这种攻击会产生吸力将猎物吸入口中,这一过程由头部向上运动和下颌快速向下运动共同驱动。尽管在头部固定的幼体中,猎物捕获的初始阶段已得到广泛研究⁴⁵,⁴⁶,但此类条件下的攻击行为却鲜有记载。为研究距离估算能力,本研究开发了一种头部固定的攻击检测方法,该方法可诱发攻击行为,并通过头部抬升程度对其进行量化,以解析相关神经回路。获取斑马鱼攻击数据集的实验装置详见补充说明5及补充图。

对这些撞击进行量化需要开发一种算法。在之前报道的一项研究中,研究人员开发了一种算法,该算法利用密集光流算法来测量头部的总向上运动,在基于头部向上运动的撞击检测中实现了约92%的准确率。然而,该算法还会将一些非撞击动作(如挣扎和吞咽)错误归类为撞击。出现这种误分类的原因是,该算法仅以头部向上运动为依据,而自由游动斑马鱼的真实撞击运动学特征既包括头部抬高,也涉及下颌下压,后者是这对于产生吸力至关重要。在头部固定的实验中,真实的攻击行为与下颌下压同步发生,而这一因素算法并未考虑。此外,该算法仅识别出头部抬起的帧,却未能捕捉到其他关键运动学数据,例如头部下降的时机、下颌下压与头部抬起的协调关系以及二者的时间差。这些局限性凸显了先进深度神经网络有必要纳入这些额外参数,从而提升其在研究斑马鱼行为以及解析潜在神经环路方面的准确性和有效性。


基于忆阻器阵列的斑马鱼捕食行为片外检测

研究人员开发了一个五层深度神经网络,用于精准识别头部和颌部运动以检测攻击,如图4a所示。该神经网络包含两个用于特征提取的3×3卷积层,随后是三个执行分类任务的全连接层。补充图34展示了分类的流程,具体步骤如下:首先,对训练数据进行预处理,从前述数据采集过程所拍摄的视频中提取鱼的图像,从原始图像中裁剪出鱼头并压缩至32×32像素格式,以匹配神经网络的输入尺寸。随后,将最后隐藏层的4095个权重作为电导值,通过半偏置电压方案传输至64×64 MAPbBr₃纳米线忆阻器阵列,如图4b和补充图35所示。编程通过开环写入技术完成(详见补充说明4),该技术使阵列中电导最高和最低的编程值对应的写入干扰窗口分别为0.6微西和3微西。完成编程后,采用接地读取技术读出忆阻器的电导值,向整个阵列逐行施加0.1伏的读取电压。理想电导值(由软件获取)与从阵列读出的电导值之间的偏差以读取误差图的形式呈现于补充图36a。选用接地读取方案是因其具备高读取裕量且能有效抑制寄生通路电流,使阵列可执行乘累加运算⁵⁰。这种配置使线路电阻成为主要但可控的误差来源,产生的最大电导误差约为9%(补充图36a)。关键的是,在系统层面,该误差与轻微的写入干扰(读取误差图中的异常点)的综合影响可忽略不计,因为即使模拟的电导偏差远大于实验观测值,分类准确率仍保持在较高水平(补充图36b)。若不采用接地读取方案,寄生通路电流将主导读取过程,导致阵列无法正常工作(补充图36c)。如补充图37所示,该方法实现了94%的分类准确率;补充图38和补充视频3则展示了利用物理忆阻器阵列的调谐权重,对检测攻击所需的九种头部和颌部运动类别进行分类的结果。图4c的分类结果清晰表明,九种运动类别均能被有效识别,且头部/颌部运动的分类类型相较于其他类型具有最高的神经元输出。由此获得的精准片外分类结果,证明了基于64×64纳米线的忆阻器阵列具备无缝且稳定的电导调谐能力,适用于复杂的神经形态应用。

 

 

4| 64×64 MAPbBr₃ 纳米线忆阻器阵列对斑马鱼攻击模式的片外分类。(a) 对九种斑马鱼攻击模式进行分类的神经网络示意图(比例尺:100 微米)。(b) 写入64×64钙钛矿纳米线忆阻器的电阻值。(c) 分类网络的神经元输出,该网络利用了64×64钙钛矿纳米线忆阻器阵列的调谐电导值。NR0至NR8代表被分类的九种头部和颌部运动。该分类基于单帧推理完成。

 

用于片上推理的多层感知器

为研究斑马鱼捕食行为的检测,头部角度被确定为可靠的运动学标记之一。此外,下颌下压行为在捕食过程中有助于嘴巴张开,是进食或攻击行为的机械前兆。研究下颌下压与头部角度,能够揭示大脑中运动系统与感觉系统之间的协调机制。头部角度和下颌下压均能提供精准的时空标记,用于将捕食行为与神经数据进行匹配。通过分析这些行为与神经激活的关联,研究人员可绘制出调控捕食行为的特定神经回路。这一认知对于阐明距离估算相关的神经回路至关重要,因为它需要识别出不同脑区中与这些事件相关的特定神经元及其相互作用⁵¹。从器件角度来看,将基于忆阻器的多层感知器(MLP)应用于斑马鱼运动学研究,为其模拟计算能力提供了关键验证,突破了简单基准测试的范畴。与常被二值化的高对比度输入图像不同,斑马鱼运动的精准分类依赖于细微的灰度信息,这要求从输入到计算过程实现真正的模拟处理。这项复杂任务直接验证了实现如此高精度的关键器件特性:高动态范围内的多个非重叠电导状态,以及用于精准模拟乘法运算的欧姆线性特性。因此,这种片上推理的演示证明了该系统适用于处理生物传感领域中复杂的真实世界数据流。

基于上述前提以及研发低功耗钙钛矿纳米线忆阻器基多层感知器(MLP)的意图,本研究设计了一种深度神经网络(DNN)。如图5a所示,该网络通过回归(1个输出)估计鱼的头部角度,并通过分类方法(2个输出)判断鱼嘴的开合状态,从而有效阐明鱼的攻击模式。该神经网络包含两个部分:第一部分通过四层配备ReLU激活函数的卷积层和四层池化层完成特征提取;第二部分包含三层线性层,用于执行回归和分类任务(详细信息见补充信息注6)。 如图5b、5c所示,研究人员依次采用尺寸为16×16、8×8和4×6的三个MAPbBr₃纳米线(NW)基忆阻器阵列作为多层感知器(MLP),以模拟上述深度神经网络(DNN)的三层线性层。在软件中完成训练后,通过简单的线性变换将得到的权重转换为电阻值:

 

其中,R为待映射的电阻值,w为线性层的权重。电阻值被限定在104 Ω∼105 Ω欧姆的范围内。 完成特征提取后,计算得到的电导值被物理映射到尺寸分别为16×16、8×8和4×6的独立MAPbBr₃纳米线忆阻器交叉阵列上。这种直接映射意味着,每个软件定义全连接层的权重矩阵以对应物理阵列的电导矩阵形式存储。卷积层输出的张量被相应转换为0至0.5伏的模拟输入电压范围,并施加到阵列的行端。这些电压与突触权重(电导)相乘,所得电流通过基尔霍夫定律沿列端求和,在单个并行步骤中完成向量-矩阵乘法(VMM)。

 

 

5 | 基于(MAPbBr _{3})纳米线忆阻器阵列的多层感知器(MLP)对斑马鱼攻击模式的片上分类与回归。(a) 神经网络通过回归和分类方法分别估算攻击状态下斑马鱼的头部角度和下颌运动的示意图(比例尺:100微米)。(b) 基于MAPbBr₃纳米线忆阻器阵列的多层感知器照片——(左)三层线性层,分别包含尺寸为16×16、8×8和4×6的、基于(MAPbBr3)纳米线的忆阻器阵列;(右上、右下)物理多层感知器中实现乘累加运算和层间数据传输的电路。(c) 执行回归和分类任务的、整体基于忆阻器阵列的多层感知器示意图。(d) 图表展示了基于MAPbBr₃纳米线忆阻器阵列的多层感知器对31个测试样本的斑马鱼头部角度预测值,以及相对于软件计算值的相对误差。(e)展示由基于MAPbBr₃纳米线忆阻器阵列的多层感知器预测的斑马鱼攻击行为中颌部运动分类的图。该分类与回归均基于单帧推理完成。

 

为了在片上处理过程中兼顾正权重和负权重,在执行乘累加(MAC)操作时采用了一对差分忆阻器运算过程。具体而言,相邻正、负忆阻器列的输出电流相互相减,得到净输出电流,公式如下

 

其中 i,j ���� 中,i、j 结合行号和列号代表忆阻器阵列的每个单元,R 和 (R') 分别代表具有正、负权重的忆阻器的电阻。为了实现数据在各层间的无缝传递以及最终回归和分类输出的生成,系统采用了配套电路。如补充图39所示,数据采集板集成了16通道数模转换器(DAC)、8通道差分信号预处理电路,支持最大16×16规格的忆阻器阵列。由于采用差分对设计,其有效配置可视为16×8。16个DAC通道通过串行外设接口(SPI)总线和多路复用器进行顺序控制,实现按序写入电压值以驱动忆阻器阵列。忆阻器的数据线以差分对形式排布并连接至信号预处理电路。电流信号首先通过跨阻放大器(TIA)转换为电压信号,再经二级放大器放大至合适范围。放大后的信号通过8通道多路复用器传输至16位模数转换器(ADC),从而实现精准的数据采集。补充图40详细展示了控制板的连接方式,该控制板集成了电源模块和微控制器单元(MCU),可管理多达三块数据采集板。MCU实现了向数据采集板上DAC的顺序数据写入以及从ADC的数据读取。通过通用异步收发传输器(UART)串口与上位机实现通信,保障了数据的无缝传输和系统控制。层间数据中继的工作原理如补充图41所示。其运行模式通过顺序迭代的流程实现:首先,原始输入数据被写入第一块数据采集板上的数模转换器(DAC);随后,通过模数转换器(ADC)提取一阶数据并进行基本的数据处理;接着,处理后的数据被传输至第二块数据采集板上的DAC,再通过ADC获取二阶数据。整个过程在各板之间迭代重复,直至得到目标输出值。输出的回归和分类值处于-2.5V至2.5V的电压范围内。预测的头部角度值经线性变换后,与软件计算结果进行对比,如图5d所示。软件与忆阻器得到的回归预测输出差值小于6.5%。该微小偏差主要源于权重到电阻值线性转换过程中的权重量化,对预测结果的影响可忽略不计。训练数据集的头部角度估计细节见补充说明7和补充图42。图5e根据输出电压展示了嘴巴开合的分类状态:对应嘴巴张开的神经元输出,其电压值越高,表明攻击过程中嘴巴处于张开状态,反之则为闭合状态。片上推理对所有31个测试样本均准确识别出头部角度和颌部运动。分类任务的整体模型准确率和损失曲线(由软件计算)如补充图43a-c所示。该模型不仅通过回归准确预测了斑马鱼攻击时的头部角度,还实现了96%的分类准确率。基于MAPbBr₃纳米线忆阻器阵列的多层感知器(MLP)完成分类与回归任务的全流程如补充图44所示。

此外,本研究开展了全面的系统级分析,以评估钙钛矿纳米线忆阻器平台的技术水平与可扩展性,相关细节见补充表4、5及补充说明8。该本征模拟核心展现出卓越的能效,完成所实现的三层感知器的全部344次乘累加运算仅消耗约34纳焦,核心整体延迟为600微秒。这使得钙钛矿忆阻器核心在基于忆阻器的新型模拟存内计算技术领域中具备显著的竞争优势(补充表6)。基于MAPbBr₃纳米线的多层感知器架构的通用特性也通过经典的MNIST分类任务得到验证,其中基于硬件的三层感知器实现了94%的推理准确率(补充说明9、补充图45),证实了该系统在标准机器学习基准测试上的多功能性与具有竞争力的性能。


讨论

本研究展示了一种基于多孔氧化铝膜内垂直排列的MAPbBr₃纳米线阵列的高密度、可靠忆阻器技术。该结构是实现优异器件间均匀性和稳定性的关键。研究提出了一种准ECM开关机制,其中经过精确设计的ITO层充当半透屏障,以调控银离子的注入,从而引导可控的径向丝生长。通过密度泛函理论、COMSOL仿真和直接成分分析,该机制得到了全面验证,并被证实是改善模拟开关特性的关键因素。这些特性包括高动态范围、多个线性、欧姆型且稳定的电导态、最小的器件间和周期间变异性、长保持时间以及优异的耐久性。这一性能支持构建了64×64的钙钛矿基无源交叉阵列,这是目前报道的最大规模阵列,其开关参数变异性极低。该阵列的可靠性通过图像记忆和长时间保持等严苛任务得到了验证。本研究的核心成果是利用这些钙钛矿忆阻器阵列物理构建了多层感知器(MLP)。这种基于硬件的MLP成功应用于复杂的现实信息处理,实现了斑马鱼幼鱼攻击行为中头部角度的同步回归与颌骨运动的分类。因此,本研究最终验证了一种可扩展平台的可行性,该平台集成了高密度忆阻器、可靠的模拟计算和硬件级MLP集成。本研究将卤化物钙钛矿忆阻器从具有潜力的材料体系提升为适用于可靠神经形态硬件的竞争性技术。


方法

材料

除非另有说明,所有化学品均购自Sigma-Aldrich公司,直接使用,未进行任何额外纯化。具体而言,用于制备钙钛矿纳米线的化学品包括无水甲基溴化铵 (≥99%)、溴化铅(99.999% 痕量金属基准)以及二甲基亚砜 (≥99.9%)。

自支撑多孔氧化铝膜(PAM)的制备:为制备多孔氧化铝膜(PAM),将1.5厘米×2厘米的铝片进行电抛光以消除表面粗糙度,所用溶液为25%高氯酸和75体积%无水乙醇(CH₃CH₂OH)。通过在20伏电压下采用0.2摩尔/升草酸的两步阳极氧化工艺,可制得高度有序的PAM。随后,在98摄氏度下使用磷酸混合物(6重量% (H_{3} PO_{4})和1.8重量% (CrO_{3})去除初始氧化层,留下自然的六方有序结构,该结构可提高后续阳极氧化的均匀性。PAM通道的尺寸(包括长度和直径)可通过施加电压和阳极氧化时长进行调控。本工艺中,在40伏电压下阳极氧化30分钟,可得到厚度约1-1.5微米、孔径约40纳米的PAM模板。随后,采用电压降法用0.2摩尔/升草酸溶液对PAM的阻挡层进行减薄处理,以确保钙钛矿纳米线与底电极之间能通过约4纳米的阻挡层实现电子隧穿²⁶。首先涂覆一层晶胶(509,泰德佩拉公司),这是一种流动点为120摄氏度的胶粘剂,用于覆盖PAM/铝片。随后将整个组件垂直浸入饱和氯化汞溶液中将样品置于溶液中约1小时以腐蚀掉铝基底。随后,将样品转移至丙酮中以去除晶体键合剂。约30分钟后,用干净的硅片收集自立式PAM,并将其浸入新鲜丙酮中再处理20分钟,以去除所有残留的晶体键合剂。最后,将PAM在80摄氏度下烘烤2分钟,使其从硅基底上自然脱落。

(MAPbBr_{3}) 纳米线的生长与电极沉积:在空白聚丙烯酰胺(PAM)的阻挡层一侧,随后以200瓦功率、0.3帕斯卡的条件溅射100纳米厚、100微米宽的铝线。该带有铝线的PAM被放置在硅基底上,铝线朝向硅。甲脒溴化铅(MAPbBr₃)通过溶剂工程在制备所得的独立式PAM模板上制备纳米线阵列,该模板支撑在新鲜硅基底上。前驱体溶液通过将CH₃NH₃Br和PbBr₂以1:1的摩尔比溶解在二甲基亚砜(1.1克/毫升)中制得。旋涂前,对等离子体清洗后的PAM芯片进行高亲水处理,以确保钙钛矿前驱体溶液具有优异的润湿性。滴涂后,采用1-2分钟的关键静态孵育期。在此期间,孔隙填充主要由毛细作用而非离心力主导,前驱体溶液自下而上均匀填充至高长径比的孔隙中。对于纳米结构而言,这种被动填充过程本身比单纯的动态旋涂过程更均匀,因为避免了导致填充不完全的气泡和压力梯度形成。随后,以3000-4000转/分钟的转速进行旋涂,以去除PAM上表面的多余溶液,防止形成连续的覆盖膜,并确定弯液面,将钙钛矿初步限制在每个孔隙内。在100℃下退火10分钟,促使MAPbBr₃在孔隙的纳米限域内受控结晶,其中阳极氧化铝壁充当支架,引导晶体生长并促进形成高度取向的纳米线。旋涂速度经实验优化至狭窄范围;转速过低会导致表面残留膜,需要额外进行低电压(Ar^{+})离子刻蚀步骤,而转速过高则可能导致孔隙去润湿。随后,通过射频溅射工艺,在约0.3帕的压力和50瓦的低功率下沉积厚度为15纳米的氧化铟锡(ITO)线路,确保钙钛矿纳米线不受损伤。接着,将厚度为85纳米的银线路与ITO线路精准对齐,通过热蒸发进行沉积,并在银-氧化铟锡线路上完成引线键合。在芯片上表面涂覆超薄紫外环氧胶(NOA81)层,随后在紫外光照射下固化10分钟。基于PAM/Al芯片的epoxy/Ag-ITO/MAPbBr₃纳米线从硅基底上剥离并翻转。在铝线路上进行引线键合。交叉的Ag-ITO与铝线路在阵列中有效构成忆阻器,每个单元的尺寸为100微米×100微米。


材料表征

扫描电子显微镜(SEM)图像通过加速电压为10千伏的JEOL 7100F型扫描电子显微镜以及5千伏的FEI Helios G4 UX型扫描电子显微镜采集。透射电子显微镜(TEM)采用JEM ARM200F型设备进行测试。用于SEM/TEM分析的横截面薄片通过双束聚焦离子束/场发射扫描电子显微镜(FEI Helios G4 UX)系统制备,该系统集成了一根用于刻蚀的(Ga^{+})离子束和一根用于成像的高分辨率电子柱。针对补充图26对应的TEM-EDS分析,纳米线(NWs)通过粉碎和超声法从聚丙烯酰胺(PAM)中挤出21。具体而言,纳米线先在独立的聚丙烯酰胺中生长,随后在研钵和研杵中进行强力粉碎。之后,将粉末与甲苯混合,并进行10分钟的超声处理。上层的澄清溶液中含有挤出的纳米线,将其滴涂在透射电子显微镜载网上,随后将载网在60摄氏度下加热5分钟以蒸发溶剂。光致发光(PL)性能采用爱丁堡FS5型仪器测量,材料的吸收特性则通过珀金埃尔默公司的Lambda 1050+型分光光度计进行评估。X射线衍射(XRD)分析使用布鲁克D8型X射线衍射仪完成。二次离子质谱(SIMS)分析通过ToF SIMS V型设备(德国ION-TOF公司)完成。


电学表征

单器件测量:利用吉时利4225脉冲测量单元(PMU)的任意波形发生器模块以及吉时利4200半导体特性分析系统(SCS),生成幅度、宽度和间隔各不相同的电脉冲,并同步记录单器件的输出电流。利用吉时利2450源表并结合定制的LABVIEW程序,完成时间稳定电导级别的记录以及电流-电压(I–V)特性表征。

64×64阵列的测量方法:忆阻器阵列通过64×64探针卡进行连接,该探针卡与一套完整的外围控制及读出系统相连。为实现电导状态的选择性编程,采用1/2电压偏置方案以抑制潜通路电流。在此方案中,选定行的偏置电压为+V/2,选定列的偏置电压为–V/2,这样既在目标单元两端施加了完整的工作电压,又将所有未选线路偏置至地电位,从而最大程度减小非目标器件上的寄生电压降。

在读出操作中,采用了地面读取方案。在该配置下,输入电压施加到选定的行,而所有列均由一组跨阻放大器(TIAs)端接。阵列测量技术及相关偏置方案的详细信息在补充图30和补充说明4中进一步阐述。

多层感知器实现:HGC5615数模转换器(DACs)将数字输入信号转换为模拟电压。这些模拟电压值随后被传输至忆阻器,在无源交叉开关阵列中,每个忆阻器都具有不同的突触权重或电导值。流过每个忆阻器的电流直接与输入电压与忆阻器电导的乘积成正比,从而有效完成模拟乘法运算。忆阻器阵列通过整层的向量-矩阵乘法执行乘累加(MAC)运算,所得电流在每个输出节点处求和。运算放大器(运放)OPA4376 用于从相邻忆阻器位线获取差分输出并调节输出电流,确保其达到后续处理所需的合适水平。多路复用器(MUX)ADG1606 用于将相关信号路由至下一层,而 ADC7683 负责将调节后的模拟信号转换为数字形式,再传输至 ESP32-WROOM-32D 多控制器单元(MCU)。激活函数在模数转换后于微控制器(ESP32-WROOM-32D MCU)的数字域中应用。这一设计为算法开发和概念验证演示提供了最大的灵活性。在全集成、优化的系统中,该功能可通过低功耗模拟电路(如电流模式比较器)实现,以最大限度降低延迟和能量开销。MCU 主要负责有序地向数模转换器(DAC)写入数据,并从数据采集板上的模数转换器(ADC)读取数据。这些数模转换器(DAC)将数字输出重新转换为模拟电压,再施加到下一层的忆阻器上。该过程在神经网络的每一层依次重复,从而实现复杂的多层处理。与主机的通信通过通用异步收发传输器(UART)串口完成,可实现无缝的数据传输与系统控制。


斑马鱼数据集的采集

斑马鱼相关研究已获得香港科技大学动物伦理委员会批准,实验方案编号:AEP-2022-0107。斑马鱼幼鱼的行为采用成熟的实验方案进行记录³⁹。行为学实验流程为:将斑马鱼幼鱼饲养在丹尼奥氏溶液中,分别在受精后第5天和第7天投喂草履虫(多小核草履虫,购自卡罗莱纳生物供应公司)。实验前,将受精后6、7或8天的幼鱼(dpf)包埋在Rinzl塑料盖玻片的2%低熔点琼脂糖中,使其眼睛和尾部可自由活动。实验于22℃的暗室中进行,使用配备特氟龙织物屏幕的长方形丙烯酸竞技场(60×80×30毫米),并采用红外照明(850纳米,来自Advanced Illumination公司的MicroBrite高强度聚光灯)。高速摄像机(200帧/秒)用于记录尾部和眼部运动:左侧安装一台搭载VZM 450i直角变焦成像镜头的BFS-U3-04S2M-CS USB3.1 FLIR黑蝇S单色摄像机,下方配备一台搭载Sigma 105毫米镜头的Photon Focus MV1-D1312E-160CL-12摄像机。视觉刺激程序通过Python和PsychoPy编写,具体为在黑色背景上呈现一个4毫米的紫外线圆点,以200度/秒的速度水平扫过(角度范围-70°至70°);刺激以随机顺序呈现,每次呈现10秒,间隔1分钟。