多种连接模型的忆阻神经网络学习

引用本文

李传东, 田园, 陈玲, 葛均辉. 多种连接模型的忆阻神经网络学习[J]. 重庆大学学报, 2014, 37(6): 10-16, 24. DOI: 10.11835/j.issn.1000-582X.2014.06.002. 复制到剪切板

LI Chuandong, TIAN Yuan, CHEN Ling, GE Junhui. Learning in memristive neural networks with various connection patterns[J]. Journal of Chongqing University, 2014, 37(6): 10-16, 24. DOI: 10.11835/j.issn.1000-582X.2014.06.002. 复制到剪切板

基金项目

国家自然科学基金资助项目（61374078）

作者简介

李传东(1969-), 男, 重庆大学教授, 博士生导师, 主要从事非线性系统理论、人工神经网络、混沌控制与同步、忆阻器等研究; (E-mail)licq@cqu.edu.cn。

文章历史

收稿日期: 2014-05-07

Contents Abstract Full text Figures/Tables PDF

多种连接模型的忆阻神经网络学习

李传东, 田园, 陈玲, 葛均辉

重庆大学计算机学院, 重庆 400044

收稿日期: 2014-05-07

基金项目: 国家自然科学基金资助项目（61374078）

作者简介: 李传东(1969-), 男, 重庆大学教授, 博士生导师, 主要从事非线性系统理论、人工神经网络、混沌控制与同步、忆阻器等研究; (E-mail)licq@cqu.edu.cn。

摘要: 忆阻器以其独特的非易失性、天然的记忆功能以及纳米级尺寸，在人工神经网络、信号处理和模式识别等方面展现了巨大的应用前景。采用了基于STDP学习规则的忆阻神经网络，运用了网络自适应突变以及网络拓扑结构变化的基因算法，其中包括隐藏层神经元个数，连接权重以及神经网络突触模型的变化。比较了基于HP线性忆阻器模型，非线性忆阻器模型以及阈值模型这3种不同忆阻器模型的忆阻神经网络，并提出了学习效果更好的混合型忆阻神经网络。

关键词: 忆阻器突触可塑性基因算法拓扑变异混合型忆阻神经网络

Learning in memristive neural networks with various connection patterns

LI Chuandong , TIAN Yuan , CHEN Ling , GE Junhui

School of Computer Science, Chongqing University, Chongqing 400044, China

Abstract: Due to the useful properties of nonvolatile, memory and nanoscale, memristors have prospective promising applications in artificial networks, pattern recognition and signal processing.This paper exploits the learning rule of the memristive network based on spiking timing dependent plasticity (STDP) and uses the genetic algorithms with self-adaptation and variable topologies, which allows the number of hidden neurons, connection weights, and connectivity pattern to change self-adaptably.Three memristor models are respectively used as the synapse in the network, including HP linear memristor, non-linear memristor and threshold memristor.The comparison of the performance of the three memristive neural networks is presented, and the hybrid memristive networks' learning effects are analyzed.

Key Words: memristors spiking timing dependent plasticity(STDP) genetic algorithms(GA) variable topologies hybrid memrisitive neural network

1971年，蔡少棠(Leon Chua)教授根据电路理论公理的完备性定义了磁通量和电荷之间的关系，提出了忆阻器(memory resistor，Memristor)这一概念^[1-2]。它是继电阻、电容、电感之后的第4个基本电路元件。2008年，惠普实验室研究人员运用蔡少棠理论成功地将纳米级开关应用到了交叉横梁板结构中^[3]，发现了忆阻器实物模型^[4]。至此，忆阻器这一新型的非线性两端电路元件，以其独特的功能特性吸引了大批研究者的目光。

尤其值得关注的是忆阻器与人工神经网络的结合。人工神经网络是通过模仿人脑和生物系统的各种工作和学习方式来实现智能，所以人工神经网络必然会向着复杂化和大规模化发展，而忆阻器的纳米级环境为此提供了实现的可能。由于忆阻器的非易失性和记忆特性，使得它在网络中可以充当一个天然的突触。以忆阻器作为突触所构建的神经网络便称为忆阻神经网络^[5-8]。

在神经网络中，为了更好地挖掘网络的计算能力，通常需要采用一定形式的学习机制。文献[7]构建的忆阻神经网络中采用了Hebb学习算法，用于解决神经元之间的联想学习问题，但从实验中可以发现，其联想学习过程并不完善，Hebb学习算法不能进行联想修正；而STDP学习规则却可以很好地达到这一目的，利用STDP突触可以根据前后神经元的兴奋时间差改变其状态，即改变连接权重。因此文中选择采用STDP学习规则作为网络的学习机制。文献[9]从数学理论上对基因算法在神经网络中的性能进行了分析，但遗憾的是并没有将其在运用在具体实验中，文中在神经网络中结合了忆阻器，在其演化过程中，通过基因算法(genetic algorithms，GA)完成了在网络中添加或移除神经元和神经元间的连接(即忆阻器)。文献[5]中证明了STDP学习规则在忆阻神经网络中的可行性，但文献[5-8]中所使用的忆阻器均为单一模型，缺乏灵活性，文中分析了不同模型的忆阻器作为突触时对整个网络的影响，并通过比较得出混合模型的忆阻器比单一模型的忆阻器性能更优。

1 忆阻器模型 1.1 惠普线性忆阻器模型

该模型是将2层TiO₂薄膜夹在铂片中间^[3]：一层TiO₂薄膜由于缺少部分氧原子带正电TiO_2-x，称为掺杂区；另一层TiO₂薄膜表现为绝缘体TiO₂，称为非掺杂区。当有电流通过掺杂区时，缺氧的TiO_2-x会向正常一侧偏移。此元件通过“掺杂物”在掺杂区和非掺杂区之间的偏移来模拟忆阻器的特性^[3]。

若用D代表整个元件的长度，w(t)代表掺杂区的长度，它可以被定义为

$ \frac{{{\rm{d}}w\left( t \right)}}{{{\rm{d}}t}} = \frac{{{\mu _{\rm{V}}}{R_{{\rm{on}}}}}}{D}i\left( t \right), $

(1)

式中：R_on是掺杂物充满整个区域时的极限阻值，μ_V是掺杂区的迁移率，其值为10^-14 m²·s^-1·V^-1。

1.2 惠普非线性忆阻器模型

非线性忆阻器模型与线性忆阻器模型是相对应的。对于确定的模型μ_V，R_on，D都是常数，故边界的迁移速度与流经的电流确为线性关系，如式(1)所示。然而，实际中的忆阻器是一个纳米级元件，给它施加一个小的电压，就会产生巨大的电场，这将导致一种显著的能量势垒的减小，使得离子偏移出现非线性特性^[10-11]。为了模拟这种非线性离子偏移特性，需要利用窗口函数，该表达式为

$ \frac{{{\rm{d}}w\left( t \right)}}{{{\rm{d}}t}} = \frac{{{\mu _{\rm{V}}}{R_{{\rm{on}}}}}}{{{D^2}}}i\left( t \right)f\left( t \right)。$

(2)

窗口函数主要有2种，Joglekar窗函数和Biolek窗函数。研究采用的是Biolek窗函数，其对应的函数表达式^[11]为

$ f\left( x \right) = 1-{\left( {x-{\mathop{\rm sgn}} \left( {-i} \right)} \right)^{2\mathit{P}}}, {\mathop{\rm sgn}} \left( i \right) = \left\{ \begin{array}{l} 1\;\;\;i \ge 0.\\ 0\;\;\;i < 0, \end{array} \right. $

(3)

式中：P为正整数，称为窗函数的控制参数；sgn(·)为符号函数。若电流i方向为正，即i≥0，则sgn(i)=1，f(x)=1-(x-1)^2P；若电流方向i为负方向，即i＜0，则sgn(i)=0，f(x)=1-x^2P。

1.3 分段线性模型

分段线性模型是由Itoh提出的，他将忆阻器定义为单调递增和分段线性的元件^[12]。应用最多最广的分段线性模型是电压阈值模型^[13]，所谓电压阈值模型是指当施加在忆阻器两端的电压超过一定幅度时，忆阻器的迁移边界才会变化，反之则不会，或者变化极小。

电压阈值模型下的忆阻器阻值

$ {{\dot R}_{\rm{m}}}\left( t \right) = \left\{ \begin{array}{l} \;\;\;\;\;\;\;\;a{\nu _{\rm{m}}}, \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{if}}\;\;\;\;\left| {{v_{\rm{m}}}} \right| \le {v_{\rm{t}}}, \\ {\mathop{\rm sgn}} \left( {{v_{\rm{m}}}} \right)b[\left| {{v_{\rm{m}}}} \right|-{v_{\rm{t}}}]\;, \;\;\;{\rm{if}}\;\;\;\;\left| {{v_{\rm{m}}}} \right| > {v_{\rm{t}}}, \end{array} \right. $

(4)

式中：v_m表示施加在忆阻器上的电压；v_t表示忆阻器的阈值电压；参数a和b分别表示当施加在忆阻器上的电压大于或小于阈值电压时迁移边界的变化率。

从式(4)可以看出，忆阻器阻值的变化与施加在它上面的电压是线性相关的。若将参数a设为0或者相对于b而言一个极小的数，那么可以认为当电压低于阈值时，忆阻器的阻值是不变的，也即迁移边界不发生改变，或变化极小。基于此，可以将高于阈值的电压作为写电压，将低于阈值的电压作为读电压和保护电压^[14]。

2 STDP学习算法

STDP (spiking timing dependent plasticity)这种突触可塑性传导机制被认为是与学习和记忆密切相关的脑神经突触机制之一^[15]。该算法是由Hebb学习算法改进而来，是一种时间非对称形式的Hebb学习，它与突触前后神经元产生动作电势的先后顺序有关。

STDP在生物学神经网络中对突触的影响与忆阻器的工作机制非常相似^[16-17]。生物体的细胞膜就类似于忆阻器的薄膜，而生物体神经递质的传递就类似于忆阻器掺杂物的迁移，如图 1(a)所示。

图 1 突触模型及神经元动作电势

规定，前后神经元在受到刺激后所释放的动作电势是一样的，为

$ {\rm{spk}}\left( t \right){\rm{ = }}\left\{ \begin{array}{l} \;\;\;\;\;\;A_{{\rm{mp}}}^ + \;\;\;\;\;\;\;\;\;-t_{{\rm{ail}}}^ + < t < 0, \\ -A_{{\rm{mp}}}^-\cdot t - {\tau ^ - }\;\;\;\;0 < t < t_{{\rm{ail}}}^ -, \\ \;\;\;\;\;\;\;\;\;\;0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;其他。\end{array} \right. $

(5)

如果将轴突和树突考虑成信息的传输线，那么传输过程中肯定存在能量衰减，用α_pre表示前向神经元的衰减情况，α_pos表示后向神经元的衰减情况^[18]。于是可以得到前后神经元在t时刻的动作电势。

$ {V_{{\rm{mem - pre}}}}\left( t \right) = {\alpha _{{\rm{pre}}}}{\rm{spk}}\left( {t - {t_{{\rm{pre}}}}} \right),{V_{{\rm{mem - pos}}}}\left( t \right) = {\alpha _{{\rm{pos}}}}{\rm{spk}}\left( {t - {t_{{\rm{pos}}}}} \right), $

由此忆阻器上的电压可以表示为

$ {v_{{\rm{MR}}}}\left( {t'} \right) \approx {V_{{\rm{mem - pos}}}}\left( {t'} \right) - {V_{{\rm{mem - pre}}}}\left( {t'} \right){\rm{ = }}{\alpha _{{\rm{pos}}}}{\rm{spk}}\left( {t' - {t_{{\rm{pos}}}}} \right) - {\alpha _{{\rm{pre}}}}{\rm{spk}}\left( {t' - {t_{{\rm{pre}}}}} \right)。$

(6)

对公式(6)做适当的参数替换，令t=t′-t_pos、Δt=t_pos-t_pre，可以得到

$ {v_{{\rm{MR}}}}\left( {t,\Delta t} \right) = {\alpha _{{\rm{pos}}}}{\rm{spk}}\left( t \right) - {\alpha _{{\rm{pre}}}}{\rm{spk}}\left( {t + \Delta t} \right)。$

(7)

实验中动作电势的波形如图 1(b)所示，其中参数设置分别为：A_mp⁺=0.5，A_mp^-=0.312 5，τ^-=0.25，α_pre=0.9，α_pos=1。从图 1(b)可以看出，神经元在受到刺激后，其动作电势迅速增长到最大值A_mp⁺，并在t_ail⁺时间内一直保持这个值，之后经过t_ail^-时间，又平稳的回到静态电位。

3 忆阻神经网络

忆阻器这种兼具有纳米级规模、非易失性及记忆性功能的部件与神经网络中突触的功能特性是非常吻合的，因此其常常作为突触运用于神经网络。忆阻器的阻值能够根据“历史情况”自我调节。但忆阻器阻值的变化范围非常大，完全掺杂时的极限阻值与完全非掺杂时的阻值相差10²~10³倍。考虑到忆阻器的阻值是依据掺杂区和非掺杂区之间的边界值进行改变，而边界的变化范围与突触连接权重的变化范围是吻合的，都属于[0, 1]，因此将忆阻器应用到神经网络中时，就用忆阻器内部状态边界值的改变来模拟神经网络中突触连接权重的改变。

假设3类突触的初始权重均为0，此时神经元受到刺激，且突触前神经元比突触后神经元提前50 ms兴奋，即Δt=50 ms，3类突触连接权重从0到1的变化趋势如图 2所示。

图 2 Δt=50 ms时3种忆阻模型的边界变化趋势

从图 2中的变化趋势可以看出，线性忆阻器模型的变化最快，仅需19步其边界值就能从0变化到1，并且其变化速度是越来越快，如图 2(a)所示。非线性忆阻器模型的边界变化速度相对于线性忆阻器模型来说要略慢一些，需要经过27步才能从0变到1。从图 2(b)中可以看出，在边界值接近0或1的地方，其变化稍缓；而在中间段的时候变化略快。阈值模型对比前2个模型来说，其变化是线性的，如图 2(c)所示。通过观察图 2(d)可以发现，在受到一个动作电势刺激时，阈值模型突触权重的变化情况，是分段线性的。

Δt=-50 ms，即突触前神经元落后于突触后神经元50 ms而兴奋，突触连接强度减弱。

考虑到Biolek窗口函数在0、1处的不连续性^[11]，实验中设置边界值从0.999 9开始变化。从图 3中可以看出，3种模型中，线性忆阻器模型边界变化最快，经过14步即可由0.999 9变化到0，在靠近1的地方，边界变化速度是整个过程中最快的，之后逐渐趋于稳定，如图 3(a)所示。其次是非线性忆阻器模型图 3(b)所示，经过24步即可变化到0，在接近两端的地方，边界值变化较缓，而在中间段变化较快。与前2种模型的边界非线性变化情况不同，阈值模型的边界变化是线性的，图 3(c)所示。从图 3(d)中可以看出在接收到一个动作电势时，阈值模型忆阻器突触的权重变化是分段线性的。

图 3 Δt=-50 ms时3种忆阻器模型的边界变化趋势

4 基因算法

研究采用的基因算法主要包括2部分：自适应突变和网络拓扑结构的变化。而交叉变化之所以被忽略是因为通过自适应突变及拓扑变化已经为该求解过程提供了足够大的解空间^[9]。

每个网络都是一个独立的个体。初始种群中个体总数为100个，并且规定最高进化代数为500代。在GA循环开始前，先将100个个体随机进行两两配对，作为第一轮的父代个体。GA循环中，每2个父代个体分别进行自适应突变，产生2个子代个体，子代个体中适应度高的个体将加入到种群中与父代个体一起竞争，再选择出适应度高的2个个体作为下一轮的父代个体。设定变异率μ∈(0，1]用于控制变异的幅度^[19-20]。

除自适应突变外，网络拓扑结构的变化也是该算法的一个重要组成部分。拓扑变化主要包括：添加或移除隐藏层神经元；添加或移除神经元之间的连接。参数ψ∈(0，1]表示拓扑变异发生的概率，ψ≥0.5表示神经元增加事件发生，ψ＜0.5表示神经元减少事件发生。参数ω∈(0，1]控制神经元增加或减少的幅度，ω≥0.5控制神经元增加的幅度，ω＜0.5则1-ω控制神经元减少的幅度。文中神经元和神经元之间的连接具有可用和不可用2种状态，当某连接由可用变为不可用状态时，即意味着该连接在网络中被移除了。网络演化过程中，对于网络中的任一条连接，其为可用或不可用状态的概率是均等的，都是0.5。

5 实验模型及算法描述

实验所模拟的路径环境是一个20 m×20 m×1 m的区域。区域中央有一个4 m×4 m×1 m的障碍物，图 4(a)所示。机器人模型的初始位置为x+y≤10，且x≥0，y≥0，目标区域的范围为x+y≥32，且x＞12，y＞12。该机器人模型含有2个距离感知器和1个碰撞感知器。距离感知器用于记录模拟机器人的当前位置分别与水平向前遮挡物以及垂直向上遮挡物的距离。碰撞感知器则用于警示是否进入危险区，即是否与遮挡物的距离小于1 m。

图 4 测试环境及网络结构图

基因算法的适应度函数为

$ f = \left( {1/\left( {36-\left( {{x_{{\rm{pos}}}} + {y_{{\rm{pos}}}}} \right)} \right)} \right) \cdot 3000-{S_{{\rm{step}}}}, $

(8)

式中分母部分表示模拟机器人当前位置(x_pos和y_pos)与目标区域(32)的距离，而S_step则表示获得解的步数。

初始阶段，神经网络包含2个输入层神经元，7个隐藏层神经元，2个输出层神经元，如图 4(b)、4(c)所示。输入层神经元的输入值是距离感知器归一化后的值，即神经网络输入值的范围为[0, 1]。神经网络输出层神经元(O_X，O_Y)的值则直接决定了模拟机器人的走向：(1，1)或者(0，0)表示水平向前；(0，1)表示垂直向上；(1，0)表示垂直向下。每次前进距离为0.5 m，若与遮挡物发生碰撞，则后退1 m。

输入层神经元到隐藏层神经元的输出为

$ {I_X} \cdot {X_{L1j}} + {I_Y} \cdot {X_{L2j}} = {H_j}\left( {1 \le j \le n} \right)。$

(9)

隐藏层神经元到输出层神经元的输出为

$ \begin{array}{l} \sum\limits_{j = 1}^n {{H_j} \cdot {X_{R1j}}} = {O_X}\left\{ \begin{array}{l} 0\;\;\;\;{O_X} < 0.75, \\ 1\;\;\;\;{O_X} \ge 0.75, \end{array} \right.\\ \sum\limits_{j = 1}^n {{H_j} \cdot {X_{R2j}}} = {O_Y}\left\{ \begin{array}{l} 0\;\;\;\;{O_Y} < 0.75, \\ 1\;\;\;\;\;{O_Y} \ge 0.75, \end{array} \right. \end{array} $

(10)

实验开始时，模拟机器人的初始位置设为(4，5)，距离感知器收到的信号为(20-4，20-5)，输入层神经元(I_X，I_Y)的初始输入值为(16/20，15/20)。研究规定网络中所有连接在初始情况下均是可用的，并且其初值均为0.5。

在模拟机器人行进过程中，需根据实际情况确定对各层神经元施加电压的时间先后。若I_X≥I_Y，则意味着水平方向与遮挡物的距离大于垂直方向与遮挡物的距离，此时模拟机器人向水平方向前进更安全也更合理，即神经元的理想输出值应为(0，0)或者(1，1)。若输出层神经元上一步的输出值为(0，0)或者(1，1)，则此时只需要施加正常的脉冲信号，即让突触前神经元提前于突触后神经元而兴奋，使突触连接增强即可；若输出层神经元上一步的输出为(0，1)或者(1，0)，则此时既可使突触连接增加，使输出值向(1，1)方向变化，也可使突触连接减小，即突触前神经元落后于突触后神经元兴奋，使输出值向(0，0)方向变化。

若I_X＜I_Y，则表示垂直方向与遮挡物的距离大于水平方向与遮挡物的距离，这意味着此时模拟机器人向垂直方向前进更安全，即网络的理想输出值应为(0，1)。此时输入层神经元先于隐藏层神经元10 ms兴奋，由于产生的脉冲电压较小，对突触权重的影响较小，对隐藏层神经元的改变也较小；而输出层O_X神经元先于与之相连的隐藏层神经元50 ms兴奋，使其对应的突触连接权重减小；输出层O_Y神经元落后于与之相连的隐藏层神经元50 ms兴奋，使其对应的突触连接权重增加。

6 实验结果及分析

实验中，每种类型的网络(线性忆阻神经网络，非线性忆阻神经网络，阈值模型忆阻神经网络，混合模型忆阻神经网络)重复计算50次，比较其相应的最高适应度值与平均行进步数。

3种忆阻神经网络的求解结果存在这种差异与前面所分析的STDP学习方法下忆阻器边界值的变化特性有关，由于线性忆阻器模型在当前脉冲电压下的边界值变化较快，当其作为突触时，在网络中的连接权重变化较快，这样它总是能迅速达到期望的目标，也就能更准确地指引模拟机器人的动向。相反，非线性模型忆阻器在当前脉冲电压的刺激下，其边界变化相对较缓，需要经过多次变化才能达到期望值，因此所需的求解步数较多。而阈值模型忆阻器由于其变化是分段线性的，且施加在忆阻器上的电压必须大于阈值电压才能引起边界值的变化，相对前两者来说它的变化条件较为苛刻，需多次重复施加电压才能达到目的，故其求解步数是最多的。

由于线性忆阻器模型是一种较为理想的忆阻器，考虑到实用性，提出的混合模型忆阻器模型是指非线性模型忆阻器以及阈值模型忆阻器的混合体。它们的组合类似于电路中的并联电阻，参数β控制线路中开关的闭合情况。β=0表示非线性模型忆阻器在线路中被接通，而阈值模型忆阻器在线路中被断开；β=1则恰恰相反。当需要调节连接权重时，模拟机器人的系统处理中心先对网络中的有效连接权重进行检测，若是需要增加权重的情况，则检测权重大于0.51的连接数是否超过隐藏层神经元个数的一半，若条件符合，则β=1，即选用阈值模型忆阻器，反之，则β=0，选用非线性模型忆阻器；若是需要减小权重的情况，则检测权重小于等于0.47的连接数是否超过隐藏层神经元个数的一半，条件符合则β=1，线路中阈值模型忆阻器被接通，否则，β=0，线路中非线性模型忆阻器被接通。从表 1中可以看出，混合模型忆阻器的平均行进步数比单独使用非线性模型或阈值模型都少，仅为58.2，其最高适应度值为810.1。由此可见，混合模型忆阻器作为神经网络突触时，要优于单一模型的忆阻器，也即是说混合模型忆阻神经网络的学习效果要优于单一模型忆阻神经网络。

表 1 不同网络性能参数

7 结论

介绍了3种忆阻器模型，并比较了其边界值在同一电压信号刺激下的不同变化情况。采用了基于Hebb学习算法改进的STDP学习算法作为神经网络的学习方法，利用遗传算法调整网络拓扑结构，比较了3种忆阻器模型作为突触时对网络的影响，该实验效果通过模拟机器人寻找最优路径得以体现。

提出了混合模型忆阻器，即2个忆阻器模型同时作为神经网络突触，根据不同客观条件选择使用不同模型忆阻器。通过将混合模型忆阻器与相应的单一模型忆阻器相比较，得出混合模型忆阻器性能更优。在后续的工作中，将对混合模型忆阻器模型的性能进行更深一步的探索，以实现其在硬件设备上的应用。

参考文献

[1]	Chua L O. Memristor-the missing circuit element[J]. IEEE Transactions on Circuit Theory, 1971, 18(5): 507–519. DOI:10.1109/TCT.1971.1083337
[2]	Chua L O, Kang S M. Memristive devices and systems[J]. Proceedings of the IEEE, 1976, 64(2): 209–223. DOI:10.1109/PROC.1976.10092
[3]	Williams R. How we found the missing memristor[J]. Spectrum, IEEE, 2008, 45(12): 28–35. DOI:10.1109/MSPEC.2008.4687366
[4]	Strukov D B, Snider G S, Stewart D R, et al. The missing memristor found[J]. Nature, 2008, 453(7191): 80–83. DOI:10.1038/nature06932
[5]	Jo S H, Chang T, Ebong I, et al. Nanoscale memristor device as synapse in neuromorphic systems[J]. Nano letters, 2010, 10(4): 1297–1301. DOI:10.1021/nl904092h
[6]	Pershin Y V, Di Ventra M. Neuromorphic, digital, and quantum computation with memory circuit elements[J]. Proceedings of the IEEE, 2012, 100(6): 2071–2080. DOI:10.1109/JPROC.2011.2166369
[7]	Pershin Y V, Di Ventra M. Experimental demonstration of associative memory with memristive neural networks[J]. Neural Networks, 2010, 23(7): 881–886. DOI:10.1016/j.neunet.2010.05.001
[8]	Itoh M, Chua L O. Memristor cellular automata and memristor discrete-time cellular neural networks[J]. International Journal of Bifurcation and Chaos, 2009, 19(11): 3605–3656. DOI:10.1142/S0218127409025031
[9]	Hu X F, Duan S K, Wang L D, et al. Memristive crossbar array with applications in image processing[J]. Science China Information Sciences, 2012, 55(2): 461–472. DOI:10.1007/s11432-011-4410-9
[10]	Biolek Z, Biolek D, Biolková V. Spice model of memristor with nonlinear dopant drift[J]. Radioengineering, 2009, 18(2): 210–214.
[11]	Itoh M, Chua L O. Memristor oscillators[J]. International journal of bifurcation and chaos, 2008, 18(11): 3183–3206. DOI:10.1142/S0218127408022354
[12]	Pershin Y V, Di Ventra M. Experimental demonstration of associative memory with memristive neural networks[J]. Neural Networks, 2010, 23(7): 881–886. DOI:10.1016/j.neunet.2010.05.001
[13]	Kim K H, Gaba S, Wheeler D, et al. A functional hybrid memristor crossbar-array/CMOS system for data storage and neuromorphic applications[J]. Nano letters, 2011, 12(1): 389–395.
[14]	Snider G S.Spike-timing-dependent learning in memristive nanodevices[C]//Proceedings of 2008 IEEE International Symposium on Nanoscale Architectures, June 12-13, 2008.Anaheim, CA.Piscataway:IEEE Press, 2008:85-92.
[15]	Linares-Barranco B, Serrano-Gotarredona T. Memristance can explain spike-time-dependent-plasticity in neural synapses[J]. Nature, 2009: 1–4.
[16]	Cai W, Tetzlaff R, Ellinger F.A memristive model compatible with triplet rule for spike-timing-dependent-plasticity[EB/OL].(2013-12-10)http://arxiv.org/pdf/1108.4299.pdf http://ieeexplore.ieee.org/abstract/document/7041247
[17]	Zamarreño-Ramos C, Camuñas-Mesa L A, Pérez-Carrasco J A, et al.On spike-timing-dependent-plasticity, memristive devices, and building a self-learning visual cortex[EB/OL].(2011-03-17)[2014-02-12] http://journal.frontiersin.org/Journal/10.3389/fnins.2011.00026/abstract
[18]	Rocha M, Cortez P, Neves J. Evolutionary neural network learning[J]. /Lecture Notes in Computer Science, 2003, 2902: 24–28. DOI:10.1007/b94425
[19]	周杰, 卢先正, 舒锐志, 等. BP神经网络和遗传算法用于曲轴填充性能的优化设计[J]. 重庆大学学报:自然科学版, 2012, 35(5): 52–56. ZHOU Jie, LU Xianzheng, SHU Ruizhi, et al. BP neural network and genetic algorithm for the filling properties optimization of crankshaft[J]. Journal of Chongqing University(Natural Science), 2012, 35(5): 52–56. (in Chinese)
[20]	卢启衡, 冯晓云. 多维并行遗传算法在列车追踪运行节能优化中的应用[J]. 重庆大学学报, 2013, 36(4): 39–44. LU Qiheng, FENG Xiaoyun. Application of multi-dimension parallel genetic algorithm to energy-saving optimum control of trains in following operation[J]. Journal of Chongqing University, 2013, 36(4): 39–44. DOI:10.11835/j.issn.1000-582X.2013.04.006 (in Chinese)