当前位置:首页 > 专题范文 > 公文范文 > 正文

3种方法对中肋骨条藻Logistic生长模型拟合的比较研究

发布时间: 2022-10-28 19:55:03 来源:网友投稿


打开文本图片集

摘要:为探索高效准确的Logistic生长模型拟合方法,对中肋骨条藻在不同浓度二价镉[Cd(Ⅱ)]胁迫下的Logistic生长曲线,分别用Excel、Origin和Matlab 3种软件进行拟合。结果表明,拟合后的R2大小顺序为Matlab>Origin>Excel;采用Excel非线性拟合中的四点法拟合效果优于三点法。提示Matlab(用Levenberg-Marquardt算法进行非线性化多次迭代)是3种软件中对Logistic生长曲线拟合的最优方法。

关键词:海洋硅藻;中肋骨条藻;Logistic生长曲线;相关系数R2;Matlab;模型拟合;最优方法筛选

中图分类号: Q141;S184  文献标志码: A  文章编号:1002-1302(2019)02-0229-04

Logistic曲线(或Logistic函数)模型由比利时数学家Verhulst首次提出[1],最初主要是描述和研究人口增长的一种S形曲线。其方程为y=a1+b·e-kx,随后Logistic曲线在各领域得到了广泛应用,如Pearl等首次将Logistic曲线应用于生物领域[2];Fisk在经济学领域引入Logistic曲线[3];Anderson将Logistic曲线应用到医疗诊断中[4]。如今,Logistic曲线几乎替代了一切的S形曲线,成为描述种群生态、动植物及微藻生长变化的一条最为普遍的曲线[5]。

Logistic曲线的拟合就是确定方程中的3个参数值a、b、k,经典方法包括线性和非线性方法。线性方法是将Logistic曲线方程转为线性方程,然后采用最小二乘法让残差平方和达到极小值以对参数进行无偏估计。非线性方法可直接用相关算法得到Logistic模型参数的最小二乘无偏估计[6];现采用的算法有莱文贝格-马夸特方法(Levenberg-Marquardt)方法、数值方法、三次样条插值函数法等[7]。上述参数估计的过程较复杂,须借助各种软件及编程语言来进行拟合分析,如统计学软件SPSS、SAS,程序设计语言R、Python。目前热门的机器学习算法也涉足非线性拟合领域(如支持向量机回归[8]),而掌握这些软件和语言对生物从业者较为困难。

中肋骨条藻(Skeletonema costatum)是常见的海洋硅藻,分布较广泛。近年来,研究者多对海洋微藻重金属胁迫下的生长过程用Logistic方程进行描述,进而反映出藻生物量与生长时间、重金属浓度的关系[9]。本研究以中肋骨条藻为模式生物,分别采用Excel、Origin、Matlab 3种常用的作图和计算软件,对其在二价镉[Cd(Ⅱ)]胁迫下的生长用Logistic模型进行拟合,对拟合方法和效果进行介绍和比较,为生命科学从业者进行Logistic曲线的拟合、参数估计和数据处理提供借鉴和参考。

1 材料与方法

1.1 微藻培养及毒性试验

中肋骨条藻接种自中国海洋大学海洋生命学院,在曲阜师范大学生命科学学院环境生态学实验室采用Guillard F/2(f/2)培养基培养,培养条件为温度(20±1) ℃,光源为白色日光灯,光照强度为3 000 lx,12 h光照12 h黑暗培养;各步骤均进行灭菌处理。

取20 mL藻液于250 mL f/2培养基中,微藻起始细胞密度均为104个/mL,加入4种不同浓度梯度(0、0.1、1.0、5.0 mg/L)的Cd(Ⅱ)试验,每个浓度下均设平行样3个,采用与微藻培养相同的培养条件,每隔24 h取10 mL藻液,用Coulter計数仪测定藻液细胞密度,重复测定3次[10],连续测定7 d。

1.2 数据处理软件及系统

软件:Microsoft Excel 2003、Origin 8.0、Matlab R2010b;系统:Windows7×86 with Service Pack1。

1.3 微藻生长拟合

“1.1”节中的微藻生长曲线用“1.2”节中的3种软件进行Logistic回归拟合。

1.3.1 Excel对Logistic曲线的线性化拟合

利用公式(5)和a值可以先求出y′,利用Excel对y′和x进行线性回归分析,拟合后可得到b和k值。在Excel 2003中的操作如下:

(1)[工具]→[加载宏]→勾选“分析工具库”。(2)[工具]→[数据分析]→[回归]→弹出回归对话框→单击“Y值输入区域(Y)”输入框右边的折叠按钮,选取y′,单击“X值输入区域(X)”输入框右边的折叠按钮,选取x的数据;→在“输出选项”框中选择“输出区域”单选框,点击右边的折叠按钮,任选一输出区域;→勾选“残差”框中的“线性拟合”;→单击[回归]对话框中的[确定],显示回归结果,并绘得散点图。(3)利用散点图,添加趋势线可得到线性回归公式。

1.3.2 Origin进行Logistic曲线的非线性回归拟合 (1)打开Origin8.0,点选[column]→[add new columns]输入须要增加的数据列数(本试验3列)。(2)按列输入数据后,选中所有数据,菜单栏中选择[Plot]→[Symbol]→[Scatter]绘制散点图(图1-a图)。(3)关闭坐标轴设置对话框,点选1-选择黑色方框数据组b进行拟合→菜单栏中选择[Analysis]→[Fitting]→[Nonlinear Curve Fit]→[Open Dialogue]打开对话框;按步骤点选2-Category-Growth/Sigmonial;3-Function-Slogistic3;4-Fit,即完成拟合和作图(图1-b),同时给出参数和统计处理数据。

1.3.3 用Matlab进行Logistic曲线的非线性回归拟合 打开Matlab R2010b,用简单编程语言和自带的控件工具箱对Logistic曲线快速拟合:(1)在Command Window对话框中输入原始数据:横坐标x以及y1、y2、y3、y4这4条生长曲线的数据。(2)依次点击软件左下角:[Start]→[Toolboxes]→[Curve Fitting]→[Curve Fitting Tool(cftool)],弹出对话框“Curve Fitting Tool”。(3)在Curve Fitting Tool对话框中点击Data→弹出Data对话框→选择:X Data:x; Y Data:y1;→点击Create data set按钮可绘制散点图;(4)在Curve Fitting Tool对话框中点击Fitting,弹出Fitting对话框→在Fitting对话框中点选New fit,Type of fit:选择Custom Equations,点击New按

钮→弹出New Custom Equation对话框,单击选择General Equations选项→在General Equations选项中输入Equation:y=a/[1+b·exp(-k·x)]→点击OK(图2-a)。(5)回到Fitting选项卡,点击Fit options→Algorithms:Levenberg-Marquardt算法→Close→Apply,即可得拟合后的Logistic曲线图(图2-b)。

2 结果与分析

2.1 3种方法绘制的不同浓度Cd(Ⅱ)下中肋骨条藻的S形生长曲线

由图3至图5可得,(1)图3中用Excel作出的曲线只能是连接各试验数据点的平滑曲线,无法拟合作图;(2)图5中Matlab所得曲线与各数据点的吻合程度明显高于图4,说明Matlab对生长曲线的拟合较优。

2.2 3种拟合方法对微藻生长曲线的拟合效果比较

由表1至表4可得,3种软件拟合后的R2值整体大小顺序为Matlab>Origin>Excel,其中Excel方法中四点法R2值均大于三点法。数据同时显示,四点法的参数值与非线性方法更为接近。在非线性拟合中,Matlab多次迭代的R2值均高于Origin的单次迭代。

3 结论与讨论

Logistic曲线作为一种广义的线性回归模型,它的拟合方法可分为线性和非线性法。本研究3种软件中,Excel对应的是Logistic曲线的线性方法拟合;Origin和Matlab对应的是曲线的非线性回归拟合,其中Origin采用单次迭代,而Matlab是多次迭代。曲线拟合精度的高低都可用R2的大小来判定。由试验结果可知,3种软件对Logistic的拟合精度均较高,R2值均接近于1[表4显示Cd(Ⅱ)浓度较大时,对微藻的生长会产生较大影响,R2值减小],这表明3种软件所获得的Logistic回归方程均与实测数据拟合很好。同时结果提示,(1)Excel可以对Logistic曲线模型的3个参数进行估计,但不能作出拟合曲线图,只能得到平滑曲线图。(2)Excel进行拟合时,四点法各参数估计量与非线性回归最为接近,因此本研究中四点法比三点法拟合效果优。这是由于本研究数据点数为8个,通常四点法较适合于试验数据序列数为偶数的情况,三点法适用于奇数的情况,这与以往报道[13]一致,但三点法具有简单快速的优势。(3)Excel拟合中所采用的线性拟合方法虽然简便,但对Logistic函数进行线性变换后会对估计参数的性质产生影响,如不再具有无偏性;所以其拟合精度不如Origin和Matlab所采用的非线性拟合。(4)在非线性拟合中,多次迭代会提高R2,因此Matlab的拟合效果优于Origin。(5)综合数据可得,不同拟合方法拟合后的R2大小顺序为非线性>四点线性>三点线性,3种软件拟合后的R2值为Matlab>Origin>Excel,其中,Matlab采用Levenberg-Marquardt算法进行非线性化多次迭代拟合,提示Matlab是3种软件中对Logistic生长曲线拟合的最佳方法。

Logistic曲线拟合的优度检验除了R2,还有如卡方值、标准偏差等其他统计指标[14],除了本研究的3种软件,对Logistic的拟合还可借助其他各种计算机语言。因此各种不同软件、方法对Logistic拟合的比较还有更多的探讨空间。

参考文献:

[1]Verhulst P J. Notice sur la loi que la population suit dans sons accroissement[J]. Corr Math et Physique,1838,10:113-121.

[2]Pearl R,Reed L J. The Logistic Curve and the Census Count of 1930[J]. Science,1930,72(1868):399-401.

[3]Fisk P R. The Graduation of income distributions[J]. Econometrica,1961,29(2):171-185.

[4]Anderson J A. Sepatate sample Logistic discrimination[J]. Biometrika,1972,59:19-35.

[5]王福林,王吉權. 生长曲线参数估计的一种新方法——优化回归组合法[J]. 生物数学学报,2007,22(3):533-538.

[6]陈 冬,程维虎. 利用样本分位数的Logistic总体分布参数的近似最佳线性无偏估计[J]. 应用数学学报,2005,28(2):325-332.

[7]许小勇,钟太勇. 三次样条插值函数的构造与Matlab实现[J]. 兵工自动化,2006,25(11):76-78.

[8]Zhang L J,Song Z J,Pan X D,et al. Comparison of v-support vector regression and Logistic equation for descriptive modeling of Lactobacillus plantarum growth[J]. African Journal of Biotechnology,2011,10(32):6162-6171.

[9]栾红艳,赵卫红,苗 辉. Cd2+胁迫下中肋骨条藻细胞内多胺的生理响应[J]. 中国环境科学,2015,35(5):1487-1494.

[10]Torres E,Mera R,Herrero C,et al. Isotherm studies for the determination of Cd(Ⅱ) ions removal capacity in living biomass of a microalga with high tolerance to cadmium toxicity[J]. Environmental Science & Pollution Research,2014,21(22):12616-12628.

[11]殷祚云. Logistic曲线拟合方法研究[J]. 数理统计与管理,2002,1(21):41-46.

[12]胡文冉,范 玲,田晓莉,等. Excel在Logistic曲线拟合中的应用[J]. 农业网络信息,2013(3):14-16.

[13]范国兵. 一种估计Logistic模型参数的方法及应用实例[J]. 经济数学,2010,27(1):105-110.

[14]梁玉麟,赵建东. 基于logistic方程的供应商-采购商合作关系的经济模型研究[J]. 鲁东大学学报(自然科学版),2015,31(3):200-204,213.

最新文章

版权所有:博古范文网 2012-2024 未经授权禁止复制或建立镜像[博古范文网]所有资源完全免费共享

Powered by 博古范文网 © All Rights Reserved.。浙ICP备12018771号-1