导航:首页 > 数字科学 > 数学中怎么确定最优参数值

数学中怎么确定最优参数值

发布时间:2022-12-19 10:27:55

A. 在线性规划中,什么是最优解什么是最优解不唯一最优解是让z取得最大值的点的坐标吗

最优解是使得目标函数取到最大值或最小值(视情况而定)的解。

在高中阶段目标函数一般是二元函数z(x,y)。假设可行域(即满足限定条件的x,y范围,可表示为平面直角坐标系内的一个区域)为X。

假设目标函数z=ax+by是一线性函数,在坐标系内图像为一条直线,直线平移时z值发生变化。若X有一条外侧的边平行于目标函数的直线,则直线与该边重合时,边上所有点都是最优解,所以最优解可能不唯一。

最优解可以理解为让z取得最值的点的坐标。

(1)数学中怎么确定最优参数值扩展阅读:

使目标函数取最小值的可行解称为极小解,使其取最大值的可行解称为极大解。极小解或极大解均称为最优解。相应地,目标函数的最小值或最大值称为最优值。有时,也将最优解和最优值一起称为相应数学规划问题的最优解。

线性规划的最优解不一定只有一个,若其有多个最优解,则所有最优解所构成的集合称为该线性规划的最优解域。

函数与不等式和方程存在联系(初等函数)。令函数值等于零,从几何角度看,对应的自变量的值就是图像与X轴的交点的横坐标;从代数角度看,对应的自变量是方程的解。

另外,把函数的表达式(无表达式的函数除外)中的“=”换成“<”或“>”,再把“Y”换成其它代数式,函数就变成了不等式,可以求自变量的范围。

B. 参数法研究最值问题

通过多年的高考试卷看,求参数的取值范围问题一直是高考考查的重点和热点,同时也是一个难点.考生有时会感到难度较大,以至于得分不高.经过多年的数学教学实践,探求了一些解决含参数问题的有效方法.叙述如下.
一、分离参数法 所谓分离参数法也就是将参数与未知量分离于表达式的两边,然后根据未知量的取值范围情况决定参数的范围.这种方法可避免分类讨论的麻烦,使问题得到简单明快的解决.

C. 怎么快速调出最优PID参数

1. 已知对象数学模型的调参实际上就是个优化的过程。你已经给定了关于超调和上升时间的指标,那么就可以用这个作为约束,在确定了优化指标后应用优化算法调节你的控制器。至于优化算法,那海了去了,神马基因算法,最速梯度法,粒子群算法,simplex方法等等等。也还分多目标优化和单目标优化。至于快速调参,这就要看你想要什么样的结果了,10步迭代也能出来结果,1000步迭代也能出来结果,只要不对最后的收敛性有着苛刻的要求,少选几步迭代先看看效果不失是一个可行的选择。

2. 如果不知道数学模型,那首先要做的就是系统辨识。如果你默认系统是线性的,那辨识的方法就比较多了,Matlab也有很成熟的系统辨识的工具箱,前提是你要有足够多的实验数据做支撑。线性系统的辨识可以是频域也可以是时域的。如果你认为系统中含有非线性因素,那么只能通过时域辨识,随之而来的PID设计也必须在时域下进行。

3. Z-N调参的方法确实像你说的,只是在保证稳定性的前提下给出了个大概的参考,基本没考虑优化的因素。如果楼主追求某些指标的达标,还是要通过优化算法去寻找参数。

4. 频响的缺点我认为是不适合高维动力学的控制器设计,如果你的系统就是个单自由度二阶的,那么频域内的设计没啥问题,如果你是MIMO系统,也就是多输入多输出,我还是建议用基于状态空间的表述去设计,LQR就是个很不错的选择,当然是基于时域的。

5. 如果你有被控对象的模型,不论是通过数学建模还是参数识别得到的,那么调参实际上是个优化的过程,所以你的这个问题实际上就又回到了有哪些高效的优化方法上来了。针对你的这个问题,我觉得最好选择不是基于梯度搜索的算法,比如演化算法,模式搜索算法等。

D. 数学优化问题(最优化问题)

  数学优化(Mathematical Optimization)问题,也叫最优化问题,是指在一定约束条件下,求解一个目标函数的最大值(或最小值)问题。
  数学优化问题的定义为:给定一个目标函数(也叫代价函数) f : A → R ,寻找一个变量(也叫参数) x ∈ D ,使得对于所有 D 中的 x f(x ) ≤ f(x) (最小化);或者 f(x ) ≥ f(x) (最大化),其中 D 为变量 x 的约束集,也叫可行域; D 中的变量被称为是可行解。

  根据输入变量 x 的值域是否为实数域,数学优化问题可以分为离散优化问题和连续优化问题。

  离散优化(Discrete Optimization)问题是目标函数的输入变量为离散变量,比如为整数或有限集合中的元素。连续优化(Continuous Optimization)问题是目标函数的输入变量为连续变量 x ∈ R d ,即目标函数为实函数。离散优化问题主要有两个分支:

  离散优化问题的求解一般都比较困难,优化算法的复杂度都比较高。后面的内容主要以连续优化为主。

  在连续优化问题中,根据是否有变量的约束条件,可以将优化问题分为无约束优化问题和约束优化问题。
   无约束优化问题(Unconstrained Optimization) 的可行域为整个实数域 D = R d ,可以写为
其中 x ∈ R d 为输入变量, f : R d → R 为目标函数。
   约束优化问题(Constrained Optimization) 中变量 x 需要满足一些等式或不等式的约束。约束优化问题通常使用拉格朗日乘数法来进行求解。

  如果目标函数和所有的约束函数都为线性函数,则该问题为 线性规划问题(Linear Programming) 。相反,如果目标函数或任何一个约束函数为非线性函数,则该问题为 非线性规划问题(Nonlinear Programming)
  在非线性优化问题中,有一类比较特殊的问题是 凸优化问题(Convex Programming) 。在凸优化问题中,变量 x 的可行域为凸集,即对于集合中任意两点,它们的连线全部位于在集合内部。目标函数 f 也必须为凸函数,即满足
  凸优化问题是一种特殊的约束优化问题,需满足目标函数为凸函数,并且等式约束函数为线性函数,不等式约束函数为凹函数。

   优化问题 一般都是通过 迭代 的方式来求解:通过猜测一个初始的估计 x 0 ,然后不断迭代产生新的估计 x 1 , x 2 , · · · x t ,希望 x t 最终收敛到期望的最优解 x 。一个好的优化算法应该是在 一定的时间或空间复杂度下能够快速准确地找到最优解。同时,好的优化算法受初始猜测点的影响较小,通过迭代能稳定地找到最优解 x 的邻域,然后迅速收敛于 x
  优化算法中常用的迭代方法有 线性搜索和置信域方法 等。线性搜索的策略是寻找方向和步长,具体算法有梯度下降法、牛顿法、共轭梯度法等。

  对于很多非线性优化问题,会存在若干个局部的极小值。局部最小值,或局部最优解 x 定义为:存在一个δ > 0,对于所有的满足|| x − x∗|| ≤ δ 的 x ,公式 f(x ) ≤ f(x) 成立。也就是说,在 x 的附近区域内,所有的函数值都大于或者等于 f(x ) 。对于所有的 x A ,都有 f(x∗) ≤ f(x) 成立,则 x 为全局最小值,或全局最优解。一般的,求局部最优解是容易的,但很难保证其为全局最优解。 对于线性规划或凸优化问题,局部最优解就是全局最优解

E. 什么叫做数学中最优化的问题

最优化,是应用数学的一个分支,主要研究以下形式的问题:
给定一个函数,寻找一个元素使得对于所有A中的,(最小化);或者(最大化)。
这类定式有时还称为“数学规划”(譬如,线性规划)。许多现实和理论问题都可以建模成这样的一般性框架。
典型的,A一般为欧几里德空间中的子集,通常由一个A必须满足的约束等式或者不等式来规定。 A的元素被称为是可行解。函数f被称为目标函数,或者费用函数。一个最小化(或者最大化)目标函数的可行解被称为最优解。
一般情况下,会存在若干个局部的极小值或者极大值。局部极小值x * 定义为对于一些δ > 0,以及所有的x 满足
}-;
公式
成立。这就是说,在周围的一些闭球上,所有的函数值都大于或者等于在该点的函数值。一般的,求局部极小值是容易的,但是要确保其为全域性的最小值,则需要一些附加性的条件,例如,该函数必须是凸函数。
主要分支
线性规划 当目标函数f是线性函数而且集合A是由线性等式函数和线性不等式函数来确定的, 我们称这一类问题为线性规划
整数规划 当线性规划问题的部分或所有的变量局限于整数值时, 我们称这一类问题位整数规划问题
二次规划 目标函数是二次函数,而且集合A必须是由线性等式函数和线性不等式函数来确定的。
非线性规划 研究的是目标函数或是限制函数中含有非线性函数的问题。
随机规划 研究的是某些变量是随机变量的问题。
动态规划 研究的是最优策略基于将问题分解成若干个较小的子问题的优化问题。
组合最优化 研究的是可行解是离散或是可转化为离散的问题。
无限维最优化 研究的是可行解的集合是无限维空间的子集的问题,一个无限维空间的例子是函数空间

F. 非线性方程组,给定样本值,怎么拟合最优的参数

1、你可以用nlinfit()函数拟合,精度比较高。2、用matlab的拟合工具箱cftool也是非常方便,而且不用编程。你只要将y=d*(b-exp(-x/c))*exp(-2*a*log(b*exp(x/c)-1))输入自定义函数(GeneralEquations)命令框内,就可以得到其拟合系数。你的邮箱有问题,不存在,邮件无法送达。

G. 已知目标函数最值求参数方法,高中数学必修五

  1. 目标函数式一次时,如果有最值,应该给定区间,最值在区间端点上。

  2. 目标函数为二次函数时,如果给定区间,要判断区间是否包含二次函数的对称轴,如果包含,则取到最值,不包含,则根据单调性,在区间端点上取到最大值或者最小值。

  3. 目标函数为三次函数及以上,判断拐点,及拐点附近的的单调性,看是否会在拐点处取得最值,或者是否在给定区间上会具有单调性,从而得到最值

H. 怎么求有多个参数的方程的最值,怎么处理参数和未知数的关系一般方程

首先,楼主你提出的问题很有代表性。带有参数的方程在高中乃至大学的数学中都有举足轻重的作用,考试会有涉及到。但都是及其简单的参数很少的线性的再常见不过的带有参数的方程。

其次,你提出的问题回答起来也有相当的难度。这是因为带有参数的方程在求解的过程中很复杂.每一个参数对方程的解都是一种制约关系【方程的解是参数的函数】。如果就是要求解一个带有参数的方程,可以,有方法,完全可以把参数视为未知量,和原有的未知量x放到一起进行研究.将方程只对x求导(实质就是多元函数的求偏导),找到x的极值点,再通过函数图像的计算与分析对方程进行求值。当然,方程的解是参数的函数,解是受参数所控制的。计算量相当大。这表明,参数方程是可以求解的。以上的方法就是运用计算机求解含参数方程的基本思路与方法。

但是,如果人【重点是谁去求解方程?是人!人!】要去解决一个复杂的含有参数的方程,没有点扎实的数学功底和理性的思维是根本办不到的。这也正是代数学的深奥之处。

至于你所提出的第二个问题,"我可以把其中一个参数用其他参数表示,带进去吗?"当然可以,这么做的目的就是要简化方程,使得参数减少,进而减少计算量。但是,你所要做的工作就是要去寻找你所求方程替代参数的方法。因为研究的方程不同,代换的方法也不同。而问题的深奥之处正是如何寻找一个新的参数,使得这个寻找到的新参数引入之后方程变得简单了。这个问题同样深奥无比。你可以网络一下这方面的问题,有许多的论文都在讨论如何寻找这个所谓的能够简化带有参数方程求解的"新参数"的问题,以便能够简化一种形式的带有参数的方程。对于每一种带有参数的方程,都可能会有好几种简化的方法,但是这个方法不是一时半会儿就能分析出来的,需要数学家几年甚至几十年几百年才能解决。所以,这个问题很深奥,最起码我在今天凌晨是无法找到一种求解你所提出的方程的求解方法。各何况你所提出的方程属于非线性方程,更难去分析寻找........所以至少我现在无能为力。但还是希望说了这么多会对你有所帮助。

I. 最优化选择法数学原理

2.2.1 目标函数

设观测异常以ΔZk表示,k为观测点序号,k=1,2,…,m,m为观测点数。

设所选用的地质体模型的理论异常以 Z 表示,Z 是模型体参量和观测点坐标的函数,即

Z=f(xk,yk,zk,b1,b2,…,bn

式中:xk,yk,zk为观测点的坐标;b1,b2,…,bn为模型体的参量,如空间位置、产状、物性等,参量的个数为n。

模型体的初始参量用

,…,

表示。

理论曲线与实测曲线之间的符合程度,是以各测点上理论异常与实测异常之差的平方和(即偏差平方和)来衡量的,用φ表示,即

地球物理数据处理教程

目的在于求得一组关于模型体参量的修改量δ1,δ2,…,δn,来修改模型体给定的初值参量,即

地球物理数据处理教程

于是求出关于模型体参量的一组新值,而由这组新参量形成的模型体的理论异常与实测异常之间的偏差平方和将取极小,即是

地球物理数据处理教程

代入式(2.2.1)中将使φ值获得极小,这时bi即为我们的解释结果,这称为最小二乘意义下的最优化选择法。

我们称φ为目标函数,用它来衡量理论曲线与实测曲线的符合程度。最优化方法的关键在于求取使φ值获得极小参量的改正值δi,而f通常是bi的非线性函数,因而该问题归结为非线性函数极小的问题。

2.2.2 求非线性函数极小的迭代过程

从上已知f为bi的非线性函数,那么要求它与实测值之间的偏差平方和φ为极小的问题就称为非线性极小问题,或称为非线性参数的估计问题。如果是线性问题,参数估计比较简单,通常进行一次计算即可求出参数的真值,而对非线性问题,参数估计却要复杂得多,为了求解,通常将函数在参数初值邻域内展成线性(忽略高次项),即所谓的线性化,然后再求得改正量δi(i=1,2,…,n),由于这是一种近似方法,因而不可能使φ一次达到极小,而需要一个迭代过程,通过反复计算而逐步逼近函数φ的极小值。

图2.1 不同埋深时的重力异常

为了说明这个求极小的迭代过程,可以举一个单参量的例子,即假如我们要确定引起重力异常Δgk的场源地质体的深度,假设场源为一个已知体积和密度的球体模型,如图2.1所示,那么φ就是球心埋深z的函数,如果球心埋深的真值为h,我们首先取初值为z(0),这时函数

地球物理数据处理教程

式中:Δgk为实测异常;g(z)是球心埋深为z的理论重力异常;φ随z的变化情况示于图2.2 中,要求使φ获极小的z,即要求使

地球物理数据处理教程

的根。由于z(0)和φ(z(0))不能一次求出φ的极小来,通常采用迭代的办法,如图2.3所示,例如用牛顿切线法迭代求根,根据下式

地球物理数据处理教程

得到一个更近似于根的值z(1),但不等于h,因此需进一步再用上式,将z(1)作为新的初值z(0),可得到新的z(1)更接近于h,如此反复下去可以使z值无限接近于h,当满足精度要求时,我们认为它近似等于h了,停止迭代,这时的z(1)就作为h值。

图2.2 函数φ(z)随z变化示意图

图2.3 用牛顿切线法求φ′(z)=0的根示意图

2.2.3 单参量非线性函数的极小问题

单参量不仅是讨论多参量的基础,而且往往在求多参量极小时要直接用到单参量极小的方法,因此有必要作一介绍。

求单参量极小的方法很多,上面用到的牛顿切线法就是其中之一,在此我们介绍一种用得较多的函数拟合法,以及精度较高的DSC-Powell方法。

2.2.3.1 函数拟合法

2.2.3.1.1 二次函数拟合法

A.不计算导数的情况

设取三个参量值x1、x2、x3,它们对应的φ 值就应为φ1、φ2、φ3,过三个点(x1,φ1;x2,φ2;x3,φ3)作二次抛物线,应有下式

地球物理数据处理教程

联立φ1、φ2、φ3的方程式,即可得出系数A、B、C来。

当A>0时,应有极小点存在,我们设极小点为d,那么根据极小的必要条件有

地球物理数据处理教程

将A、B的表达式代入即得

地球物理数据处理教程

当x1、x2、x3为等距的三点时,上式可简化为

地球物理数据处理教程

B.计算导数的情况

设已知两个点的参量值x1和x2对应的函数值φ1、φ2,并已求得x1点的一阶导数值φ′(x1),可用下列方法求极小点d:

地球物理数据处理教程

联立φ1、φ2、φ′(x1)三个方程即可得A、B、C,代入极小点的表达式即可求得极小点。

为了简化起见,不妨设x1为坐标原点(即x1=0),设x2=1,于是上面各式简化成:

φ′(x1)=B

φ1=C

φ2=A+B+C

A=φ2-φ′(x1)-φ1

地球物理数据处理教程

2.2.3.1.2 三次函数拟合法

取两个点的参量值x1和x2,及相应的φ1和φ2值,并已得到该两点的一阶导数值φ′(x1)和φ′(x2),我们选用一个三次多项式

φ=Ax3+Bx2+Cx+D

代入上面给出的4个条件,同样,为了简化起见,不妨设x1为坐标原点(即x1=0),设x2=1,则有

φ1=D

φ2=A+B+C+D

φ′(x1)=C

φ′(x2)=3A+2B+C

联立求解,可定出4个系数A、B、C、D,按照求极小的必要条件

φ′=3Ax2+2Bx+C=0

当二阶导数

φ″=6Ax+2B>0

时有极小存在,极小点d就为

地球物理数据处理教程

为了计算方便,令

v=φ′(x1

u=φ′(x2

S=-3(φ12)=3(A+B+C)

Z=s-u-v=B+C

W2=Z2-vu=B2-3AC

于是极小点d就可用下列形式表示:

地球物理数据处理教程

2.2.3.2 DSC-Powell 法

该法为比较细致的单参量探测法,精度比较高,计算工作量较大,大致可分为两部分来完成,其探测(迭代)过程如图2.4所示。

2.2.3.2.1 确定极小值所在的区间

采用的是一种直接探测法,做法可归纳如下。

第一步:给定探测方向x、初值点x0和初始步长Δx,计算φ(x0)和φ(x0+Δx),若φ(x0+Δx)≤φ(x0),转向第二步;若φ(x0+Δx)>φ(x0),则取-Δx为步长Δx,转向第二步。

第二步:计算xk+1=xk+Δx,计算φ(xk+1)。

第三步:如果φ(xk+1)≤φ(xk),以2Δx为新步长代替Δx,且用k代表k+1,转向第二步。

如果φ(xk+1)>φ(xk),则以xm表示xk+1,以xm-1表示xk,将上步的xk作为xm-2,并计算

地球物理数据处理教程

第四步:在4个等距点(xm-2、xm-1、xm+1、xm)中,去掉四点中离φ(x)最小点最远的那一点,即或是xm,或是xm-2,剩下的三点按顺序以xα、xb、xc表示,其中xb为中点,那么(xα,xc)区间即为极小值所在的区间。

2.2.3.2.2 用二次函数拟合法求极小点

将上面已确定的等距的 xα、xb、xc三点及 φ 值,用二次函数拟合法即用公式(2.2.3)求得极小点,令为x*点。再将xα、xb、xc、x*四点中舍去φ值最大的点,剩下的点重新令为α、b、c,则又得三点和它们相应的φ值,用公式(2.2.2)求其极小点x*,如此反复使用公式(2.2.2),逐步缩小极小值的区间,一直到两次求得的极小点位置差小于事先给定的精度为止,x*点即为极小点。

图2.4 DSC-Powell法示意图

2.2.4 广义最小二乘法(Gauss 法)

重磁反问题中的最优化方法,一般是指多参量的非线性最优估计问题,理论模型异常z=f(

,b1,b2,…,bn)是参数bi(i=1,2,3,…,n)的非线性函数,其中

=(x,y,z)为测点的坐标。由前已知ΔZk(k=1,2,…,m)表示在第k个观测点

上的实测异常,现在要寻求与观测异常相对应的理论模型的参量值bi(i=1,2,…,n),使理论异常与实测异常的偏差平方和

地球物理数据处理教程

为极小。

设bi的初值为

,则上述问题,即是要求修正量δi,使

地球物理数据处理教程

代入φ中,使φ获得极小。

高斯提出了首先将f函数线性化的近似迭代方法,即将f在

处按台劳级数展开取其线性项。

地球物理数据处理教程

式中

地球物理数据处理教程

给出后,

均可直接计算出来。将台劳展开式代入式(2.2.6)中,目标函数φ为

地球物理数据处理教程

要求

使φ取得极小,根据极小的必要条件

地球物理数据处理教程

将上式化为

地球物理数据处理教程

写成方程组形式

地球物理数据处理教程

式中:

(i,j=1,2,…,n)

再写成矩阵形式,有

地球物理数据处理教程

地球物理数据处理教程

其中

A=PTP

地球物理数据处理教程

式中:P称为雅可比(Jacobi)矩阵,是理论模型函数对参量的一阶导数矩阵。A为正定对称矩阵,实际计算时,当实测异常值已给出,模型体的初值

已选定后,A和

即可计算出,求解方程(2.2.7)即可求出

,从而可得

上面推导出的方程(2.2.7)是将f线性化所得,因而只有当f为真正的线性函数时,

才是真正的极小点

,即一步到达极小;当f为非线性函数时,台劳式线性化仅为近似式,近似程序视

的大小而定,当|δi|较大时,二次以上项忽略的误差就大,反之就小,所以对于非线性函数

不能简单地作为极小点

,一般将

作为新的初值

再重复上述做法,再解方程(2.2.7)又得到新的

,反复迭代下去,直到满足精度要求为止(例如|δi|小到允许误差)。

在高斯法应用中常常出现一种困难,即迭代过程不稳定,当

过大时,台劳展开的高次项太大而不能忽略时,就可能发生这样的情况,即用方程(2.2.7)求得的解,得到的参量

所对应的φ值大于

所对应的φ值,那么它将不能稳定地收敛于φ的极小值,即是出现了发散的情况,一般说来当f非线性程度越明显时,越易出现发散的情况。

因此高斯法的一种改进形式如下,即不直接把

作为校正值,而将它作为校正方向,记为

,而在该方向上用单变量求极小的方法寻找在这个方向上的极小点,即寻找一个α,使目标函数φ(

)为极小,取

作为新的初值,再继续迭代(0<α<1)。

把这个改进的方法称为广义最小二乘法,它使迭代过程的稳定性有所改善,即使这样当初值取得不好时,也有可能出现不收敛。

2.2.5 最速下降法

从前述已知,我们的目的是要求目标函数的极小,高斯法是利用将f函数线性化,建立一个正规方程(2.2.7)来求取修正量的,最速下降法是另一类型方法,它直接寻找φ函数的下降方向来求取修正量,所以它又称为直接法,而高斯法又称为间接法。

从目标函数φ出发来寻找其下降方向

地球物理数据处理教程

始终是大于或等于0,因此它一定有极小存在,我们首先考虑初值点

的一个邻域内,将φ在

处台劳展开取至线性项,有

地球物理数据处理教程

希望寻找使Φ下降的方向,即要找新点

,使φ(

)<φ(

即要求φ(

)-φ(

)>0,

且越大越好,那么可得

地球物理数据处理教程

地球物理数据处理教程

式中

表示φ函数对

的各分量的导数所组成的向量,即梯度向量。

要使上式取极大,有

地球物理数据处理教程

上式说明了φ值下降最快的方向

,应该是与梯度方向

相反的方向,即负梯度方向,那么修正量就应在负梯度方向上来求取。下面讨论从

出发,沿负梯度方向上求取极小点的方法,除了用前面介绍过的方法外,在此再介绍一种近似计算方法。

要求从

出发,沿-

方向的极小点,即要求λ使φ

为-

方向上极小点。根据极小必要条件,有

地球物理数据处理教程

如果φ为二次函数时,λ可以直接解出,在重磁反问题中φ为非二次函数,且函数形式较复杂,一般无法直接解出λ,而采用近似法,先将φ(

)台劳展开,取至线性项,即

地球物理数据处理教程

假设粗略认为φ的极小值为零,则极小点的λ应有

地球物理数据处理教程

这个方法计算简单,但误差较大,特别是

远离真正极小点

时,φ值较大,上式的假设不适合,当接近真极小点

附近时,可以采用。但在重磁反问题中,由于实测值Zk中含有干扰成分,所以即使到了

附近,φ值仍不会为零,因而上述计算λ的方法不能直接采用,可将上述计算的λ作为一个区间估计值,再用其他方法计算[0,λ]之间真正的λ值。

从上所述可将最速下降法叙述如下:从初值

出发,沿着φ(

)的负梯度方向-

)寻找极小点

,然后又从

出发,沿着φ(

)的负梯度方向-

)寻找极小点

,一直迭代下去,直到找到

为止。

由于这个方法是沿着初值点的最快下降方向,在该方向上如果采用单方向求极小的方法得到该方向上的极小点,那么又称“最优”、“最速”下降法。但需要指出的是,所谓“最速”是就初值点的邻域而言,所谓“最优”是指在初值点的负梯度方向上,所以它的着眼点是就局部而言,就初值点邻域而言,而对整体往往是既非“最优”,又非“最速”,而是一条曲折的弯路,难怪有人称它为“瞎子下山法”,如图2.5所示,当φ的等值面为拉长的椭球时更是如此。但它有一个十分可贵的优点,即在迭代的每一步都保证φ值下降,所以它是稳定收敛的,在φ函数复杂时,计算工作量较大些,对于大型计算机比较适用。

图2.5 最速下降法迭代过程示意图

图2.6 修正量的方向

2.2.6 阻尼最小二乘法(Marguardt)

比较上述两种方法可知,Gauss法修正量的步长大,当φ近于二次函数,可以很快收敛,但当φ为非二次函数,初值又给得不好时,常常引起发散。而最速下降法却能保证稳定的收敛,但修正量的步长小,计算工作量大。当φ的等值面为拉长的椭球时,Gauss法的修正量

和最速下降法的修正量

之间的夹角γ可达80°~90°,如图2.6所示。

对于φ为二次函数的情况下,高斯法的修正量

方向是指向φ的极小点,而最速下降法修正量

的方向是垂直于通过

点的φ函数等值面的切平面。因而当φ为比较复杂的函数时,有可能使

出现发散而失败。

阻尼最小二乘法是在Gauss法和最速下降法之间取某种插值,它力图能以最大步长前进,同时又能紧靠负梯度方向,这样既能保证收敛又能加快速度。它的基本思想是:在迭代过程的每一步,最好尽量使用Gauss法修正量方向

,以使修正步长尽可能地增大,如当这种情况下不能收敛时,再逐步改用接近最速下降的方向

,同时缩小步长,以保证收敛,下面以

表示由阻尼最小二乘法得出的修正量。

实现上述思想只要将方程

地球物理数据处理教程

改变为

地球物理数据处理教程

就能实现了。式中

为我们所要求的修正量,即称Marguardt修正向量,I为单位矩阵,λ是用来控制修正方向和步长的任意正数,又称阻尼因子,它起到阻止发散的作用,方程(2.2.9)中

显然是λ的函数,即

地球物理数据处理教程

通过这一改变后,即原来的正规方程(2.2.7)系数矩阵的主对角线上加一正数,从而使条件数得到了改善。如果原来A是奇异的,而A+λI可成为正定的,设原来A的最大特征值和最小特征值为μmax和μmin,则条件数就发生了如下变化:

地球物理数据处理教程

使病态条件数改善,对于计算来说,是十分有利的。

从方程(2.2.7)可看出,右端项为

地球物理数据处理教程

而φ的负梯度向量

的第i个分量

地球物理数据处理教程

所以

,即方程(2.2.7)、(2.2.9)的右端项

的方向即为负梯度方向,值为负梯度值的一半。

在方程(2.2.9)中,当λ=0时,即是(2.2.7)方程,这时

就是

;当λ→∞时,δ0

,而

是负梯度方向,这时

就是最速下降方向,所以阻尼最小二乘法的修正量

,是最速下降修正量

和Gauss法修正量

之间的某种插值,λ就是这种插值的权系数。

Marguardt向量

具有以下三个特性:

(1)当λ越来越大时,

的长度越来越小,且

地球物理数据处理教程

‖表示

向量的范数,也即是它的长度。

(2)当λ由零逐渐增大时,

的方向逐渐由Gauss法的方向

转向最速下降法方向

,λ越大,

方向越接近

方向。

(3)对λ>0的任意正数,

(满足方程(2.2.9))使φ在半径为‖

‖的球面上取得极小。

图2.7Δ0(λ)随λ的变化情况示意图

以上三个性质说明,当λ逐渐增大时,

的方向由

靠近,它的大小‖

‖逐渐减小,λ→∞时,‖

‖→0,如图2.7所示。因此在迭代的任何一步,我们总可以找到充分大的λ,来保证稳定的收敛,因为当φ 不下降时,就加大λ向

靠,一直到使φ下降为止,从而保证收敛。性质(3)说明在跨出同样的步长时,以

(λ)方向最好,这就保证了该法的优越性。在实际计算时,总是在保证收敛的前提下,取较小的λ,以获得较大的步长前进。

下面介绍阻尼最小二乘法的迭代步骤,即实际计算过程。

(1)给出模型体参量初值

,计算φ(

);给出实测场值ΔZk(k=1,2,…,m);给出阻尼因子的初值λ(0)及改变λ的比例系数v。

(2)开始迭代,λ=λ(0)/v

(3)计算A,(A+λI)及右端项

在初值点

的值,得方程(2.2.9),(A+λI)

的系数矩阵及右端项。

(4)求解方程(2.2.9)得

(5)计算

及φ(

)。

(6)比较φ(

)和φ(

)。

若φ(

)<φ(

),则该次迭代成功。判断

是否满足精度要求,若满足停止迭代,这时的

即为极小点

;若不满足精度要求,则将

作为新

,φ(

)作为新φ(

),减小λ作为新的λ(0),转向第(2)步,继续迭代下去。

若φ(

)>φ(

),则该次迭代失败,增大阻尼因子λ,将λ·v作为新的λ,转向第(4)步,即重新求解(A+λI)

方程,重新得到新的

该方法中阻尼因子λ的选择十分重要,上述选法是一种简单可行的方法,还有很多不同的选择方法,可参阅有关的书籍。

阅读全文

与数学中怎么确定最优参数值相关的资料

热点内容
word中化学式的数字怎么打出来 浏览:739
乙酸乙酯化学式怎么算 浏览:1404
沈阳初中的数学是什么版本的 浏览:1350
华为手机家人共享如何查看地理位置 浏览:1042
一氧化碳还原氧化铝化学方程式怎么配平 浏览:884
数学c什么意思是什么意思是什么 浏览:1408
中考初中地理如何补 浏览:1299
360浏览器历史在哪里下载迅雷下载 浏览:701
数学奥数卡怎么办 浏览:1387
如何回答地理是什么 浏览:1023
win7如何删除电脑文件浏览历史 浏览:1055
大学物理实验干什么用的到 浏览:1484
二年级上册数学框框怎么填 浏览:1699
西安瑞禧生物科技有限公司怎么样 浏览:971
武大的分析化学怎么样 浏览:1247
ige电化学发光偏高怎么办 浏览:1337
学而思初中英语和语文怎么样 浏览:1650
下列哪个水飞蓟素化学结构 浏览:1423
化学理学哪些专业好 浏览:1486
数学中的棱的意思是什么 浏览:1057