一、微分
1.1 定义
正方形金属薄片,函数A=x2A=x^2A=x2相应的增量ΔA\Delta AΔA,即
ΔA=(x0+Δx)2−x02=2x0Δx+(Δx)2
\Delta A=(x_0+\Delta x)^2-x_0^2=2x_0\Delta x+(\Delta x)^2
ΔA=(x0+Δx)2−x02=2x0Δx+(Δx)2
当Δx→0\Delta x\to 0Δx→0时,第二部分(Δx)2(\Delta x)^2(Δx)2是比Δx\Delta xΔx高阶的无穷小,即(Δx)2=o(Δx)(\Delta x)^2=o(\Delta x)(Δx)2=o(Δx)。由此可见,如果边长改变很微小,即∣Δx∣|\Delta x|∣Δx∣很小时,面积的改变量ΔA\Delta AΔA可近似第用第一部分来代替。
一般地,如果函数y=f(x)y=f(x)y=f(x)满足一定条件,那么增量Δy\Delta yΔy可表示为
Δy=AΔx+o(Δx)
\Delta y=A\Delta x+o(\Delta x)
Δy=AΔx+o(Δx)
其中A是不依赖于Δx\Delta xΔx的常数,因此AΔxA\Delta xAΔx是Δx\Delta xΔx的线性函数,且Δy\Delta yΔy与它的差
Δy−AΔx=o(Δx)
\Delta y-A\Delta x=o(\Delta x)
Δy−AΔx=o(Δx)
是比Δx\Delta xΔx高阶的无穷小。所以,当A≠0A\neq 0A=0,且∣Δx∣|\Delta x|∣Δx∣很小时,可以用Δx\Delta xΔx的线性函数AΔxA\Delta xAΔx来近似替代Δy\Delta yΔy。
定义:设函数y=f(x)y=f(x)y=f(x)在某区间内有定义,x0x_0x0及x0+Δxx_0+\Delta xx0+Δx在这区间内,如果函数的增量
Δy=f(x0+Δx)−f(x0)
\Delta y=f(x_0+\Delta x)-f(x_0)
Δy=f(x0+Δx)−f(x0)
可表示为
Δy=AΔx+o(Δx)
\Delta y =A\Delta x+o(\Delta x)
Δy=AΔx+o(Δx)
其中A是不依赖于Δx\Delta xΔx的常数,那么称函数y=f(x)y=f(x)y=f(x)在点x0x_0x0是可微的,而AΔxA\Delta xAΔx叫做函数y=f(x)y=f(x)y=f(x)在点x0x_0x0相应于自变量增量Δx\Delta xΔx的微分,记作dydydy,即
dy=AΔx
dy=A\Delta x
dy=AΔx
例1:求函数y=x2y=x^2y=x2在x=1x=1x=1处的微分
解:函数y=x2y=x^2y=x2在x=1x=1x=1处的微分为
dy=(x2)′∣x=1Δx=2Δx
dy=(x^2)'|_{x=1}\Delta x=2\Delta x
dy=(x2)′∣x=1Δx=2Δx
函数y=f(x)y=f(x)y=f(x)在任意点x的微分,称为函数的微分,记作dydydy或df(x)df(x)df(x),即
dy=f′(x)Δx
dy=f'(x)\Delta x
dy=f′(x)Δx
例2:函数y=cos xy=cos \space xy=cos x的微分为
dy=(cos x)′Δx=−sin xΔx
dy=(cos \space x)'\Delta x=-sin\space x\Delta x
dy=(cos x)′Δx=−sin xΔx
例3:求函数y=x3y=x^3y=x3当x=2x=2x=2,Δx=0.02\Delta x=0.02Δx=0.02时的微分
解:先求函数在任意点x的微分
dy=(x3)’Δx=3x2Δx
dy=(x^3)’\Delta x=3x^2\Delta x
dy=(x3)’Δx=3x2Δx
再求函数当x=2,Δx=0.02x=2,\Delta x=0.02x=2,Δx=0.02时的微分
dy∣x=2,Δx=0.02=(3x2Δx)∣x=2,Δx=0.02=3⋅22⋅0.02=0.24
dy|_{x=2,\Delta x=0.02}=(3x^2\Delta x)|_{x=2,\Delta x=0.02}=3·2^2·0.02=0.24
dy∣x=2,Δx=0.02=(3x2Δx)∣x=2,Δx=0.02=3⋅22⋅0.02=0.24
通常把自变量x的增量Δx\Delta xΔx称为自变量的微分,记作dxdxdx,即dx=Δxdx=\Delta xdx=Δx,于是函数y=f(x)y=f(x)y=f(x)的微分又可记作
dy=f′(x)dx
dy=f'(x)dx
dy=f′(x)dx
从而有
dydx=f′(x)
\frac{dy}{dx}=f'(x)
dxdy=f′(x)
这就是说,函数的微分dydydy与自变量的微分dxdxdx之商等于该函数的导数。因此,导数也叫做“微商”。
1.2 几何意义
在直角坐标系中,函数y=f(x)y=f(x)y=f(x)的图形是一条曲线。对于某一固定的x0x_0x0值,曲线上有一个确定点M(x0,y0)M(x_0,y_0)M(x0,y0),当自变量x有微小增量Δx\Delta xΔx时,就得到曲线上另一点N(x0+Δx,y0+Δy)N(x_0+\Delta x,y_0+\Delta y)N(x0+Δx,y0+Δy)。
由图可知
MQ=Δx,QN=Δy
MQ=\Delta x,\\
QN=\Delta y
MQ=Δx,QN=Δy
过点M作曲线的切线MT,它的倾角为α\alphaα,则
QP=MQ⋅tan α=Δx⋅f′(x0)
QP=MQ·tan\space \alpha=\Delta x·f'(x_0)
QP=MQ⋅tan α=Δx⋅f′(x0)
即
dy=QP
dy=QP
dy=QP
由此可见,对于可微函数y=f(x)y=f(x)y=f(x)而言,当Δy\Delta yΔy是曲线y=f(x)y=f(x)y=f(x)上的点的纵坐标增量时,dydydy就是曲线的切线上点的纵坐标的相应增量。当∣Δx∣|\Delta x|∣Δx∣很小时,∣Δy−dy∣|\Delta y-dy|∣Δy−dy∣比|Δx\Delta xΔx|小得多。因此在点M邻近,我们可以用切线线段来近似代替曲线段。在局部范围内用线性函数近似非线性函数,在几何上就是局部用切线段近似替代曲线段,这在数学上称为非线性函数的局部线性化。
二、全微分
由偏导数定义知,二元函数对某个自变量的偏导数表示当另一个自变量固定时,因变量相对于该自变量的变化率。根据一元函数微分学中增量与微分的关系,可得
f(x+Δx,y)−f(x,y)≈fx(x,y)Δx,f(x,y+Δy)−f(x,y)≈fy(x,y)Δy
f(x+\Delta x,y)-f(x,y) \approx f_x(x,y)\Delta x, \\
f(x,y+\Delta y)-f(x,y) \approx f_y(x,y)\Delta y
f(x+Δx,y)−f(x,y)≈fx(x,y)Δx,f(x,y+Δy)−f(x,y)≈fy(x,y)Δy
上面两式的左端分别叫做二元函数对x和对y的偏增量,而右端分别叫做二元函数对x和y的偏微分。
在实际问题中,有时需要研究多元函数中各个自变量都取得增量时因变量所获得的增量,即所谓的全增量问题。下面以二元函数为例进行讨论。
设函数z=f(x,y)z=f(x,y)z=f(x,y)在点P(x,y)P(x,y)P(x,y)的某邻域内有定义,P′(x+Δx,y+Δy)P'(x+\Delta x,y+\Delta y)P′(x+Δx,y+Δy)为这邻域内的任意一点,则称这两点的函数值之差f(x+Δx,y+Δy)−f(x,y)f(x+\Delta x,y+\Delta y)-f(x,y)f(x+Δx,y+Δy)−f(x,y)为函数在点P对应于自变量增量Δx\Delta xΔx和Δy\Delta yΔy的全增量,记作Δz\Delta zΔz,即
Δz=f(x+Δx,y+Δy)−f(x,y)
\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)
Δz=f(x+Δx,y+Δy)−f(x,y)
一般说来,计算全增量Δz\Delta zΔz比较复杂。与一元函数的情形一样,我们希望用自变量的增量Δx、Δy\Delta x、\Delta yΔx、Δy的线性函数来近似地代替函数的全增量Δz\Delta zΔz,从而引入如下定义。
定义:设函数z=f(x,y)z=f(x,y)z=f(x,y)在点(x,y)(x,y)(x,y)的某邻域内有定义,如果函数在点(x,y)(x,y)(x,y)的全增量
Δz=f(x+Δx,y+Δy)−f(x,y)
\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)
Δz=f(x+Δx,y+Δy)−f(x,y)
可表示为
Δz=AΔx+BΔy+o(ρ)
\Delta z =A\Delta x+B\Delta y+o(\rho)
Δz=AΔx+BΔy+o(ρ)
其中A和B不依赖于Δx\Delta xΔx和Δy\Delta yΔy而仅与x和y有关,ρ=(Δx)2+(Δy)2\rho=\sqrt{(\Delta x)^2+(\Delta y)^2}ρ=(Δx)2+(Δy)2,那么称函数z=f(x,y)z=f(x,y)z=f(x,y)在点(x,y)(x,y)(x,y)可微分,而AΔx+BΔyA\Delta x+B\Delta yAΔx+BΔy称为函数z=f(x,y)z=f(x,y)z=f(x,y)在点(x,y)(x,y)(x,y)的全微分,记作dzdzdz,即
dz=AΔx+BΔy
dz=A\Delta x+B\Delta y
dz=AΔx+BΔy
如果函数在区域D内各点处都可微分,那么称这函数在D内可微分。
定理1(必要条件):如果函数z=f(x,y)z=f(x,y)z=f(x,y)在点(x,y)(x,y)(x,y)可微分,那么该函数在点(x,y)(x,y)(x,y)的偏导数∂z∂x\frac{\partial z}{\partial x}∂x∂z与∂z∂y\frac{\partial z}{\partial y}∂y∂z必定存在,且函数z=f(x,y)z=f(x,y)z=f(x,y)在点(x,y)(x,y)(x,y)的全微分为
dz=∂z∂xΔx+∂z∂yΔy
dz=\frac{\partial z}{\partial x}\Delta x+\frac{\partial z}{\partial y}\Delta y
dz=∂x∂zΔx+∂y∂zΔy
定理2(充分条件):如果函数z=f(x,y)z=f(x,y)z=f(x,y)的偏导数∂z∂x\frac{\partial z}{\partial x}∂x∂z、∂z∂y\frac{\partial z}{\partial y}∂y∂z在点(x,y)(x,y)(x,y)连续,那么函数在该点可微分。
以上关于二元函数全微分的定义及可微分的必要条件和充分条件,可以完全类似地推广到三元和三元以上的多元函数。
习惯上,我们将自变量的增量Δx\Delta xΔx与Δy\Delta yΔy分别记作dxdxdx与dydydy,并分别称为自变量x与y的微分。这样,函数z=f(x,y)z=f(x,y)z=f(x,y)的全微分就可写为
dz=∂z∂xdx+∂z∂ydy
dz=\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy
dz=∂x∂zdx+∂y∂zdy
通常把二元函数的全微分等于它的两个偏微分之和这件事称为二元函数的微分符合叠加原理。
叠加原理也适用于二元以上的函数。例如,如果三元函数u=f(x,y,z)u=f(x,y,z)u=f(x,y,z)可微分,那么它的全微分就等于它的三个偏微分之和,即
du=∂u∂xdx+∂u∂ydy+∂u∂zdz
du=\frac{\partial u}{\partial x}dx+\frac{\partial u}{\partial y}dy+\frac{\partial u}{\partial z}dz
du=∂x∂udx+∂y∂udy+∂z∂udz