4.放牧强度与沙漠化程度模型
问题一:沙漠化建模
沙漠化相关关系的指标因子可以考虑
- 风速、降水、气温(三个气象因素)
- 植被盖度、地表水资源、地下水位(三个地表因素)
- 人口数量、牲畜数量、社会经济水平(三个人文因素)等。
由于人口、牲畜数量、经济GDP只有每年的值,没有每月的值,所以我们对以下变量求每年的平均:风速、降水、气温(三个气象因素);植被盖度、地表水资源、地下水位(三个地表因素) 人口、牲畜数量、经济生产总值由2021统计年鉴得到,取2012-2020的数据风速、降水、气温由附件8得到植被盖度通过问题2拟合的cp(覆盖率)和NDVI的关系得到地表水资源由附件9径流量得到地下水位直接使用200cm湿度数据, 然后我们需要对这9个指标进行主成分分析PCA,取排名靠前的5个主成分和权重系数。沙漠化程度由着5个主成分加权得到。
主成分分析
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。
PCA算法流程
求样本 $x_i$ 的 $n'$ 维的主成分其实就是求样本集的协方差矩阵 $\frac{1}{m}XX^\top$ 的前 n' 个特征值对应特征向量矩阵 P ,然后对于每个样本 $x_i$ ,做如下变换 $y_i=Px_i$ ,即达到降维的PCA目的。
下面我们看看具体的算法流程:
输入: $n$ 维样本集 $X=(x_1,x_2,…,x_m)$ ,要降维到的维数 $n'$ .
输出:降维后的样本集 Y
1.对所有的样本进行中心化
2.计算样本的协方差矩阵
3.求出协方差矩阵的特征值及对应的特征向量
4.将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P
5.Y=PX即为降维到k维后的数据
熵值法
一、基本原理 在信息论中,嫡是对不确定性的一种度量。不确定性越大,嫡就越大,包含的信息量越大;不确定性越小,嫡就越小,包含的信息量就越小。 根据嫡的特性,可以通过计算嫡值来判断一个事件的随机性及无序程度,也可以用嫡值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响(权重)越大。比如样本数据在某指标下取值都相等,则该指标对总体评价的影响为0,权值为0. 嫡权法是一种客观赋权法,因为它仅依赖于数据本身的离散性。
二、熵值法步骤 1.对n个样本,m个指标,则Cij为第i个样本的第j个指标的数值$(i=1,…,n;j=1,..,m)$; 2.指标的归一化处理:异质指标同质化 由于各项指标的计量单位并不统- ,因此在用它们计算综合指标前,先要进行标准化处理,即把指 标的绝对值转化为相对值,从而解决各项不同质指标值的同质化问题。 另外,正向指标和负向指标数值代表的含义不同(正向指标数值越高越好,负向指标数值越低越 好) ,因此,对于正向负向指标需要采用不同的算法进行数据标准化处理:
我们令归一化后的数据$x_{ij}^{‘}$仍记作$x_{ij}$ 3.计算第j项指标下第i个样本值占该指标的比重:
6.计算各项指标的权重 :
问题二:给出定量的土壤板结化定义
关于土壤板结化程度:土壤湿度w越少,容重c越大,有机物含量o越低,土壤板结化程度越严重。 土壤湿度使用10cm湿度,有机物含量使用附件14有机碳数据, 然后我们使用熵权法确定3个评价指标的权重,土壤板结化程度由这3个量加权得到 (注:这里我们没有容重这个数据,可以编或者忽略这个因素。) Y2=b1x1+b2x2+b3*x3 其中x1~x3分别代表上面3个指标,Y2为土壤板结化程度
问题三:给出放牧策略模型,使得沙漠化程度指数与板结化程度最小
给出放牧策略模型,使得沙漠化程度指数与板结化程度最小。 两个优化目标,优化变量为放牧策略,对于多目标优化问题,可以将两个优化目标加权求和变成单目标求解
优化目标Y3=沙漠化程度的权重沙漠化程度+(1-沙漠化程度的权重)土壤板结化程度 求最优的放牧强度,使得Y3最小
下面的公式中,$x1~x9$代表沙漠化程度相关的因素,$x1^~x3^$代表土壤板结化程度相关因素。这一共12个因素,其中几个因素和问题1的模型中的变量有对应关系,对于没有对应关系的因素,我们直接将它们取最近一年(2021年)的值。通过迭代或者遗传算法或者粒子群等等算法(算法很多,可以语文建模)求解这个模型,我们可以得到最优的放牧强度(放牧方式不用管),最优的放牧强度可以编(语文建模)