Professional Documents
Culture Documents
基于大数据的遥感参数人工智能反演范式理论形
成与工程技术实现
1,2,3* 1 4 5 6 2 5
毛克彪 ,袁紫晋 ,施建成 ,武胜利 ,胡德勇 ,车进 ,董立新
1. 中国农业科学院农业资源与农业区划研究所 北方干旱半干旱耕地高效利用全国重点实验室,北京 100081;2. 宁夏大学电子与电气工程学院,银
摘要:为了解决人工智能(Artificial Intelligence)应用在地球物理参数反演中的“黑箱”问题,使得人工智能应用具
有物理意义和可解释性及普适性,深度学习耦合物理方法和统计方法的理论和技术在各学科领域正在陆续展开。本研究通过
梳理作者 20 余年的相关研究,在前面归纳和演绎得到人工智能地球物理参数反演范式理论和判定条件基础上,分别给出了
遥感参数人工智能反演范式和判定条件。目前大家研究普遍遇到一个问题,很多人工智能参数反演理论模拟数据反演精度非
常高,但实际应用反演精度不理想,因此深度学习如何耦合物理方法和统计方法成为当前亟须解决的工程与技术难题。我们
以被动微波土壤水分和地表温度反演为例进行阐述,分析表明物理模型本身的精度还要很大的提升空间或者模拟数据只代表
现实情况中的少部分情况。因此只利用物理模型模拟数据直接进行反演还存在很大的局限,必须补充大量高精度的多源统计
观测数据。同时可以通过利用模拟数据对深度学习训练和用实际数据检验物理模型的误差。统计方法是人类最直观的描述,
物理方法是对统计方法的归纳演绎总结,但真实世界的信息或能量传输是按量子形式传递,物理模型只是当前人们认识世界
的最高形式,大部分模型并没有刻画好真实信息流。深度学习中的不同神经元更适合描述和表达量子信息的传输方式,以微
积分量子能量信息流认识真实世界需要提高人类的思维认知方式,这才是最高模式。如何采集满足真实情况(量子信息或能
量传输)的数据显得非常重要,当前可以充分利用物理逻辑推理构建物理方法和统计方法,并在范式理论和判定条件框架指
导下利用大数据思维模式提高地球物理参数反演精度。通过物理逻辑推理证明输入变量能唯一确定输出变量是形成具有物理
意义和可解释及通用的反演或分类或预测范式的基本条件,从量子信息(能量)传输真实角度控制采集数据质量是地球物理
参数高精度反演工程与技术实现的关键,提高微积分量子信息流思维认知和甄辨物理模型的局限对实现人工智能高精度反演
具有里程碑意义。
关键词:人工智能;深度学习;反演范式;物理逻辑推理;大数据
变量,形成更加通用的知识(物理模型或物理方法)。
1 引言 一般来说,模型和物理方法的精度要比统计方法精度
人类认识世界通过对物理现象观察(取样),然 要高,适应范围更广。但在很多学科中很多模型的适
后基于观察和思考用大脑粗象构造模式最大程度地 应范围是非常有限的,主要原因是这些模型有很多假
形成知识以达到快速认识世界或者目标的目的。也就 设条件或者做了大量简化或者人们认识还不是非常
是通过归纳总结,形成原始认知统计方法,在这个认 全面,其精度在有些情况下并不见得比统计方法精度
知基础上,人们通过演绎和逻辑推理,定义相关物理 高。因此在我们使用模型前一定要对模型建立的背景
收稿日期:2023-05-28;录用日期:2023-09-13
基金项目:国家重点研发计划项目“全球粮食和病虫害监测与预警(2023YFB3906202)”
联系方式:毛克彪,E-mail:maokebiao@caas.cn。
2 农 业 大 数 据 学 报 第5卷
和应用的条件作深入分析。 确保解的完备性;接着通过物理模型模拟获得物理
近年来,人工智能技术快速发展已经引起各行 方法具有代表性的典型解。为了克服物理模型不足,
业的广泛关注和应用。人工智能方法特别是深度学 同时从多源数据中获取统计方法的代表性解,这些
习神经网络算法是模仿人类大脑认识世界的模式, 解被用作深度学习的训练和测试数据集,从而到达
不同的人对人工智能解读不一样。其实真实世界的 深度学习耦合物理和统计方法的目的。最终利用深
信息或能量传送是基于量子形式,深度学习神经网 度学习技术对求解过程进行优化计算。判定条件是:
络 中的神 经元 与能量 量子 传送的 真实 情况更 加接 (1)输入变量和输出变量之间必须存在因果关系;
近,只是大部分人类的认知还没有跟上。从数学上 (2)输入变量和输出变量之间必须能构造闭合的方
讲,深度学习是一种优化计算方法,如果单从数据 程组(即方程的个数大于或等于未知数)。为了给
采集,然后训练深度学习的过程来讲,深度学习本 遥感参数或地球物理参数反演范式理论提供案例,
质上和统计方法是一致的。如果采集的数据能够覆 本文根据范式判定条件,构建和明确了农业气象遥
盖物理模型刻画的整个空间(具有代表性),并且 感关键参数(土壤水分、地表温度、发射率、近地
物理方法的解曲线理论上具有唯一性,那么通过深 表空气和大气水汽水量)等参数的反演范式,并进
度学习可以重复物理方法,也就是说深度学习可以 一步分析如何解决 AI 在参数反演求解过程中遇到的
重复高精度的物理方法求解过程。因此深度学习的 工程与技术瓶颈问题。
精度某种程度上取决于使用者的认知,以及怎么获
取有代表性的高精度训练和测试数据和如何保证数 2 遥感关键参数人工智能反演范式
据具有代表性。
我们深入研究了地球物理参数反演问题,在归 农业气象热红外遥感过程如图 1 中公式 1 所示,
纳演绎的基础上提出了基于人工智能耦合物理和统 式中 Ts 代表地表温度,Ti 代表波段 i 的星上亮度温度,
计方法的地球物理参数反演范式理论 [1][2]
,此理论针 τi(θ)代表波段 i 的大气透过率,εi(θ)代表波段 i 的在观
对遥感参数反演,也可以称之为遥感参数人工智能 察方向 θ 的地表发射率,Bi(Ts)代表地表辐射强度[2]。
反演范式理论:首先,根据物理能量平衡方程进行 各个参数之间相互影响和纠缠,如果不作简化普通数
物理逻辑推导,从理论层面构建反演方程组,证明 学方法无法求解,但简化则会给不同参数带来不同的
理论上存在和可以构建物理方法且存在唯一的空间 误差。因此,深度学习通过耦合物理方法和统计方法
解曲线;然后基于物理推导建立泛化的统计方法, 的解来优化计算物理和统计方法是参数反演的最佳方
图1 农业气象遥感参数之间的关系(土壤水分、地表温度、发射率、近地表空气温度和大气水汽含量)
Fig. 1 The relationship between agricultural meteorological remote sensing parameters (SM, LST, LSE, NSAT, WVC)
第4期 毛克彪等:基于大数据的遥感参数人工智能反演范式理论形成与工程技术实现 3
率之间的局部线性关系构建新的方程组,从而减少了 地表类型的信息,从而使得反演算法具有可移植性和
未知数和提出了针对 MODIS/ASTER 数据同时反演 通用性,并进一步利用神经网络耦合物理模型和统计
地表温度和发射率的多波段算法。为提高算法精度, 方法从理论上解决了热红外遥感反演近地表空气温度
接着提出了利用神经网络对物理方法进行优化计算 的难题。2022 年我们针对人工智能反演近地表空气温
[21-22]
的思想 。在进一步详细分析后,我们在 2007 年 度做了一个完整的物理逻辑推理[33],提出了人工智能
和 2008 年利用动态学习神经网络耦合物理方法和统 耦合物理和统计方法反演近地表空气温度范式,既先
[23-24]
计方法 ,这两篇论文的发表在地表温度和发射率 利用深度学习反演地表温度和发射率,然后利用地表
反演史上具有里程碑意义。我们在 2011 年和 2018 温度和发射率作为先验知识进行交叉迭代反演近地表
年对人工智能耦合物理模型和统计方法做了进一步 空气温度。经过物理逻辑推理,基于深度学习反演近
[25-26]
完善 ,2021 年我们继续对前面的研究做了一个 地表空气温度范式和条件如下:(1)至少需要 3 个热
[27]
综述和总结性的概括及提升 。在 2023 年形成了基 红外窗口波段+1 个水汽热红外吸收波段+LST+LSE;
于人工智能的反演范式理论,进一步将 MODIS 地表 或(2)至少 4 个的热红外窗口波段+LST+LSE;或(3)
温度和发射率反演扩展到波段 27、28、29、31 和 32, 至少 2 个以上的热红外窗口波段+2 个热红外水汽吸收
[1]
突破了以往的理论框架 。根据范式理论,经过物理 波段+LST+LSE。
逻辑推理,形成了热红外遥感地表温度和发射率人工 与地表温度反演相似,只是增加了地表温度和发
智能反演范式条件:(1)至少需要 3 个热红外窗口 射率作为先验知识。理论上讲,热红外窗口波段越多,
波段+至少 1 个水汽热红外吸收波段或者大气水汽含 特别是有水汽热红外吸收波段,精度越高而且越稳定,
量参数;或者(2)至少 4 个的热红外窗口波段。 但计算时间就增加,硬件设计难度就加大。
理论上讲,热红外窗口波段越多,特别是有水汽 2.4 基于热红外反演大气水汽含量人工智能反演范式
吸收波段时,精度就越高且越稳定,但计算时间增加, 大气水汽含量(Water Vapor Content, WVC)不
硬件设计难度就加大。因此从平衡角度讲。如果把观 仅是气候变化研究中的关键参数,也是遥感图像校
测角度作为一个未知数,硬件设计 4 个热红外窗口波 正需要的关键参数 [34-35] 。它在不同的时间和空间尺
段+1 个水汽吸收波段或者 5 个热红外窗口波段最佳。 度上扮演着非常重要的角色,它的时空变化可以影
如果硬件设计有难度,保证 3 个热红外窗口波段+1 个 响太阳辐射的空间变化,从而影响许多天气和气候
水汽热红外吸收波段或 4 个热红外窗口波段也可以实 变化。
现高精度的地表温度和发射率反演。 卫星遥感可以快速大面积获取大尺度的大气水汽
2.3 基于热红外反演近地表空气温度人工智能反演 信息。遥感获得大气水汽含量主要包括统计方法、
范式 物理方法和人工智能方法。统计方法的反演依赖于
地表温度反演一直是热红外遥感研究的重点,相 亮度温度(Brightness Temperature, BT)和大气水汽
对而言近地表气温(Near surface air temperature, NSAT) 含量的回归关系。这种方法优点是操作简单,只需
反演的研究不是很多。主要原因是晴空天气条件下, 要几个参数即可完成,但是物理意义不明确,而且
卫星传感器上获得热辐射信息主要来自地表,近地表 模型可移植性差。物理方法基于辐射能量平衡,理
空气温度的信息量不够,这导致利用遥感反演的近地 论反演精度高,但需要的参数较多,而且需要对大
表空气温度精度不高。因此,虽然国内外学者也针对 气的先验知识做出一些假设。由于遥感观测信息不
[28-30]
近地表空气温度的反演方法做了许多研究 ,但还 足,导致未知数数量大于求解方程数量,也常常存
没有形成一种可靠的大范围从遥感数据中直接反演近 在“病态”问题。考虑到统计方法和物理方法的优
地表空气温度的反演算法和产品。 点和缺点,我们提出了利用深度学习耦合物理和统
我们在 2008 年和 2013 年认真分析热红外遥感反 计方法[36-37]。在 2023 年,我们经过物理逻辑推理[1,38],
演近地表空气温度机理后,提出了利用地表温度和 得出基于深度学习大气水汽含量反演范式和条件如
发射率作为先验知识提高近地表空气温度反演精度 下:(1)至少需要 4 个热红外窗口波段+LST+LSE;
[31-32]
模式 。地表温度作为先验知识可以克服星上亮温 或者(2)至少 2 个的热红外窗口波段+2 个热红外
近地表空气温度信息量不足的困难,发射率可以提供 水汽吸收波段;或者(3)至少 1 个热红外波段窗口
第4期 毛克彪等:基于大数据的遥感参数人工智能反演范式理论形成与工程技术实现 5
如图 4a 在用 10 个高频通道反演地表温度时,地 高低起伏不一致,导致相对入射角变化很大,特别是
表温度反演的平均精度最高可以达到 1.48 K;当把土 在山区变化更大。我们把观测(入射)角度设为 0-
壤水分作为先验知识和 10 个高频通道反演地表温度 65°,用 10 个低频通道作为深度学习输入时,土壤水
时(图 4b),地表温度反演的平均精度为 0.8 K。对 分最高反演平均精度最高为 0.035 m3/m3(图 5a);
比发现将土壤水分作为先验知识可以大大提高地表温 将地表温度和 10 个低频通道作为输入时,土壤水分
度的反演精度。 平均反演精度最高为 0.027 m3/m3(图 5b),相比之
被动微波遥感像元分辨率低,大部分非像元都是 下比单入射角下,加入先验知识后精度提高的程度幅
混合像元,在 25 km 尺度的单个像元中,不同的地物 度要高不少。
的数据有关。如果数据集有偏差,那么网络的输出
4 讨论 也会出现偏差。虽然很多模型发表在权威刊物上,
从图 3-图 6 分析可以看出,被动微波土壤水分 其实很多物 理模型不能 精确地描述 能量或信息量
和地表温度反演比较复杂,误差呈矩状分布,理论 子传输的真实情况。很多模型做了很多简化,比如
上讲的空间曲线应该呈现线状分布。这说明可能存 AIEM 模型就没有考虑大气和降雨等的影响 [39] ,因
在两个原因,一是物理模型的构建还存在一定的改 此直接用 AIEM 模拟的数据训练深度学习反演土
进空间,模拟数据不准,特别一些模拟中设定的边 壤水分会出现比较大的误差。这就是为什么我们要
界范围组合的极端情况在真实世界中可能不存在; 补充大量的统计数据,因为 AIEM 模型模拟的数据
二是还可能存在维度(未知数)没有发现,从而导 只代表整个样本空间的一小部分情况。很多模型模
致方程并不闭合。另外 AIEM 模型只适合裸露地表, 拟的只是现 实情况中的 一种,哪怕 是精度很高的
并且 AIEM 模型还没有考虑云和降雨等的影响。因 MODTRAN 模型 [40] ,因为现实情况中都是混合像
此,AIEM 模拟的数据也只是裸露地表情况中的一部 元,同一个像元中的不同地物类型相互影响,而且
分情况,还需要补充大量的其他数据,特别是植被 受地形和太阳照射角度影响很大,模型中没有考虑
和大气等参数影响下的情形。微波植被模型更加复 这些情况。因此利用深度学习解决实际问题时,一
杂,每个模型都有自己的适应范围。有的模型适合 定要对研究的问题了解得非常透彻,也就是我们提
森林、有的适合农作物,而且即使是同一种地表类 到的要先做物理逻辑推理,然后构建物理方法,在
型,模型在植被的不同生长阶段模拟精度差异也很 物理方法的基础上构建统计方法,然后利用大数据
大。这就需要我们以物理逻辑推理为基础构建统计 思维尽可能地获得全面的代表性解,最后训练深度
方法,并利用多源数据,采集大量的其他代表性的 学习网络。切忌简单不加分辨地采集大量的数据,
解,形成大数据并进一步训练和测试。具体分析可 然后进行训练和测试及应用。当然,反过来,我们
以参见文献[2],这里不再细述。 可以用模型模拟的大量数据训练深度学习网络,然
这里要着重提一下,很多人遇到同一个问题, 后用训练好的深度学习进行实际应用,从而检验研
直接利用模 型模拟的数 据训练和测 试深度学习后 究人员提出或构建模型的精度,这是一种非常好的
发现模拟数据精度非常高,然后直接用来反演实际 模型适用范围测试方案。对于高分辨率的热红外或
数据发现结果误差很大,百思不得其解,甚至怀疑 微波遥感数据,可以考虑加入纹理信息、波谱信息、
深度学习。出现这种情况的主要原因是所使用的模 时序信息等 作为辅助信 息提高参数 反演或分类或
型精度并不高,因为训练好的深度学习只与它所学 预测精度。
第4期 毛克彪等:基于大数据的遥感参数人工智能反演范式理论形成与工程技术实现 9
理论和判定条件,对农业气象遥感关键参数(土壤水
5 结论 分、地表温度、发射率、近地表空气温度和大气水汽
2023 年,ChatGPT 再次将人工智能推向高潮。事 含量)等其他参数反演的范式形成及判定条件进行了
实上,人工智能方法是一种描述信息或能量传输更接 阐述,分别给去相关参数反演范式判定条件。针对大
近现实情况的数学方法,其本质与物理方法和统计方 家使用模拟数据反演精度很高,但实际应用反演精度
法是一致的,三种(统计方法、物理方法和人工智能 不理想的问题进行了分析,结论是大家所使用的物
方法)不同的方法是人们用不同认知方式构建不同坐 理模型并不能完美的模拟真实情况,特别是一些遥
标系识别目标的手段。统计方法是人类原始的认知方 感模型的精度本身就不足,只能模拟某些特定的情
法,在经过总结和演绎推理后形成了物理方法。虽然 况。深度学习在使用模拟数据训练后直接应用会出
物理方法便于人们认识世界,但很多物理方法并没有 现较大的偏差。因此在当前大家的认知和计算机硬
完美地刻画真实情况,很多模型只是人们定义了一些 件条件下,如何基于大数据思维构建物理方法和统
数学物理变量进行的简化描述。真实世界的能量或信 计方法代表性解显得至关重要,特别是基于能量或
息流是按照量子的形式进行传输,深度学习神经元以 信息量子传输形式的真实情况进行数据采集控制是
微积分的另外一种形式更加逼近地描述了能量或信息 保证深度学习反演精度的关键。我们用被动微波数
流的真实传输情况,其精度更高。只是大部分人的认 据土壤水分和地表温度反演做了分析,这为其他参
知还没有达到这个高度,主要原因是我们生活中所使 数反演提供了具体的工程与技术实现范例,这套理
用的工具(计算机等硬件)还需要进一步提升,未来 论对于地球物理参数的分类或预测等同样适用。本
量子计算机的实现和应用对提高人们的认知将起到决 研究提出的范式理论和提高微积分量子信息流思维
定性的作用。在量子计算机等芯片硬件技术和深度学 认知及甄辨物理模型的局限对实现人工智能高精度
习神经网络一起辅助下,人类对世界的认知将大幅提 地球物理参数反演或分类或预测具有里程碑意义。
升。理论上在量子计算机的辅助下,深度学习可以无 从理论到工程应用还有很长的路要走,工程需要针
限逼近真实世界,以微积分能量和信息流的认知模式 对具体的不同情况进行细化和处理,特别是如何构
未来将取代当前物理模型的地位。当前确定人工智能 建具有大数据思维的全球大模型和局部区域的小模
方法的物理意义和通用性目的是帮助人们在现阶段理 型提升应用精度。我们希望得到国家科技部和国家
解为什么可以得到这个结果,其实我们需要做的只是 基金委的支持,将研究成果进一步推向实用,构建
证明或确定深度学习中几个输入变量(信息)可以唯 类似 GPT 的全球参数反演大模型,也期望与各相关
一确定输出变量(信息),然后采集满足条件的数据 单位和科技公司合作,使得成果转化,推动国内外
通过训练深度学习微积分的量子信息传输模型,从而 遥感参数反演大模型的理论和工程应用。
逼近真实世界。
在当前的认知条件下,为了解决人工智能应用在 参考文献
地球物理参数反演中的“黑箱”问题,使得人工智能 [1] 毛克彪,张晨阳,施建成,等. 基于人工智能的地球物理参数反演范
从量子信息传输的角度证明几个输入变量能唯一确定 [3] MAO K, SHI J, LI Z, et al. Land surface temperature and emissivity
[6] MAO K B, SHI J C, TANG H J, et al. A neural–network technique for IEEE Transactions on Geoscience and Remote Sensing, 1997, 35:
data[C/OL]. International Geoscience and Remote Sensing [20] 毛克彪,施建成,覃志豪,等. 一个针对 ASTER 数据同时反演地表温
temperature from AMSR2 data using a deep dynamic learning neural 19(3): 18-22.
network[J]. Chinese Geographical Science, 2018, 28(1): 1-11. [23] MAO K B, SHI J C, LI Z L, et al. An RM-NN algorithm for retrieving
[9] TAN J C, NOURELDEEN N, MAO K B, et al. Deep learning land surface temperature and emissivity from EOS/MODIS data[J].
convolutional neural network for the retrieval of land surface Journal of Geophysical Research: Atmospheres,2007,112(D21): ID
2987. [24] MAO K B, SHI J C, TANG H J, et al. A neural network technique for
[10] MAO K, TANG H, ZHANG L, et al. A method for retrieving soil separating land surface emissivity and temperature from ASTER
moisture in Tibet region by utilizing microwave index from imagery[J]. IEEE Transactions on Geoscience and Remote Sensing,
[11] 毛克彪,胡德勇,黄健熙,等. 针对被动微波数据 AMSR-E 数据的土 temperature and emissivity from ASTER1B data using a dynamic
壤水分反演算法[J]. 高技术通讯, 2010,20(6): 651-659. learning neural network[J]. International Journal of Remote Sensing,
武汉大学学报(信息科学版), 2005,30(8):703-707. [27] WANG H, MAO K B, YUAN Z J, et al. A method for land surface
[14] MAO K B, QIN Z, SHI J, et al. A practical split-window algorithm for temperature retrieval based on model-data-knowledge-driven and deep
retrieving land surface temperature from MODIS data[J]. International learning[J]. Remote sensing of environment, 2021, 265: ID 112665.
Journal of Remote Sensing, 2005,26:3181-3204. [28] CRESSWELL M P, MORSE A P, THOMSON M C, et al. Estimating
[15] 毛克彪,覃志豪,宫鹏,等. 劈窗算法 LST 精度评价和参数敏感性分 surface air temperatures, from Meteosat land surface temperatures,
析[J]. 中国矿业大学学报,2005(3):318-322. using an empirical solar zenith angle model[J]. International Journal
window algorithm and its sensitivity analysis for retrieving land [29] MOSTOVOY G V, KING R L, REDDY K R, et al. Statistical
surface temperature from NOAA-advanced very high resolution estimation of daily maximum and minimum air temperatures from
radiometer data[J]. Journal of Geophysical Research: Atmospheres, MODIS LST data over the state of Mississippi[J]. Mapping Sciences
[17] WAN Z, DOZIER J. A generalized split-window algorithm for [30] 徐永明,覃志豪,万洪秀. 热红外遥感反演近地层气温的研究进展
retrieving land surface temperature measurement from space[J]. IEEE [J]. 国土资源遥感,2011(1): 9-14.
Transactions on Geoscience and Remote Sensing,1996,34:892-905. [31] MAO K B, TANG H J, WANG X F, et al. Near-surface air
[18] LI Z L, BECKER F. Feasibility of land surface temperature and temperature estimation from ASTER data based on neural network
emissivity determination from AVHRR data[J]. Remote Sensing of algorithm[J]. International Journal of Remote Sensing, 2008, 29(20):
第4期 毛克彪等:基于大数据的遥感参数人工智能反演范式理论形成与工程技术实现 11
RM-NN 算法[J]. 高技术通讯, 2013,23(5):462-466. [37] MAO K B, SHEN X Y, ZUO Z Y, et al. An advanced radiative transfer
[33] DU B Y, MAO K B, BATENI S M, et al. A novel fully coupled and neural network scheme and evaluation for estimating water vapor
physical–statistical–deep learning method for retrieving near-surface content from MODIS data[J]. Atmosphere,2017,8(8):ID 139.
air temperature from multisource data[J]. Remote Sensing, 2022, [38] MEI R, MAO K B, SHI J, et al. A novel physics-statistical coupled
14(22): ID 5812. paradigm for retrieving integrated water vapor content based on
[34] MAO K, QIN Z, XU B, et al. The Influence analysis of water content artificial intelligence[J]. Remote Sensing, 2023,15(17):4250. https://
Geoscience and Remote Sensing Symposium (IGARSS05), 25-29 [39] CHEN K S, WU T, TSANG L, et al. Emission of rough surfaces
July 2005. DOI:10.1109/IGARSS.2005.1526538. calculated by the integral equation method with comparison to
[36] MAO K B, LI H T, HU D Y, et al. Estimation of water vapor content 算[J]. 空间与测绘, 2004, 27(2):1-3.
引用格式:毛克彪,袁紫晋,施建成,武胜利,胡德勇,车进,董立新.基于大数据的遥感参数人工智能反演范式理论形成与工程技术实现[J].农业大数据学
报,2023,5(4):1-12.
CITATION: MAO KeBiao, YUAN ZiJin, SHI JianCheng, WU ShengLi, HU DeYong, CHE Jin, DONG LiXin. Theory and Engineering Technology
Implementation of Artificial Intelligence Retrieval Paradigm for Parameters of Remote Sensing Based on Big Data[J]. Journal of Agricultural
Abstract: In order to solve the "black box" problem of artificial intelligence application in geophysical parameter retrieval, and make
artificial intelligence applications have physical significance, interpretability, and universality, the theory and technology of deep
learning coupling physical and statistical methods are gradually being developed in various disciplinary fields. This study
summarizes the author's more than 20 years of relevant research, and presents the artificial intelligence inversion paradigms and
judgment conditions for remote sensing parameters based on the induction and deduction of the theory and judgment conditions of
artificial intelligence geophysical parameter inversion paradigms. At present, a common problem encountered in many studies is that
many artificial intelligence parameter retrieval uses theoretical simulation data to achieve high retrieval analysis accuracy, but the
actual application retrieval accuracy is not ideal. Therefore, deep learning how to couple physical and statistical methods has become
12 农 业 大 数 据 学 报 第5卷
an urgent engineering and technical challenge that needs to be addressed. We will take passive microwave soil moisture and surface
temperature retrieval as an example to illustrate that the accuracy of the physical model itself still needs to be greatly improved, or
the simulated data only represents a small portion of the actual situation. We believe that there are significant limitations in using
only physical models to simulate data for direct retrieval, and high-precision multi-source statistical data must be supplemented. At
the same time, we can also improve the physical model by directly using deep learning to simulate data training and testing with
actual data to verify the gap between the physical model and the actual situation, determine the errors of the physical model, and thus
improve the physical model. Statistical methods are the most intuitive description of human beings, while physical methods
summarize and generalize statistical methods. However, information or energy transmission in the real world is transmitted in
quantum form, and many physical models have made many simplifications without depicting real physical phenomena well.
Different neurons in deep learning are more suitable for describing and expressing the transmission methods of quantum information.
Understanding the real world through calculus quantum information flow requires improving our cognitive thinking. How to collect
data that meets the real situation (quantum information or energy transmission) is very important. We can fully utilize physical logic
reasoning to construct physical formulas and statistical methods, and use big data thinking mode to improve the accuracy of
geophysical parameter inversion under the guidance of paradigm theory and judgment condition framework. Proving through
physical logic reasoning that the input variable can uniquely determine the output variable is a fundamental condition for forming a
physically meaningful, interpretable, and universal retrieval or classification or prediction paradigm. Controlling the quality of
collected data from the perspective of quantum information (energy) transmission is the key to achieving high-precision inversion
engineering and technology for geophysical parameters. Improving the cognitive understanding of quantum information flow in
calculus and identifying the limitations of physical models are of milestone significance for achieving high-precision inversion in
artificial intelligence.
Keywords: artificial intelligence; deep learning; retrieval paradigm; physical logic derivation; big data