基于文献计量和遗传算法的土地利用优化研究进展 您所在的位置:网站首页 遗传算法的研究现状 基于文献计量和遗传算法的土地利用优化研究进展

基于文献计量和遗传算法的土地利用优化研究进展

2023-06-02 14:20| 来源: 网络整理| 查看: 265

美丽中国是新时期生态文明建设的目标和愿景。在这一目标的引导下, 国土空间规划为美丽中国建设提供了空间保障, 是实现美丽中国的重要途径[1]。国土空间规划是将主体功能区规划、土地利用规划、城乡规划等空间规划融合的新的规划体系[2]。土地利用规划是对不同的土地利用类型进行数量设计并空间分配的过程[3], 它是国土空间规划的重要组成。优化土地利用有众多不同类型的方法, 如基于规划者主观的方法, 基于统计分析的方法, 基于数学规划的方法。其中, 基于数学规划的方法, 自1965年Schlager[4]首次将线性规划引入土地利用优化问题后, 被越来越多地使用。但量化后的土地利用优化问题涉及巨大的数据量, 采用传统的数学规划方法求解困难。因此, 启发式算法逐渐被使用, 其中遗传算法的应用较为广泛。

遗传算法始于20世纪70年代, 它通过模仿自然界中生物进化过程来求解极值问题。遗传算法的一些特点, 如不受目标函数连续可微的限制, 陷入局部最优风险降低, 使其在求解复杂优化问题时展现出巨大优势。它在许多领域都得到了广泛的应用, 并且成果已被总结和综述[5—8]。而在土地利用优化领域, 虽然已经有学者在技术方法方面进行了综述, 但这些综述涉及的范围都比较大, 如对所有类型方法和模型的综述[9—11], 对所有优化技术的综述[12], 以及对各种元启发式算法的综述[13], 具体的关于基于遗传算法的成果的梳理总结还比较缺乏。在生态文明建设和智能算法快速发展的背景下, 科学、客观地对基于遗传算法的土地利用优化研究进展进行分析是非常必要的。

文献计量通过数学和统计学的方法, 定量地分析知识载体, 研究文献的数量关系、分布结构、变化规律, 并进而探讨科学技术的某些特征、规律[14]。其计量对象主要是文献量、词汇数、作者数等[15]。本文采用文献计量方法, 探究基于遗传算法的土地利用优化研究的主要特征和发展趋势, 并对未来研究的发展方向进行展望。

1 研究方法与数据来源

本文采用Excel统计工具, 对文献的总体研究概况进行分析, 同时利用CiteSpace软件, 对文献的主要作者、研究机构、关键词以及文献共被引情况进行可视化及分析。CiteSpace是目前最为流行的知识图谱绘制工具之一, 它主要基于共引分析理论和寻径网络算法, 对特定领域文献进行计量, 来探索学科结构及演化路径[16], 该软件在文献计量分析和可视化方面得到广泛应用[17—19]。本文使用CiteSpace 5.6.R4版本对数据进行处理, 并绘制图谱。CiteSpace通过合成一系列独立网络来制作图谱, 每个独立网络都是根据一定的时间间隔(由用户设定)内出版的文献构建的, 这一时间间隔被称为时间切片[20]。

本文的数据样本来源于Web of Science数据库中的Web of ScienceTM核心合集和中国科学引文数据库, 分别反映英文论文和中文论文中遗传算法土地利用优化的研究现状。以TS = (“genetic algorithm” AND “land use” AND “optimization”) 为检索式进行检索, 文献类型选择“All document types”(全部文档类型), 时间跨度选择“所有年份(1900—2022)”, 其余均保留默认选项。对检索结果进行筛选, 剔除不相关的论文, 最终得到英文论文164条检索结果, 中文论文27条检索结果, 这些文献分布在1999—2022年(截至2022年1月22日)。

2 计量结果分析 2.1 总体研究概况

首先在Excel中对在Web of Science中检索到的中英文文献进行初步的分析。所有文献出版年份的分布如图 1所示。从图 1中可以看出, 基于遗传算法的土地利用优化研究英文文献的年发文数量整体呈上升趋势, 部分年份存在波动。根据每年发文数量的变化, 可以将基于遗传算法的土地利用优化研究分为三个阶段。第一阶段为1999—2006年, 基于遗传算法的土地利用优化研究刚刚起步, 每年的发文量均在10篇以下。在这一时期, 计算机技术不够发达, 难以支撑大数据量问题的处理, 受技术条件的限制, 发展比较缓慢。第二阶段为2007—2015年, 由于计算机技术的快速发展, 计算能力大大提高, 这推动了优化算法在实际问题中的应用, 特别是土地利用优化这种复杂且数据量大的问题。在这一阶段, 年发文量相比之前有所提高, 增长趋势明显。第三阶段为2016至今, 在这段时间, 出现了新一轮的人工智能热潮, 遗传算法作为典型的智能优化算法, 关注度得到进一步提高, 整体发展稳定在一个比较高的水平。此外, 国内外对于生态文明的保护和发展也进入了新阶段。2015年, 联合国提出17个可持续发展指标(SDGs);2017年, 我国提出了高质量发展的新概念。在这样的双重背景下, 基于遗传算法的土地利用优化研究得到了比较大的关注。中文文献于2003年首次出现相关研究, 在上述三个时间阶段发文量基本持平, 没有特别大的波动。2020年是历年发文量的最高峰。

图 1 1999—2022年文献出版年分布 Fig. 1 The time distribution of literature publications from 1999 to 2022 图选项

英文文献的主要来源国家如图 2所示。发文量最多的是中国(包括港澳台地区), 总计发文191篇, 占总量的42.35%, 其次是美国、伊朗、加拿大、德国、新加坡、荷兰、英国、希腊、瑞士等。这些国家都分布于北美、欧洲、东亚等经济比较发达的地区, 且他们本身的经济实力也都比较强。

图 2 发文量居前10位的国家 Fig. 2 Top 10 countries of published documents 图选项

英文论文的主要学科类别和主要载文期刊如图 3和表 1所示。从学科类别来看, 基于遗传算法的土地利用优化研究主要集中在环境科学、地理学和城市规划等。从发表的期刊来看, 排名较高的期刊有《Computers Environment and Urban Systems》, 《International Journal of Geographical Information Science》, 《Journal of Urban Planning and Development》, 这些期刊也是以环境科学、地理学和城市规划为主。这说明目前基于遗传算法的土地利用优化研究属于环境科学和地理学、规划学的交叉领域。

图 3 载文量前10位的学科类别 Fig. 3 Top 10 categories of published English documents 图选项 表 1 载文量4篇(含)以上的期刊 Table 1 Journals with 4 or more English documents 期刊Journal 载文量Number of documents Computers Environment and Urban Systems 11 International Journal of Geographical Information Science 8 Sustainability 7 Journal of Urban Planning and Development 6 Journal of Environmental Management 5 Applied Energy 4 Environmental Modelling & Software 4 ISPRS International Journal of Geo-Information 4 表选项

中文论文的主要学科类别和主要载文期刊如图 4和表 2所示。从学科类别来看, 基于遗传算法的土地利用优化研究主要集中在农学。载文量最多的期刊《农业工程学报》也属于农学方向。这说明目前中文论文基于遗传算法的土地利用优化研究侧重农学。

图 4 中文文献学科类别 Fig. 4 Categories of published Chinese documents 图选项 表 2 载文量前3位的中文期刊 Table 2 Top 10 Journals of published Chinese documents 期刊Journal 载文量Number of documents 农业工程学报 5 地理与地理信息科学 2 武汉大学学报信息科学版 2 表选项 2.2 发文作者与研究机构分析

利用CiteSpace分别对中英文文献作者与研究机构进行共现分析。如果两个作者为一篇文献的共同作者, 则这两个作者具有共现关系, 研究机构的共现关系同理。首先分析作者共现关系。以一年为一个时间切片, 提取1999—2022年发文量最多的前50位作者, 构建基于遗传算法的土地利用优化研究作者合作网络(即用每年出现次数最多的前50位作者构建该时间切片的作者共现网络, 然后合并各个网络。(图 5)。每个节点代表一个作者, 节点间的连线代表他们的共现关系, 连线颜色表明共现关系首次出现的时间, 冷色早于暖色, 如蓝色早于绿色, 绿色早于红色, 以此类推。从图 5中来看, 作者间的合作网络整体分散、局部紧密, 以十人以内的中小型网络为主。仅有以Bo Huang、Kai Cao、Wenting Zhang为核心的合作网络以及以Cristina H. Amon和David A. Romero为核心的合作网络规模较大, 合作人数多余十人外, 其余合作网络均规模较小。这说明目前基于遗传算法的土地利用优化研究通常基于中小型的合作研究展开, 大规模的合作交流较少。

图 5 作者合作网络 Fig. 5 Author cooperation network 图选项

对检索到的每个作者的发文量进行统计, 发文量多于5篇的作者及各自发文数量如表 3所示。从表中可以看出, 基于遗传算法的土地利用优化研究作者呈现明显的头部效应。以Bo Huang、Kai Cao、Wenting Zhang为核心的合作网络不仅规模大, 且三位作者的发文量居所有作者的前三位, 在基于遗传算法的土地利用优化研究中处于领先地位。表 3中所有作者的发文量总和占总发文量的30%, 说明目前基于遗传算法的土地利用优化研究是靠几位核心作者带动的。

表 3 发文量多于5篇的作者 Table 3 Authors having published more than 5 articles 作者Author 单位Affiliation 发文量Number of documents 作者Author 单位Affiliation 发文量Number of documents Bo Huang 香港中文大学 13 Cristina H. Amon 多伦多大学 5 Kai Cao 香港中文大学 10 Xia Li 华东师范大学 5 Zhang Wenting 华中农业大学 7 David A. Romero 多伦多大学 5 表选项

在CiteSpace中进一步分析研究机构间的合作情况。以一年为一个时间切片, 提取1999—2022年发文量最多的前30个研究机构, 得到基于遗传算法的土地利用优化研究机构合作网络图谱(图 6)。每个节点为一个研究机构, 节点越大说明该机构发文量越多, 节点间的连线代表机构间的合作关系。从图 6中可以看出, 研究机构间主要形成了三个合作集团。第一个集团是香港中文大学-中国科学院-武汉大学-新加坡国立大学合作集团。这三个研究机构均位于东亚和东南亚, 组成亚洲合作网络。在这个网络中位于中国的三个研究机构武汉大学、香港中文大学、中国科学院发文量最大, 处于核心地位。第二个集团是以德黑兰大学为核心的中东合作集团, 规模较亚洲合作集团较小。第三个合作集团是以多伦多大学为核心的北美研究集团, 是三大集团中规模最小的。这三个集团内部合作紧密, 集团之间也有一些合作。除了这三个大规模的集团外, 还有一些由五个左右的研究机构组成的小型合作网络。通过上述分析可以发现, 三大合作集团的主要成员均来自发文量前10名的国家, 这也进一步表明了东亚、中东和北美在基于遗传算法的土地利用优化研究领域的重要地位。

图 6 研究机构合作网络 Fig. 6 Institute cooperation network 图选项 2.3 关键词分析

利用CiteSpace对文献的关键词进行共现分析, 如果两个词语是同一篇文献的关键词, 则这两个关键词有共现关系。以一年为一个时间切片, 提取1999—2022年出现频次在前30位的关键词, 裁剪方法选择最小生成树法, 生成基于遗传算法的土地利用优化关键词共现图谱(图 7)。每个节点为一个关键词, 连线代表关键词间的共现关系, 连线颜色表明共现关系首次出现的时间, 冷色早于暖色, 如蓝色早于绿色, 绿色早于红色, 以此类推。从图谱中可以看到, 检索词“genetic algorithm”、“land use”、“optimization”中最大的节点是“genetic algorithm”, 这说明基于遗传算法的土地利用优化, 研究的核心在于遗传算法。与“genetic algorithm”共现次数较多的节点有“model”、““system”以及“gi”。这反映出绿色基础设施是基于遗传算法的土地利用优化的重要研究对象。“multi-objective optimization”也是一个比较大的节点(还有与之接近的“multiobjective optimization”)[21—24], 说明在基于遗传算法进行土地利用优化时, 往往将实际问题建模为多目标优化问题。此外在“model”和附近, 出现了一些比较大的节点, 包括“particle swarm optimization”、“spatial optimization”、“cellular automata”等等[25—27], 这说明在进行土地利用权衡时, 遗传算法与其他优化模型、算法(主要是粒子群和元胞自动机)的结合和比较是当前研究中的重要内容。

图 7 关键词共现图谱 Fig. 7 Keyword coexistence network 图选项 2.4 引文分析

在CiteSpace中进行文献共被引分析。如果两篇文献同时被第三篇文献引用, 则这两篇文献构成共被引关系。通过分析施引文献, 可以了解研究领域的前沿方向, 而分析被引文献, 则可以得到研究领域的知识基础。以一年为一个时间切片, 提取1999—2020年被引频次在前30位的被引文献, 并对共被引图谱进行聚类分析, 保留属于最大连通子网络的聚类, 生成基于遗传算法的土地利用优化文献共被引图谱(图 8)。每个节点为一篇文献, 节点越大, 表示文献被引量越高, 节点间的连线代表他们的共被引关系。聚类分析将共被引图谱分成几个聚类, 同一聚类内的参考文献联系紧密, 不同聚类间的参考文献联系松散[20]。聚类区块的不同颜色表明这些区块中共被引关系首次出现的时间, 同样也是冷色区块早于暖色区块[20]。聚类标签反映了施引文献的主题, 如青色区块的标签为“#3 wind farm layout”, 说明有关风场布局的文献引用了聚类#3[28]。标签序号越小, 聚类包含的文献数量越多。通过对聚类标签的分析, 可将其分为两类。第一类聚类标签包括“wind energy”、“nature conservation”、“lid planning”、“biodiversity”、“transportation and land use”、“planning support systems”。这六个标签均反映了不同的研究方向, 说明基于遗传算法的土地利用优化研究的主要研究内容包括风力能源规划、自然环境保护、海绵城市规划、生物多样性、交通规划、规划支持系统构建。第二类包括“comola”、“spatially explicit optimization model”、“anfis”、“evolutionary algorithm”。这一类主要反映基于遗传算法的土地利用优化研究的模型和算法。在模型方面, 带约束的多目标优化模型(comola)和加入明确空间信息的模型是该领域的常用模型。在算法方面, 自适应神经模糊系统(anfis)在该领域有重要应用;同时, 作为进化算法的一种, 遗传算法的发展带动了整个进化算法在土地利用优化方面的应用。通过对区块颜色的分析, 可以看出聚类#5、#7、#8首次出现共被引的时间比较晚, 说明这些海绵城市规划、生物多样性以及交通规划的论文近年来比较受关注。在未来一段时间内, 这些方向是基于遗传算法的土地利用优化领域的重要研究内容。

图 8 文献共被引网络 Fig. 8 Co-citation reference network 图选项 3 结论与展望

本文以1999—2022年Web of Science数据库的Web of ScienceTM核心合集中关于基于遗传算法的土地利用优化的164篇文献和中国科学引文数据库中的27篇文献为研究对象, 借助Excel和CiteSpace软件, 进行文献计量研究。从文献的出版时间、来源国、学科类别、载文期刊、作者和研究机构合作网络、关键词共现网络以文献共被引网络等方面进行了分析, 得到了基于遗传算法的土地利用优化研究的总体情况及作者合作情况, 分析得出了研究热点及知识基础。从本研究中可以得出以下结论:

(1) 从每年文献发表的数量来看, 基于遗传算法的土地利用优化研究整体呈上升趋势。整个发展可分为1999—2006年, 2007—2015年, 2016年至今3个阶段, 不同阶段间英文文献发文量增长明显, 中文论文比较稳定。

(2) 从文献的来源国家来看, 中国(包括港澳台地区)、美国、伊朗发文量居世界前三位, 发文量前10名国家都位于经济比较发达的地区。

(3) 从学科类别和载文期刊可以发现, 基于遗传算法的土地利用优化研究属于环境科学和地理学、规划学的交叉领域。

(4) 从主要发文作者来看, 目前的研究以十位作者以内的中小范围合作为主, 仅有两个规模较大的合作网络。其中以Bo Huang等为核心的合作网络处于行业领先地位。从研究机构来看, 形成了东亚、中东和北美三大研究集团, 且三大研究集团之间互有合作, 形成了一个巨大的合作网络。

(5) 从关键词共现网络可以总结出目前基于遗传算法的土地利用优化一个重要的研究对象是绿色基础设施, 常用的建模方法是多目标优化模型, 与粒子群算法等的对比和结合是一个常见的研究方向。

(6) 从文献共被引网络可以总结基于遗传算法土地利用优化研究, 主要关注的问题有风力能源规划、自然环境保护、海绵城市规划、生物多样性、交通规划、规划支持系统构建, 研究模型包括带约束的多目标优化模型、空间优化模型, 应用算法包括自适应神经模糊系统和进化算法。

从上述结论可以看出, 基于遗传算法的土地利用优化的研究范围正在扩展, 研究对象不局限于土地利用, 研究方法也从遗传算法扩展到了多种方法的结合。为了进一步推动基于遗传算法的土地利用优化研究的发展, 未来可以关注以下两个方面:

(1) 推动面向土地利用的遗传算法的改进工作。算法原理是土地利用优化实例研究的知识基础, 而算法在原理上的改进才是真正意义上的提高。只有算法具有足够的有效性, 在进行区域土地利用优化时才能得到可靠的结果, 这样研究才有实践意义。

(2) 促进遗传算法与其它模型、算法的结合。随着计算性能的提高, 一些过去难以实现的模型现在都开始广为使用, 如各种机器学习类的算法。探索遗传算法与其它算法的结合, 可以取各家之长, 快速提高优化的效果。同时, 也能为遗传算法的原理改进提供灵感, 为基于遗传算法的土地利用优化注入新的活力。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有