铁甲工程机械网> 工程机械资讯> 行业 > 恒隆研究| 龙瀛研究团队——大语言模型在城市研究中的应用进展:系统性综述

恒隆研究| 龙瀛研究团队——大语言模型在城市研究中的应用进展:系统性综述

语音播报
点击播放

【作者】

夏俊豪、佟瑶、龙瀛

清华大学恒隆房地产研究中心

【原文信息】

Xia, J., Tong, Y., & Long, Y. (2025). Advancements in the application of large language models in urban studies: A systematic review. Cities, 165, 106142.

【论文链接】

https://www.sciencedirect.com/science/article/pii/S0264275125004433

内容导读

龙瀛教授团队的研究论文“Advancements in the application of large language models in urban studies: A systematic review”(《大语言模型在城市研究中的应用进展:系统性综述》),在SCI期刊Cities在线发表。Cities目前为JCR Q1期刊。

大语言模型(LLM)在解决复杂问题上拥有强大的综合能力,并已越来越多地被应用于更好地阐释城市现象。在大语言模型浪潮中,城市研究领域的学者迫切需要了解以往的研究工作是如何在各个学科中融合大语言模型的。本文中,我们对233篇关注大语言模型在城市研究中应用的论文进行了系统性综述。我们借助一个定制的生成式预训练变换器(GPT)助手从这些论文中提取信息,以分析其发展趋势,并对不同子领域进行了深入评述。研究结果显示,相关研究在过去六年中呈指数级增长,大语言模型已被应用于文本分析与生成、领域知识问答以及行业相关任务等多种场景。此外,基于GPT和基于BERT(来自Transformers的双向编码器表示)的模型已成为最常用的两种模型,而嵌入(embedding)和微调(fine-tuning)是数据处理与模型适配的主流方法。论文还探讨了关于大语言模型的常见问题,并指出了其未来在城市研究中的机遇。本项综合性分析旨在为正在探索大语言模型在城市研究中应用的研究者,以及那些尚未开始在研究中使用这些模型的学者提供宝贵的见解。

图1:研究框架示意图

研究方法

1.文献筛选与数据来源:研究以Web of Science (WoS) 为文献来源数据库,并将检索时间范围限定为2015年1月至2025年4月。在关键词策略上,检索词由“城市研究”与“大型语言模型”相关的词构成,通过数据库检索和多轮人工筛选,结合引文追溯法补充文献,最终筛选出233篇符合条件的文献进行分析。

2.文献标记与统计方法:在文献信息提取与标注上,研究构建了包含研究领域、应用场景、数据处理方法、模型提升方法和所用预训练模型五个维度的分析框架,为高效处理筛选的233篇文献,研究利用GPT-4o构建定制化AI助手,根据预设框架对每篇文献进行结构化的信息提取,对AI助手提取的结果进行随机抽样与人工核验,准确率达89%,针对AI提取的全部文献结果人工修订并按照五个维度进行分析总结。

研究发现

1.描述性分析:研究发现,大语言模型在城市研究中的应用自2020年以来呈指数级增长,在研究领域上,早期研究以城市社会学、城市环境与能源等领域为主,逐步扩展至城市交通、城市管理和城市规划设计等更复杂的领域,其中城市交通方向的成果最为丰富。在应用场景上,除了情感分析、文本分类和命名实体识别等通用的文本处理任务外,还涌现出大量与领域深度结合的特定应用场景,例如人类移动分析、交通流预测、街道空间感知和地理编码等等,同时通过问答测试模型在特定领域中的能力也是较为常见的应用场景。在数据处理与模型提升方法上,研究者广泛采用嵌入构建来表征文本,以及利用多模态对齐来融合异构数据,超过半数的研究采用了成本相对高昂的微调策略来提升模型表现,同时大模型也常与其他模型集成使用。最后,在所用的预训练模型上,研究多用GPT系列的模型,BERT因其高效的文本编码能力也广受欢迎,此外还有例如LLaMA、Qwen等的开源模型。

2.研究者对大模型的态度:尽管大模型在城市文本分析、事件模拟、特定场景响应等任务上表现出强大的能力,但研究者仍在几个层面存在担忧,首先模型存在生成不实信息的“幻觉”问题,可能包含扭曲现实的地理或文化偏见,因依赖静态训练数据而难以泛化到动态多变的真实城市场景中,其次高昂的计算与环境成本对研究团队的经济负担与总体能源消耗提出挑战,然后是相比传统的深度学习方法,大模型在特定场景下的表现未必能够超过前者的表现,最后在伦理与逻辑层面,数据隐私泄露、决策过程不透明等也是需要解决的问题。

3.未来方向:大模型在城市研究中存在较大的应用潜力,首先应用领域将持续拓宽,例如延伸至城市经济学和城市发展演化等更宏观的议题,其次大模型应用可能出现分化,即由轻量化的模型处理简单场景,而参数庞大的模型则专注于解决复杂难题,然后是通过精心的提示工程设计或结合检索增强生成的技术,大语言模型作为“领域专家”的潜力有待进一步发掘,最后从智能体的角度看,大模型可以通过与海量城市知识库的交互来揭示隐藏的城市动态与规律,从而催生新的研究假说为研究者提供启发。

图2:不同研究领域文献发表年份和文献数量

图3:研究领域和应用场景关联



声明:本文系转载自互联网,请读者仅作参考,并自行核实相关内容。若对该稿件内容有任何疑问或质疑,请立即与铁甲网联系,本网将迅速给您回应并做处理,再次感谢您的阅读与关注。

相关文章
我要评论
表情
欢迎关注我们的公众微信