用大语言模型控制交通信号灯，有效缓解拥堵！

国际科技财经移民娱乐民生时事体育

Bendi新闻

科技

信息技术

10月前

夕小瑶科技说原创
作者 | 松果

引言：城市交通拥堵的挑战与智能交通信号控制的进展

城市交通拥堵是一个全球性的问题，在众多缓解交通拥堵的策略中，提高路口交通信号控制的效率至关重要。传统的基于规则的交通信号控制（TSC）方法，由于其静态的、基于规则的算法，无法完全适应城市交通不断变化的模式。

随着传感器技术和数据收集的发展，更加自适应的TSC策略得以发展。它们可能过度拟合特定的交通模式，并且通常依赖于可能无法捕捉到罕见但关键事件的奖励函数，如紧急车辆的突然到来或意外的道路阻塞，这降低了它们在现实世界条件下的实用性。

本文介绍了一种新颖的方法，将大语言模型（LLMs）整合到TSC框架中，以协助决策过程，命名为LLM-Assist Light（LA-Light）。利用LLMs广泛的知识和“常识”推理能力，以增强在复杂和不常见交通情况下的决策制定。此外还引入了一套专门设计的工具，以弥合TSC系统和LLM之间的差距。这些工具作为中介，收集环境数据并与LLM通信，然后指导TSC系统。

实验表明，所提出的LA-Light系统在典型场景以及涉及罕见事件的情况下均取得了良好的性能。实验突出了LLM辅助系统深入理解交通场景的能力，并为其行动提供了清晰的解释。LA-Light被证明做出了增强安全性、效率和舒适性的明智决策，超越了在具有挑战性条件下可能失败或产生次优结果的现有方法。

论文标题：LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments

论文链接：https://arxiv.org/pdf/2403.08337.pdf

概述传统交通信号控制方法的局限性

尽管传统的TSC方法，如Webster方法和自组织交通信号控制（SOTL），在缓解拥堵方面取得了一些成就，但它们在实时交通数据利用和适应快速变化的交通状况方面存在局限性。此外，这些方法在复杂交通场景中往往表现不佳。例如：

Webster方法计算交叉口的理想周期长度和交通信号相位的分配，这基于交通量和假设在特定时期内交通流量稳定。
SOTL方案使用一组预定的规则来决定是继续当前的交通信号相位还是改变它。自适应TSC系统如SCOOT和SCATS通过选择一系列预定义的计划来动态改变周期长度、相位划分和偏移，以响应实时交通传感器数据。

然而，这些方法在实时数据利用和适应快速变化的交通状况方面存在局限性。

引入大语言模型（LLM）在交通信号控制中的应用

近年来，传感器技术和数据收集的进步导致了更多自适应TSC策略的发展。尤其是强化学习（RL） 作为一种吸引人的方法出现了，它利用实时数据动态调整交通信号。

然而，基于RL的TSC系统并非没有局限性。这些系统可能会过度拟合特定的交通模式，并且RL系统通常依赖于可能无法捕捉到罕见但关键事件的奖励函数，例如紧急车辆的突然到来或意外的道路阻塞。这可能会降低它们在现实世界条件下的实用性。

本文提出了一种新颖的方法，将大语言模型（LLM）集成到TSC框架中，以协助决策过程，命名为LLM-Assist Light（LA-Light）。利用LLM广泛的知识和“常识”推理能力，以增强复杂和不常见交通情况下的决策。

此外还引入了一套专门设计的工具，以弥合TSC系统和LLM之间的差距。这些工具作为中介，收集环境数据并与LLM通信，然后指导TSC系统。这种协作过程允许一个全面的控制策略，不仅做出了明智的决策，还为这些决策提供了理由，从而提高了系统的透明度并建立了与交通管理运营商的信任。

为了证实所提出框架的有效性，开发了一个仿真平台，并在该平台上进行了广泛的实验，考虑了各种交叉口配置。结果表明，所提出的LA-Light系统在典型场景以及涉及罕见事件的情况下都取得了良好的性能。

此外还提供了几个定性示例，其中LA-Light准确分析了复杂的交通条件，并做出了比传统TSC方法更合理的决策。实验突出了LLM辅助系统深入理解交通场景的能力，并为其行动提供了清晰的解释。LA-Light做出了提高安全性、效率和舒适性的明智决策，在具有挑战性条件下，优于可能失败或产生次优结果的现有方法。

LA-Light框架介绍

1. 框架的核心理念与设计

LA-Light框架旨在通过整合大语言模型（LLM）的人类模仿推理能力，提升交通信号控制（TSC）算法对复杂交通场景的理解和响应能力。这一创新使得信号控制算法能够以类似人类认知的细腻判断来适应城市交通挑战，特别是在处理传统系统可能忽视的不可预测和罕见事件方面。

LA-Light框架通过一个闭环的交通信号控制系统，将LLM与一整套互操作的工具集成在一起，实现了对一致和变化交通模式的深入洞察，从而装备了系统以实时分析和决策的能力，这些决策反映了人类智能。

2. LLM在框架中的角色与功能

在LA-Light框架中，LLM扮演着决策辅助的角色。LLM利用其先进的自然语言处理能力，解释复杂的交通场景，并推荐可能被基于规则或基于强化学习（RL）的系统忽视的行动。

LLM首先从增强的工具集中选择最相关的感知工具和决策算法来收集和分析交通数据，然后评估这些信息，并根据需要调整其工具选择，直到形成最终的交通控制决策。

3. 框架的决策工具集

LA-Light框架包含了一套工具集，这些工具作为LLM与交通环境互动的中介。工具集分为两大类：感知工具和决策工具。

感知工具负责收集静态和动态的交通信息；
决策工具则支持和评估决策过程。

这些工具的设计是模块化和可扩展的，确保了新功能的容易集成，以应对各种交通管理挑战。

实验设置：模拟平台与数据集描述

实验使用了Simulation of Urban MObility (SUMO)平台进行，这是一个广泛认可的开源交通模拟器。为了准确捕捉交叉口的交通动态，研究者在模拟中使用了虚拟车道区域探测器来收集每个车道的车辆计数和排队长度等数据。

在配置交通信号时遵循了常见的城市信号序列：绿灯阶段，接着是3秒的黄灯，然后是红灯阶段。将参数设置为与现实城市交通流相匹配，最高速度限制为13.9米/秒（即50公里/小时），车辆之间的最小距离保持在2.5米，符合城市环境中安全驾驶距离。

本次实验使用了合成和真实世界的数据集来评估LA-Light在交通信号控制中的性能。

合成数据集包括不同布局的孤立交叉口场景：一个三路交叉口和一个四路交叉口，每个方向都有三条车道。
对于真实世界数据，研究者关注上海市松江区辰塔路周围的城市道路网络，该地区因高密度建设和商业活动而交通拥堵。

为了收集交通流量数据，研究者们分析了这些交叉口在2021年7月30日的视频监控数据，并将每分钟的车辆数量记录下来，然后在SUMO平台中重现交通场景。

为了全面评估LA-Light在复杂城市交通情况下的性能，研究者为每个道路网络设计了三个特定的测试场景。这些场景包括紧急车辆（EMV）场景、道路封锁事件（RBI）场景和传感器故障（SO）场景。这些场景的设计旨在测试系统在应对紧急情况和意外事件时的响应能力。

实验结果与分析

1. LA-Light在典型场景中的表现

在典型的交通场景中，LA-Light系统表现出色。通过模拟平台进行的广泛实验表明，LA-Light在处理常规情况以及涉及罕见事件的情况下均能取得良好性能。例如在四路交叉口（4-Way INT）的紧急车辆（EMV）场景下，与Maxpressure方法相比，LA-Light在平均旅行时间（ATT）上实现了32.1%的降低，而在上海网络中实现了10.8%的降低。

在紧急车辆效率方面，即平均紧急旅行时间（AETT），LA-Light相较于Maxpressure在上海网络中的改善更为显著，减少了15.3%。

2. LA-Light在应对紧急情况下的效能

在紧急情况下，LA-Light的性能同样出色。

在模拟的紧急车辆（EMV）场景中，LA-Light能够有效地优先处理紧急车辆，显著改善了紧急响应车辆的指标，如AETT和平均紧急等待时间（AEWT）。
在上海网络的四路交叉口中，与UniTSA相比，LA-Light在AETT上表现出35.6%的改善，在AEWT上表现出74.5%的改善。这一结果突显了LA-Light在紧急情况下的强大适应性和有效性。

3. 与传统方法和RL方法的对比

与传统的交通信号控制（TSC）方法和基于强化学习（RL）的方法相比，LA-Light在多个方面表现出了优越性。

相对于传统的Webster方法和SOTL方法，LA-Light在ATT和AWT上均实现了降低。与RL方法如IntelliLight、PressLight和UniTSA相比，LA-Light在紧急车辆效率上表现更佳，尽管在ATT和AWT上并非总是领先。
与直接使用LLM进行决策的Vanilla-LLM方法相比，LA-Light在所有测试网络中的ATT和AWT上均显示出显著改善。
在复杂的上海网络中，与Vanilla-LLM相比，LA-Light在ATT和AWT上分别减少了16.5%和24.2%。

讨论：LA-Light决策过程的透明度与解释能力

LA-Light框架通过整合大语言模型（LLM）的认知能力和传统的交通管理方法，提出了一种创新的混合决策过程。该框架通过一系列有条理的步骤进行决策，从指定LLM的角色开始，到选择最合适的工具，再到激活所选工具以收集交通数据，然后由LLM评估数据并确定下一步行动，最后形成交通信号定时建议并实施。

在决策过程中，LLM不仅能够根据实时数据做出信息化的决策，还能提供其决策背后的理由，从而提高系统的透明度并建立交通管理操作员的信任。

例如，在SO场景下，LA-Light通过分析交通环境的静态和动态方面，识别出传感器故障并采取补救措施，同时提供决策的逻辑解释。这种决策透明度对于交通操作员至关重要，因为它增强了系统操作的可靠性和信任度。

总体而言，LA-Light框架不仅在操作性能上表现出色，而且在决策清晰度上也有所体现，这得益于LLM的解释能力。LA-Light能够识别并利用给定交通情况下最合适的工具，为其决策过程提供清晰的洞察力。尽管LA-Light框架是一个重要的进步，但它在与LLM进行频繁交互以进行决策的依赖性上存在需要进一步完善的地方。

结论与未来研究方向

1. LA-Light的贡献与优势

LA-Light框架通过整合大语言模型（LLMs）到交通信号控制（TSC）系统中，提供了一种创新的混合决策制定过程。该框架利用LLMs的认知能力与传统交通管理方法相结合，以适应城市交通的不断变化和复杂性。

通过在三个不同的交通网络和九个独特场景中的全面评估，LA-Light在不需要额外训练的情况下展现了其有效性。与传统方法相比，LA-Light在平均旅行时间（ATT）和平均等待时间（AWT）方面均实现了降低，同时在紧急响应车辆的指标上，如平均紧急旅行时间（AETT）和平均紧急等待时间（AEWT），也显示出改进。

2. 框架的潜在改进空间

尽管LA-Light框架标志着向前迈出了重要的一步，但它仍有需要进一步完善的领域。当前框架依赖于与LLM频繁交互以进行决策，这可能会引入延迟，影响交通信号调整的及时性。此外，框架依赖于文本描述来描绘交通场景，可能无法包含最有效决策所需的所有细节。

这指向了采用更直接的基于图像的方法的潜在好处，该方法可以从视觉数据中解释交通状况。未来的工作将致力于通过改进交互过程以加快响应时间，并通过整合能够直接处理视觉信息的基于视觉的模型来解决这些问题。这些增强预计将提高框架在处理现实世界交通系统的复杂性时的熟练度，提高速度并减少对文本描述的依赖。

3. 对未来智能交通管理系统的展望

LA-Light框架在不同场景下的性能比较分析突显了其在环境不确定性中的可靠效果。特别是在上海网络中，从EMV到SO场景的转变导致ATT和AWT的轻微增加，显示了LA-Light的值得称赞的稳定性。这种性能显著优于基于RL的方法，如UniTSA，在相同条件下表现出显著的性能下降。

此外，LA-Light在所有三个场景中的紧急响应指标，特别是AETT和AEWT，始终是所有基准测试中最好的。这种一致性证实了LA-Light框架的韧性，该框架利用LLMs确保即使在不太常见的情况下也能保持最小的性能下降。这些结果强调了LA-Light在多样化和复杂的城市环境中提供可靠交通信号控制的能力。

未来的智能交通管理系统将需要在实时数据处理、决策制定和自适应性方面进行进一步的创新。随着传感器技术和数据分析能力的进步，以及人工智能和机器学习算法的发展，我们预期未来的系统将能够更加精确地预测交通流量变化，并实时调整以优化交通流。

此外，系统将需要更好地处理紧急情况和罕见事件，确保所有道路使用者的安全和效率。通过整合更多的环境感知能力和先进的推理算法，未来的系统将能够提供更加个性化和智能化的交通管理解决方案。