Learning

学习资料

如果你刚进入实验室,可以先从分类学习资料开始;如果已经确定研究方向,可以直接进入 A、B、C 三个方向的阅读入口。

当前数据源:google-sheet

Reading Guide

How to Read a Paper

Author: S. Keshav

如果你刚开始进入科研阅读,推荐先读这篇经典短文。它提出了常用的“三遍读论文法”,可以帮助你先快速判断一篇论文值不值得深入读,再逐步理解方法、实验和可复现细节。

Google Sheet Sync

通过 Google Sheet 修改并同步

如需维护学习资料,可通过共享 Google Sheet 同步整理方向入口和分类条目。当前页面优先读取 Google Sheet;如共享表暂时不可用,会自动回退到仓库内备份数据。

说明:修改后不会立即同步,当前通过 GitHub Actions 按 15 分钟定时构建与同步更新。

  • direction_entries:三大研究方向的论文与代码仓库
  • learning_resources:分类学习资料条目
Direction Entry

方向学习入口

建议按“先看综述,再看主线,再看专题,最后做代码复现”的顺序学习。你可以先用综述建立整体认识,再通过主线论文把握核心问题与系统方法,接着根据兴趣进入专题阅读,最后结合共享 Google Sheet 中当前维护的代码仓库条目做实现与复现。

方向 A

多智能体协同感知

协同感知多模态UAV视觉语言导航

代表性论文 / 综述

  1. Collaborative Perception in Autonomous Driving: Methods, Datasets, and Challenges [链接] · 入门时建议先看一篇基础综述,再看几篇经典论文(如序号2-7),之后再看新论文
  2. Where2comm: Communication-Efficient Collaborative Perception via Spatial Confidence Maps [链接] · 经典论文(通信高效)
  3. OPV2V: An Open Benchmark Dataset and Fusion Pipeline for Perception with Vehicle-to-Vehicle Communication [链接] · 经典论文(数据集)
  4. An Extensible Framework for Open Heterogeneous Collaborative Perception [链接] · 经典论文(异构协同)
  5. Communication-Efficient Collaborative Perception via Information Filling with Codebook [链接] · 经典论文(通信高效)
  6. Robust Real-time Multi-vehicle Collaboration on Asynchronous Sensors [链接] · 经典论文(MobiCom)
  7. Leveraging Large Vision Model for Multi-UAV Co-perception in Low-Altitude Wireless Networks [链接] · 前沿引导
  8. Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models [链接] · 综述
  9. TRAVEL: Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology [链接] · 系统主线
  10. STAMP: Scalable Task And Model-agnostic Collaborative Perception [链接] · 系统主线
  11. CoSDH: Communication-Efficient Collaborative Perception via Supply-Demand Awareness and Intermediate-Late Hybridization [链接] · 系统主线
  12. ViSA-Enhanced Aerial VLN: A Visual-Spatial Reasoning Enhanced Framework for Aerial Vision-Language Navigation [链接] · 专题
  13. mmCooper: A Multi-agent Multi-stage Communication-efficient and Collaboration-robust Cooperative Perception Framework [链接] · 专题
  14. SiMO: Single-Modality-Operable Multimodal Collaborative Perception [链接] · 专题

代码仓库

  • OPENCOOD · 推荐,协同感知最流行的开源代码库
  • CoAlign · 推荐,相较于OPENCOOD支持更多的数据集
  • HEAL · 异构设置下的协同感知代码库
  • OpenUAV · 适合上手 UAV-VLN 场景下的平台搭建、任务理解与基准复现
  • STAMP Official Implementation · 适合上手协同感知主线方法与系统复现
  • CoSDH · 适合实践低通信开销条件下的协同感知复现
方向 B

边缘大模型推理与部署

边缘部署推理引擎量化加速大小模型协同

代表性论文 / 综述

  1. A Survey on Inference Engines for Large Language Models: Perspectives on Optimization and Efficiency [链接] · 综述
  2. Mobile Edge Intelligence for Large Language Models: A Contemporary Survey [链接] · 综述
  3. Jupiter: Fast and Resource-Efficient Collaborative Inference of Generative LLMs on Edge Devices [链接] · 系统主线
  4. EdgeShard: Efficient LLM Inference via Self-Adaptive Model Sharding [链接] · 系统主线
  5. Large-Small Model Collaboration in Mobile Edge Networks With Heterogeneous Computational Resources [链接] · 系统主线
  6. SpecPipe: Accelerating Pipeline Parallelism-based LLM Inference with Speculative Decoding [链接] · 专题
  7. Dynamic Model Routing and Cascading for Efficient LLM Inference: A Survey [链接] · 专题
  8. Compact LLM Deployment and World Model Assisted Offloading in Mobile Edge Computing [链接] · 专题

代码仓库

  • llama.cpp · 适合新手入门本地量化部署与边缘端推理
  • MLC-LLM · 适合上手移动端与边缘设备上的大模型部署
  • SGLang · 适合实践推理引擎、投机解码与服务化部署
方向 C

边缘多智能体系统

多智能体Agent记忆机制强化学习

代表性论文 / 综述

  1. Large language model based multi-agents: a survey of progress and challenges [链接] · 综述
  2. The Landscape of Agentic Reinforcement Learning for LLMs: A Survey [链接] · 综述
  3. G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems [链接] · 系统主线
  4. AgentRL: Scaling Multi-turn and Reasoning Capabilities of Language Agents via Reinforcement Learning [链接] · 系统主线
  5. MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games [链接] · 系统主线
  6. Teams of LLM Agents can Exploit Zero-Day Vulnerabilities [链接] · 专题
  7. Multimodal Large Language Models-Enabled UAV Swarm: Towards Efficient and Intelligent Autonomous Aerial Systems [链接] · 专题
  8. FlowPIE: Test-Time Scientific Idea Evolution with Flow-Guided Literature Exploration [链接] · 专题

代码仓库

  • LangChain · 适合先熟悉 Agent、工具调用与工作流基础能力
  • LangGraph · 适合进一步实践有状态多 Agent 编排与流程控制
  • GMemory · 适合上手多智能体记忆机制与层次化状态管理的实现
  • AgentRL · 适合实践语言智能体的多轮决策与强化学习训练
Learning Package

分类学习资料

如果你还没有确定具体研究方向,建议先从经验、课程和书籍开始,再根据需要进入科研工具、编程开发和开源工具部分。

课程

书籍

科研工具

编程开发

开源工具