董骞

董骞

我目前在清华大学 计算机科学与技术系 信息检索实验室(THUIR)攻读博士学位,预计2026年6月毕业。 很荣幸在马少平教授、 刘奕群教授和 艾清遥教授的指导下进行学术研究。

我的研究兴趣是 algo & infra co-designed model architectures for scalable parameters, context, and especially intelligence

               XHS

"Do not go gentle into that good night."

— Dylan Thomas

最新动态

2026.02🚀 GLM-5 Technical Report发布!我是模型架构核心贡献者之一。
2025.12🚀 GLM-4.7 发布!查看我们的博客了解更多详情。
2025.11📄 SelfRACG 被 EMNLP 2025 接收 — 在单一模型架构中让LLM自主表达检索查询以实现更好的代码生成。
2025.09🚀 GLM-4.6 发布!查看我们的博客了解更多详情。
2025.08🚀 GLM-4.5 Technical Report发布!我是 post-training 阶段探索稀疏注意力适配的贡献者之一。
2025.07📄 Qilin 被 SIGIR 2025 接收 — 一个捕获真实APP级用户会话的多模态信息检索数据集。
2025.04📄 DecoupledRAG 被 WWW 2025 接收 — 通过交叉注意力解耦上下文和知识的高效RAG框架。
2024.07📄 RLCF 被 SIGIR 2024 接收 — 通过无监督对比反馈对齐IR领域的LLM。
2023.10📄 I³Retriever 被 CIKM 2023 接收 — 通过生成模块将隐式查询-文档交互融入检索器。
2023.07📄 T²Ranking 被 SIGIR 2023 接收 — 大规模中文段落排序基准。
2022.07📄 KERM 被 SIGIR 2022 接收 — 将显式知识融入预训练语言模型用于段落重排序。
2022.02📄 DGRe 发表于 Data Science and Engineering — 用于BERT即席文档排序的解耦因果干预。
2021.07📄 R-FORMER 被 SIGIR 2021 接收 — 为纠缠多任务法律判决预测建模全局一致性图。
2021.04📄 LGRe 被 DASFAA 2021 接收 — 通过潜在图循环网络优化基于BERT的文档排序。

代表性论文

完整论文列表 (Google Scholar)

主要作者论文

  • SelfRACG: Enabling LLMs to Self-Express and Retrieve for Code Generation
    EMNLP 2025
    TH-ACCF-B
  • Qilin: A Multimodal Information Retrieval Dataset with APP-level User Sessions
    SIGIR 2025
    TH-ACCF-A
  • DecoupledRAG: An Efficient and Effective RAG Framework via Cross Attention
    WWW 2025
    TH-ACCF-A
  • Unsupervised LLM Alignment for IR via Contrastive Feedback
    SIGIR 2024
    TH-ACCF-A
  • T²Ranking: A Large-scale Chinese Benchmark for Passage Ranking
    SIGIR 2023
    TH-ACCF-A
  • I³Retriever: Incorporating Implicit Interaction in PLMs for Passage Retrieval
    CIKM 2023
    TH-BCCF-B
  • Incorporating Explicit Knowledge in PLMs for Passage Re-ranking
    SIGIR 2022
    TH-ACCF-A
  • Legal Judgment Prediction via Relational Learning
    SIGIR 2021
    TH-ACCF-A

合作论文

  • CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-Judges
    ACL 2025
    CCF-A
  • DELTA: Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment
    AAAI 2025
    CCF-A
  • BLADE: Enhancing Black-box LLMs with Small Domain-Specific Models
    AAAI 2025
    CCF-A
  • SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval
    SIGIR 2023
    CCF-A

教育背景

2022 –博士研究生清华大学计算机科学与技术系
2019 – 2022工程硕士中国科学院软件研究所
2015 – 2019工程学士华南理工大学软件学院

荣誉奖项

2021国家奖学金(Top 1%

关于我

我是一个精酿啤酒爱好者,从清爽的小麦啤到浓郁的 IPA,从比利时白啤到赛松,我热衷于品味来自世界各地的精酿佳作 🍻