董骞
我目前在清华大学 计算机科学与技术系 信息检索实验室(THUIR)攻读博士学位,预计2026年6月毕业。 很荣幸在马少平教授、 刘奕群教授和 艾清遥教授的指导下进行学术研究。
我的研究兴趣是 algo & infra co-designed model architectures for scalable parameters, context, and especially intelligence。
"Do not go gentle into that good night."
— Dylan Thomas
最新动态
| 2026.02 | 🚀 GLM-5 Technical Report发布!我是模型架构核心贡献者之一。 |
| 2025.12 | 🚀 GLM-4.7 发布!查看我们的博客了解更多详情。 |
| 2025.11 | 📄 SelfRACG 被 EMNLP 2025 接收 — 在单一模型架构中让LLM自主表达检索查询以实现更好的代码生成。 |
| 2025.09 | 🚀 GLM-4.6 发布!查看我们的博客了解更多详情。 |
| 2025.08 | 🚀 GLM-4.5 Technical Report发布!我是 post-training 阶段探索稀疏注意力适配的贡献者之一。 |
| 2025.07 | 📄 Qilin 被 SIGIR 2025 接收 — 一个捕获真实APP级用户会话的多模态信息检索数据集。 |
| 2025.04 | 📄 DecoupledRAG 被 WWW 2025 接收 — 通过交叉注意力解耦上下文和知识的高效RAG框架。 |
| 2024.07 | 📄 RLCF 被 SIGIR 2024 接收 — 通过无监督对比反馈对齐IR领域的LLM。 |
| 2023.10 | 📄 I³Retriever 被 CIKM 2023 接收 — 通过生成模块将隐式查询-文档交互融入检索器。 |
| 2023.07 | 📄 T²Ranking 被 SIGIR 2023 接收 — 大规模中文段落排序基准。 |
| 2022.07 | 📄 KERM 被 SIGIR 2022 接收 — 将显式知识融入预训练语言模型用于段落重排序。 |
| 2022.02 | 📄 DGRe 发表于 Data Science and Engineering — 用于BERT即席文档排序的解耦因果干预。 |
| 2021.07 | 📄 R-FORMER 被 SIGIR 2021 接收 — 为纠缠多任务法律判决预测建模全局一致性图。 |
| 2021.04 | 📄 LGRe 被 DASFAA 2021 接收 — 通过潜在图循环网络优化基于BERT的文档排序。 |
代表性论文
完整论文列表 (Google Scholar)
主要作者论文
- SelfRACG: Enabling LLMs to Self-Express and Retrieve for Code GenerationEMNLP 2025
- Qilin: A Multimodal Information Retrieval Dataset with APP-level User SessionsSIGIR 2025
- DecoupledRAG: An Efficient and Effective RAG Framework via Cross AttentionWWW 2025
- Unsupervised LLM Alignment for IR via Contrastive FeedbackSIGIR 2024
- T²Ranking: A Large-scale Chinese Benchmark for Passage RankingSIGIR 2023
- I³Retriever: Incorporating Implicit Interaction in PLMs for Passage RetrievalCIKM 2023
- Incorporating Explicit Knowledge in PLMs for Passage Re-rankingSIGIR 2022
- Legal Judgment Prediction via Relational LearningSIGIR 2021
合作论文
- CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-JudgesACL 2025
- DELTA: Discriminative Encoder for Legal Case Retrieval via Structural Word AlignmentAAAI 2025
- BLADE: Enhancing Black-box LLMs with Small Domain-Specific ModelsAAAI 2025
- SAILER: Structure-aware Pre-trained Language Model for Legal Case RetrievalSIGIR 2023
教育背景
| 2022 – | 博士研究生,清华大学计算机科学与技术系 |
| 2019 – 2022 | 工程硕士,中国科学院软件研究所 |
| 2015 – 2019 | 工程学士,华南理工大学软件学院 |
荣誉奖项
| 2021 | 国家奖学金(Top 1%) |
关于我
我是一个精酿啤酒爱好者,从清爽的小麦啤到浓郁的 IPA,从比利时白啤到赛松,我热衷于品味来自世界各地的精酿佳作 🍻
投稿