Thomas Li

Principal Applied Scientist · Microsoft Edge
邮箱 250145013@qq.com 网站 thomasli.cn 坐标 苏州

微软 Edge Architect Leader Team 成员,AI 浏览器 / Agent 化体验方向。 自 2023 年把 Edge Copilot 从 0 做到百万级;基于 LLM 开发自动标签分组等核心功能, 带动浏览器核心业务(千万级盘子)实现 3× 增长。一条主线:让浏览器从「被动响应」演进为「主动陪伴」。

浏览器
深耕 AI 浏览器 核心赛道:Chromium 内核改造、浏览信号治理、Agent 化体验,从 Chat → Loop
核心产品
Copilot · Journeys(全球首发)· Tabs Auto Grouping(领先 Google 12 个月)· Web Blueprints · 数字员工
职能
算法 + 工程 + 团队 一体;多个 0→1 项目 Tech Lead,一人三栖(Client / Backend / Algorithm)。
西安理工大学
模式识别与智能系统 · 硕士
2009.09 – 2012.12
空军工程大学
电子信息工程 · 本科
2005.09 – 2009.07
微软 · Microsoft Edge
2022.04 – 至今
Principal Applied Scientist Tech Lead Architect Leader Team · AI 浏览器 / Agent 化体验

围绕 AI 浏览器 / Agent 化从 0→1 推进产品与工程落地:一条主线 Edge Copilot, 一条主线用 AI 提升浏览器核心功能。把 Edge Copilot 从 0 做到百万级,带动 Tabs 核心业务 3× 增长。

2023
浏览器内完成 contextual chat + RAG 原型;引入 router(意图识别),把历史与多标签页上下文纳入模型;模型输出映射为函数参数触发系统动作(tool calling 前奏)。
2024
早期 Browser Agent("Browse for me"),把检索、阅读与执行串接;完成 Tabs / Favorites / History 的自动内容治理。
2025
Copilot 算法、工程升级,Text / Vision / CUA 统一成 React Loop;落地 Vision Action(免手操控的对话式动作);孵化 Office Agent(类似 Manus)。
2026
从「被动响应」到「主动陪伴」—— Lead Intent / Journeys / Blueprints 三条主线:输入信号从「当前页面」扩到「全 M365 + Copilot」,架构从 Chat → Loop,产出从 Text 扩到 Image / 网页 / Action。
腾讯音乐
2018.09 – 2022.04
社交推荐负责人 实时社交(直播 / 声动合唱)+ 异步社交(关系链 / 家族推荐)
整体负责算法 / 工程 / 团队从 0→1。
  • 直播推荐:DSSM softmax in batch + bitwise FM/autoint + CGC + PCGrad + GradNorm + ESMM,关注渗透 +17%,时长 +1.15%;有效主播开播数翻倍。
  • 用户 / 家族推荐:二部图 GraphSAGE + GNN + Attention + SSL,家族业务次留 +3.4%、关注渗透 +100%。
  • 社交基建:统一召回 / 特征 / bandit / 流量调控服务,覆盖 15 个入口、4–5 个垂类,整体渗透 +10%。
网易云音乐
2017.11 – 2018.09
社交推荐负责人 音乐人推荐 · 关注 feed 排序
从 0 搭建"网易音乐人推荐"(w2v 相似用户 + LR 排序),关注率与关注量 +100%;基于 itemCF + GBDT 搭关注 feed 排序,播放量 +10%。
阿里巴巴 · iDST
2015.04 – 2017.11
资深算法工程师 天合计划 · 手淘 Push
天合计划:在线匹配业务逻辑(PID)与算法,实现保量,点击率与钻展持平。 手淘 Push:数据分析 + 在线投放工程 + 运营管理平台建设;对比原有圈人 +100%。
华为 · 2012 实验室(西安研究所)
2013.01 – 2015.04
算法 / 后端工程师 数据采集 · Web · C++ 后端
数据采集组:本地数据转发至 HDFS 集群,转发效率 ×10;基于 JS 完成华为云 Web 工作;C++ 后端:网元创建与维护软件的设计与开发。
Journeys
🌍 全球首发 Edge Copilot Mode 旗舰
Tech Lead · backend owner(C5 GA)· 微软 Edge
基于用户浏览历史做主题自动分组(一个 group = 一个 journey),每个分组生成 1 张视觉任务卡 + 2 个 suggested action, 让用户在 SNTP 一眼接着干。业界首个把"长期浏览意图"图文化为可视任务卡的浏览器原生体验。 端到端拿下架构 / 可靠性 / 交付全权 ownership,并行作为 Edge SAI 服务 owner。 业务结果:+3.9% conversion · +4.3% CTR · +24% coverage
Tabs Auto Grouping
2023 全球首发 领先 Google ~12 个月
唯一同时负责 Client(Chromium C++/JS)+ Backend + Algorithm 的 0→1 项目 · 微软 Edge
世界首个基于 LLM 的浏览器标签自动分组(Google Chrome 同类 Tab Organizer 2024.01 才随 Chrome 121 推出)。 算法:自研 Tab 语义相似度 + 主题聚类 pipeline,router 从 GPT-3.5 → BERT → SLM → GPT-4.1-mini 演进。 客户端:Chromium 内核改造(Tab Strip / Group 模型、Mojo IPC、UI 渲染)。 后端:从 0 搭建内容预处理与 LLM 调用服务(prompt 编排 / 限流 / 缓存 / 降级)。 影响:AI + Tabs 从 0 → 百万级 DAU,带动 Tabs 业务 3× 增长,BSOM +1%。作为 Edge 官方 Tab Groups 功能页 持续主推。
Web Blueprints
Edge 148 Canary 浏览器原生
Lead(2026 三轴主线之一)· 微软 Edge
让浏览器为用户"长出"网页能力:根据当前页面或浏览历史自动生成 mini-app,或用自然语言 / 模板化脚本定向改造网页 (隐元素、加按钮、抽数据…)。Falcon 服务端 NLP→脚本生成 + 校验,运行时纯本地执行(SQLite + Mojo IPC + Renderer Isolated World), 纵深防御。对标 Tampermonkey + Stylus + Stylish(合计 1500 万+ 周装机),门槛从 CSS/JS 降到自然语言。
Societas / Sociemate
Multi-Agent 0→1 数字员工负责人
技术基座 + 数字员工负责人 · 微软 EdgeML
Societas:从 0 搭建对标 Suno / Manus 的 multi-agent 技术路线,孵化覆盖 Office 工作流(PPT / Doc)的 agent team; 在 GDPVal Benchmark(220 tasks × 9 sectors)跑赢业界 baseline。 Sociemate:进一步让 multi-agent "长在团队工作场域里" —— 团队优先 + 主动感知的 agent harness,落地 Teams, 四层栈(Cloud Gateway / Hermes 本地大脑 / squad 调度 / 可换 coding agent),已在 EdgeML 团队内部上线。
Browser Agent · Vision Action
React Loop
Copilot 算法 / 工程 · 微软 Edge
由 Intent 决定何时主动执行,结合 React Loop 与 Vision Action 实现"说一声就办了";打通视觉理解 + 动作触发, 让用户"只说不点"完成复杂 UI 操作。Contextual Chat SSR 76% → 90%,Action 成功率 50% → 90%,动作链路延迟 10s → 1s。
2026

WebRouter: Query-Specific Router via Variational Information Bottleneck for Cost-Sensitive Web Agent

一作 · ICASSP 2026 · IEEE Signal Processing Society

基于变分信息瓶颈(VIB)对 query 编码做信息压缩,在保证任务效果的前提下显著降低单 query 平均推理成本;落地 Edge Copilot 线上意图路由。

2024

Mixture of Rationale: Multi-Modal Reasoning Mixture for Visual Question Answering

ICONIP 2024

多模态推理混合架构,提升 VQA 任务的可解释性与准确率。

2026

Fara1.5 (Microsoft Research) — Edge × MSR 合作贡献

Microsoft Research · Computer Use Agent Models

为 MSR Fara1.5 (4B/9B/27B) CUA 模型贡献 38,384 对多语言任务(德 / 西 / 法 / 葡 / 意 / 日 / 中 7 语)。Fara1.5-27B 在 Online-Mind2Web 上达 72% 成功率,超过 Gemini 2.5 Computer Use、OpenAI Operator、Yutori Navigator n1。