天津大学教师个人主页系统郝建业 Home Personal Profile

Hao Jianye

School

College of Intelligence and Computing

Professional Title

Professor

Discipline

Artificial Intelligence

Contact Information

jianye.hao@tju.edu.cn

天津市津南区雅观路135号

Brief Introduction

【个人介绍】

郝建业，天津大学智能与计算学部软件学院菁英教授、博士生导师

国家优秀青年科学基金获得者

天津大学深度强化学习实验室（http://www.icdai.org/）负责人

长期从事深度强化学习、多智能体系统和具身智能等方向基础研究和产业应用，在 ICML、NeurIPS、ICLR 、Nature Communications等国际顶级会议和期刊发表论文150余篇，专著3部。研究成果获国际会议最佳论文奖4次，NeurIPS大会竞赛冠军4次。获中国图象图形学学会科技进步一等奖（排1），中国电子学会自然科学一等奖（排2）。根据 ACM CSRankings 学科排名，机器学习方向位列全国前三（40岁以下第一）

实验室和华为、阿里、腾讯、网易、字节、快手等公司有长期深度合作，团队强化学习成果在行业和基础大模型、国产工业基础软件智能化、自动驾驶、游戏AI、互联网广告及推荐、5G网络优化、工业物流调度、机器人等领域广泛落地应用。

先后担任华为决策与推理实验室主任、大模型算法实验室主任、华为医疗军团技术副总裁，负责华为公司决策和推理领域技术创新和产业落地，将强化学习技术在网络通讯、终端、芯片、自动驾驶、供应链等产品线广泛落地，以及在大模型后训练和各agent行业创新应用，并从0到1孵化了华为公司AI+EDA、具身智能、大模型agent等多个产业项目和创新方向。多次获公司金牌团队奖、创新与技术突破奖、总裁团队奖等。

【研究领域 | 学术成绩】

长期聚焦深度强化学习、多智能体系统及具身智能等前沿方向，致力于基础理论突破与技术落地转化。在强化学习与多智能体领域，聚焦高维、大规模场景下的强化学习稳定训练、样本效率与泛化能力等核心难题，从奖励信号的精准分配机制、自监督强化学习表征技术、高效演化强化学习新范式等角度提出一系列创新理论和方法，首次在星际争霸全场景中达成100%胜率，在Atari全任务中平均水平超越人类100倍以上，打破24项人类世界纪录，斩获多项NeurIPS大赛冠军，并在机器人控制、EDA芯片设计、自动驾驶等重要工业场景中达到业界领先性能，推动“决策大模型”的技术发展。此外，积极推动AI与交叉学科的融合创新，将强化学习技术赋能生物医疗领域，在肾透明细胞癌风险基因识别等方向取得重大突破，相关成果发表于Nature Communications等。

在具身智能与生成式决策领域，团队构建了涵盖评测基准、核心大小脑算法、软硬件基础设施的全栈技术体系。评测层面，牵头联合十余家头部具身机构打造Embodied Arena评测平台，建立包含7大核心能力的系统化分级体系，为具身智能领域树立客观权威的评价标准，推动该领域研究从单一任务优化迈向通用能力评估的范式革新。

核心算法层面，针对VLA模型语义-执行映射对齐、生成式决策模型、具身操控数据生成等关键挑战，提出**Embodied-R1架构**（以强化学习激活推理能力）、**DiffuserLite扩散决策算法**（面向机器人实时控制），以及基于演化强化学习的具身操控奖励生成与任务求解范式，大幅提升长时序、弱视觉、富接触任务的执行鲁棒性。

基础设施层面，研发业内首个决策扩散模型训练平台**CleanDiffuser**（入选HuggingFace趋势榜单及国际竞赛官方代码库），并推出千元级高性价比开源硬件**AhaRobot**与决策对齐平台**Uni-RLHF**，成功打通“评测-算法-真机落地”和“数据标注-人类价值对齐”的完整技术闭环。

近年来积极参与国内外学术交流活动，多次受邀在各高校和学术会议做主旨报告，并担任大会和论坛主席，包括第二十届中国机器学习会议（CCML 2025）、“RL4LLM：强化学习赋能大模型”论坛联合主席、2024 年 CCF 青年精英大会论坛共同主席、2024 年中国多智能体应用大会产业论坛主席、2025 年中国计算机学会人工智能会议（CCFAI）宣传主席等。

Education Background

Postdoc Researcher| MIT| CSAIL| 2015
PhD| The Chinese University of Hong Kong| Computer Science and Engineering| 2013
Bachelor of Engineering| Harbin Institute of Technology| Computer Science and Technology| 2008

Research Interests

Artificial Intelligence
Deep Reinforcement Learning
Embodied Intelligence

Courses

Academic Achievements