Haoran Zhang's picture

Haoran Zhang

zzzhr97

·

AI & ML interests

Lange Language Models, Large Reasoning Models

Recent Activity

updated a dataset 6 days ago

zzzhr97/Pi-Bench

published a dataset 6 days ago

zzzhr97/Pi-Bench

upvoted a paper 8 days ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

View all activity

Organizations

submitted a paper to Daily Papers 8 days ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Paper • 2605.14678 • Published 11 days ago • 102

authored a paper 8 days ago

$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Paper • 2605.14678 • Published 11 days ago • 102

authored a paper 12 days ago

Achieving Gold-Medal-Level Olympiad Reasoning via Simple and Unified Scaling

Paper • 2605.13301 • Published 17 days ago • 158

authored a paper 8 months ago

Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration

Paper • 2509.14760 • Published Sep 18, 2025 • 53