12 16

Mason Baker

masonbaker5

AI & ML interests

None yet

Recent Activity

liked a model about 5 hours ago

patrickamadeus/Qwen2.5-VL-3B-Instruct-distill_lang

upvoted a paper about 13 hours ago

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

upvoted a paper 1 day ago

SafeDiffusion-R1: Online Reward Steering for Safe Diffusion Post-Training

View all activity

Organizations

None yet

liked a model about 5 hours ago

patrickamadeus/Qwen2.5-VL-3B-Instruct-distill_lang

Image-Text-to-Text • 4B • Updated about 5 hours ago • 1

upvoted a paper about 13 hours ago

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Paper • 2605.16928 • Published 8 days ago • 82

upvoted a paper 1 day ago

SafeDiffusion-R1: Online Reward Steering for Safe Diffusion Post-Training

Paper • 2605.18719 • Published 6 days ago • 5

liked a model 2 days ago

ik-ram28/gemma-3-4b-grpo-mod2_3-no-gt-560

Image-Text-to-Text • 4B • Updated 2 days ago • 28 • 1

upvoted a paper 4 days ago

CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence

Paper • 2605.12882 • Published 11 days ago • 262

liked a model 5 days ago

nataliaaolmo/distilhubert-instruments-finetuned2

23.7M • Updated 5 days ago • 20 • 1

liked a model 9 days ago

Qwen/Qwen2.5-7B-Instruct

Text Generation • 8B • Updated Jan 12, 2025 • 13.2M • • 1.29k

upvoted a paper 9 days ago

Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

Paper • 2605.06169 • Published 17 days ago • 212

liked a dataset 12 days ago

m-a-p/FineFineWeb

Viewer • Updated Dec 19, 2024 • 4.89B • 743k • 139

liked a model 16 days ago

Rtian/sdar4b-v8-rm-bl4-lr2e-5-ecqa-ep2

4B • Updated 16 days ago • 14 • 1

liked a dataset 22 days ago

wegrthj/j3a9w9-8qtx-data

Viewer • Updated 21 days ago • 1.85M • 3.07k • 1

liked 3 models about 1 month ago

upvoted a paper about 1 month ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

Paper • 2604.06628 • Published Apr 8 • 325

liked a dataset about 1 month ago

BAAI/Infinity-Instruct

Viewer • Updated Dec 4, 2025 • 21.9M • 3.29k • 718

liked a model about 1 month ago

qualcomm/EyeGaze

Updated 4 days ago • 1

upvoted a paper about 2 months ago

Adam's Law: Textual Frequency Law on Large Language Models

Paper • 2604.02176 • Published Apr 2 • 503

liked a model about 2 months ago

longtermrisk/el_in4_lr1k_i4erc_smoke-lora-new

Text Generation • Updated Apr 8 • 1

liked a dataset about 2 months ago

kevinS4455/sketchfab_zips12

Viewer • Updated Apr 4 • 4.79k • 20 • 1

Mason Baker

AI & ML interests

Recent Activity

Organizations

masonbaker5's activity