LLM Tuning - a danielz01 Collection

danielz01 's Collections

Image Generation

LLM Tuning

updated Jan 30, 2024

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 155
Tuning Language Models by Proxy

Paper • 2401.08565 • Published Jan 16, 2024 • 22
ReFT: Reasoning with Reinforced Fine-Tuning

Paper • 2401.08967 • Published Jan 17, 2024 • 32
Rephrasing the Web: A Recipe for Compute and Data-Efficient Language Modeling

Paper • 2401.16380 • Published Jan 29, 2024 • 53