chore: add modeling_rabbit.py (safety-scrubbed AutoModel wrapper)

eb5ce6f verified 9 days ago

2.01 kB

	"""
	RabbitForCausalLM — AutoModel-compatible wrapper for Anvaya-Rabbit.

	pip install rtaforge transformers
	model = AutoModelForCausalLM.from_pretrained(
	"RtaForge/Anvaya-Rabbit-2.7B", trust_remote_code=True
	)
	"""

	from __future__ import annotations

	import torch
	from transformers import PreTrainedModel
	from transformers.modeling_outputs import CausalLMOutputWithPast

	try:
	from configuration_rabbit import RabbitConfig
	except ImportError:
	from .configuration_rabbit import RabbitConfig

	try:
	from white_rabbit.rabbit_model import RabbitCausalLM, RabbitModelConfig
	except ImportError as _e:
	raise ImportError(
	"The rtaforge package is required to load this model.\n"
	"Install it with: pip install rtaforge"
	) from _e


	class RabbitForCausalLM(PreTrainedModel):
	config_class = RabbitConfig
	supports_gradient_checkpointing = True

	def __init__(self, config: RabbitConfig):
	super().__init__(config)
	self._inner = RabbitCausalLM(
	RabbitModelConfig(
	vocab_size=config.vocab_size,
	d_model=config.d_model,
	n_layers=config.n_layers,
	durga_variant="fu-64",
	)
	)

	def get_input_embeddings(self):
	return self._inner.embed_tokens

	def set_input_embeddings(self, value):
	self._inner.embed_tokens = value
	self._inner.lm_head.weight = value.weight

	def get_output_embeddings(self):
	return self._inner.lm_head

	def set_output_embeddings(self, value):
	self._inner.lm_head = value

	def forward(
	self,
	input_ids: torch.Tensor,
	labels: torch.Tensor \| None = None,
	**kwargs,
	) -> CausalLMOutputWithPast:
	out = self._inner(input_ids=input_ids, labels=labels)
	return CausalLMOutputWithPast(loss=out.get("loss"), logits=out["logits"])

	def prepare_inputs_for_generation(self, input_ids, **kwargs):
	return {"input_ids": input_ids}