Sentence Similarity
sentence-transformers
Safetensors
bert
feature-extraction
Generated from Trainer
dataset_size:20502
loss:CosineSimilarityLoss
text-embeddings-inference
Instructions to use JohanHeinsen/Old_News_Segmentation_SBERT_V0.1 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use JohanHeinsen/Old_News_Segmentation_SBERT_V0.1 with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("JohanHeinsen/Old_News_Segmentation_SBERT_V0.1") sentences = [ "Spurgte man ham, hvorledes dette skulde forstaaes, svarede han\"Naar Varepriserne vare faldne, gjorde jeg Jndkjøb og betalte altid lidt mere end Andre, saa enhver gjerne vilde sælge til mig; steeg Varerne, solgte jeg igjen lidt billigere end Andre, og fik derved i en Hast mit Forraad udsolgt, inden Priserne faldt igien.\"", "Paa Pregels venstre Side derimod stiger Vandet saaledes, at der i Landsbyen Mulden er skeet betydelig Skade ved Oversvømmelse af den der værende lille Flod.", "Fra Aamodts Præstegield i Østerdalen skrives følgende under 17de Marts, Sidstafvigte Onsdag Aften, imellem Kl. 7 og 8, blev her begaaet et skrækkeligt Mord paa 2de svenske Handelskarle.", "Gaardens Bygninger, som bestaaeraf 11 Fag Grundmuur til Gaden med Qvist over, samt 21 Fag Muur- og Bindingsværk til Gaarden, og som alt er ny opbygget for 11 Aar siden, ere i Kiøbstædernes Brandasseurance forsikkrede for den Summa 6220 Rbdlr." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
SentenceTransformer based on CALDISS-AAU/DA-BERT_Old_News_V1
This is a sentence-transformers model finetuned from CALDISS-AAU/DA-BERT_Old_News_V1. It is an initial version of a model meant to assist in segmenting ENO. It can also be used as a general purpose embedding model for eighteenth- and early nineteenth-century Danish. It has been trained from newspaper data, covering a wide range of genres and topics.
Model Description
- Model Type: Sentence Transformer
- Base model: CALDISS-AAU/DA-BERT_Old_News_V1
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
Training Details
Training Dataset
Unnamed Dataset
- Size: 20,502 training samples
- Columns:
sentence_0,sentence_1, andlabel - Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 label type string string float details - min: 4 tokens
- mean: 27.64 tokens
- max: 314 tokens
- min: 4 tokens
- mean: 27.19 tokens
- max: 218 tokens
- min: 0.0
- mean: 0.45
- max: 1.0
- Samples:
sentence_0 sentence_1 label Slagelse den 31te Januar 1818. Vastholm.Sølv til Amtets Fattigkasse forbudt, efter privat Overeenskomst med vedkommende Ægtpligtige at modtage Vederlag, enten i Penge, eller andre Præstationer, istedet for Befordring en naturg.0.0– Ved Opholdet i Louisenlund har Hs. Majestæt Kongen den 10de dennes allernaadigst egenhændigen overlevet Storcommandeurkorset af Dannebrogen til Allerhøistsammes Svigerfader Hs. Durchl.Landgreve Carl til Churbessen, Generalfeldtmarskal Stadtholder i Hertugdømmene Slesvig og Holsteen, Ridder af Elefanten og Dannebrogsmand.1.0, samt Eieren af Riignorgaard i Amtet Gottorf, H. Petersen, udnævnte til Landmaalere.Under Finants-Collegiet: Til Kasserer for de specielle Oppebørseler i Hertugdommene, har Hs. Majestæt, under 26de Juli dette Aar, udnævnt C. Schleth, Kasserer, Bogholder og Regnskabsfører ved Travensalzer Salme; forhenværende Revisor ved den grønlandske Handel, N. Døller, udnævnt til General-Revisor ved Lottoet i Kjøbenhavn.0.0 - Loss:
CosineSimilarityLosswith these parameters:{ "loss_fct": "torch.nn.modules.loss.MSELoss" }
- Downloads last month
- 2