LLM Course documentation
Quiz di fine capitolo
0. Installazione
1. Modelli Transformer
2. Usare i 🤗 Transformers
3. Affinamento di un modello pre-addestrato
4. Condividere modelli e tokenizers
5. La libreria 🤗 Datasets
IntroduzioneE se il mio dataset non è sull'Hub?È arrivato il momento di tagliuzzareBig data? Ci pensa 🤗 Datasets!Creare il proprio datasetRicerca semantica con FAISS🤗 Datasets, check!Quiz di fine capitolo
8. Come chiedere un aiuto
9. Creare e condividere demo
Quiz di fine capitolo
In questo capitolo abbiamo fatto un bel po’ di strada! Non preoccuparti se non hai colto tutti i dettagli; i capitoli successivi ti aiuteranno a capire come funzionano le cose dietro le quinte!
Prima di andare oltre, mettiamo alla prova ciò che hai imparato in questo capitolo.
1. Usando la funzione load_dataset() in 🤗 Datasets, da dove puoi caricare un dataset?
2. Immagina di caricare uno dei task GLUE come segue:
from datasets import load_dataset
dataset = load_dataset("glue", "mrpc", split="train")Quale dei comandi seguenti produce un campione di 50 elementi casuali da dataset?
3. Immagina di avere un dataset sugli animali domestici, chiamto pets_dataset , che ha una colonna name che denota il nome di ogni animale. Quale degli approcci ci permetterebbe di filtrare il dataset e lasciare solo gli animali il cui nome inizia con la lettera “L”?
4. Cos’è il memory mapping?
5. Quali dei seguenti sono i principali vantaggi del memory mapping?
6. Cosa causa un errore nel codice seguente?
from datasets import load_dataset
dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]