Quiz di fine capitolo

In questo capitolo abbiamo fatto un bel po’ di strada! Non preoccuparti se non hai colto tutti i dettagli; i capitoli successivi ti aiuteranno a capire come funzionano le cose dietro le quinte!

Prima di andare oltre, mettiamo alla prova ciò che hai imparato in questo capitolo.

1. Usando la funzione load_dataset() in 🤗 Datasets, da dove puoi caricare un dataset?

2. Immagina di caricare uno dei task GLUE come segue:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

Quale dei comandi seguenti produce un campione di 50 elementi casuali da dataset?

3. Immagina di avere un dataset sugli animali domestici, chiamto pets_dataset , che ha una colonna name che denota il nome di ogni animale. Quale degli approcci ci permetterebbe di filtrare il dataset e lasciare solo gli animali il cui nome inizia con la lettera “L”?

4. Cos’è il memory mapping?

5. Quali dei seguenti sono i principali vantaggi del memory mapping?

6. Cosa causa un errore nel codice seguente?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. Quali dei seguenti sono i vantaggi principali di creare una dataset card?

8. Cos’è la ricerca semantica?

9. Nelle ricerche semantiche asimmetriche, solitamente si hanno:

LLM Course