LLM360
/

K2

@@ -16,23 +16,22 @@ K2 is a fully transparent large language model on par with Llama 2 - 70B.
 <center><img src="eval_table_temp.png" alt="eval table"/></center>
 ## Datasets and Mix
-| Dataset      | Starting Tokens      | Multiplier      | Total Tokens      |Percent of Total      |
 | ----------- | ----------- | ----------- | ----------- | ----------- |
-| dm-math   | 4.33        | 3x       | 13B       | 1%       |
-| Checkpoint 359[link]   | Checkpoint 354[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 358[link]   | Checkpoint 353[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 357[link]   | Checkpoint 352[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
-| Checkpoint 356[link]   | Checkpoint 351[link]        | Checkpoint 355[link]       | Checkpoint 355[link]       |
 ## First 10 Checkpoints
 | Checkpoints      |  |

 <center><img src="eval_table_temp.png" alt="eval table"/></center>
 ## Datasets and Mix
+| Dataset      | Starting Tokens      | Multiplier      | Total Tokens      |% of Total      |
 | ----------- | ----------- | ----------- | ----------- | ----------- |
+| dm-math   | 4.33B        | 3x       | 13B       | 1%       |
+| pubmed-abstracts   | 4.77B        | 3x       | 14.3B       | 1.1%       |
+| uspto   | 4.77B        | 3x       | 14.3B       | 1.1%       |
+| pubmed-central   | 26B        | 1x       | 26B       | 2%       |
+| redpajama.arxiv   | 27.3B        | 1x       | 27.3B       | 2.1%       |
+| starcoder.spm   | 67.6B        | 0.5x       | 33.8B       | 2.6%       |
+| starcoder.fim   | 67.6B        | 0.5x       | 33.8B       | 2.6%       |
+| redpajama.stackexchange   | 61.1B        | 1x       | 61.1B       | 4.7%       |
+| starcoder   | 132.6B        | 0.5x       | 66.3B       | 5.1%       |
+| pile-of-law   | 76.7B        | 1x       | 76.7B       | 5.9%       |
+| redpajama.book   | 80.6B        | 1x       | 80.6B       | 6.2%       |
+| s2orc   | 107.9B        | 1x       | 107.9B       | 8.3%       |
+| redpajama.wikipedia   | 22.1B        | 6x       | 132.6B       | 10.2%       |
+| refinedweb   | 612.3B        | 1x       | 612.3B       | 47.1%       |
 ## First 10 Checkpoints
 | Checkpoints      |  |