MicroLM-1M

Modelo de linguagem leve (~1M parâmetros) treinado em 500M tokens.

10 200
0.1 1.5
0.5 1