TorBT - Torrents and Magnet Links Search Engine

Burkov Andriy - The Hundred-Page Language Models Book + Code - 2025

File Name
Size
Burkov Andriy - The Hundred-Page Language Models Book - 2025.pdf
24 MB
Code/news_decoder_language_model.ipynb
425 kB
Code/news_RNN_language_model.ipynb
398 kB
Code/emotion_GPT2_as_text_generator.ipynb
115 kB
Code/emotion_GPT2_as_text_generator_LoRA.ipynb
30 kB
Code/emotion_GPT2_as_classifier.ipynb
24 kB
Code/byte_pair_encoding.ipynb
24 kB
Code/instruct_GPT2.ipynb
23 kB
Code/count_language_model.ipynb
21 kB
Code/sampling_method.ipynb
18 kB
Code/emotion_classifier_LR.ipynb
8.9 kB
Code/wiki/inference.md
3.1 kB
Code/wiki/evaluation.md
2.0 kB
Code/embedding_vs_linear.py
1.8 kB
Code/wiki/index.md
1.5 kB
Code/quadratic_loss.py
1.3 kB
Code/wiki/math.md
1.3 kB
Code/wiki/non-transformer.md
1.2 kB
Code/wiki/compression.md
1.2 kB
Code/wiki/colabs.md
1.1 kB
Code/wiki/encoder-decoder.md
1.1 kB
Code/wiki/embeddings.md
991 B
Code/wiki/prompting.md
883 B
Code/wiki/encoder.md
707 B
Code/wiki/deployment.md
681 B
Code/wiki/function-calling.md
669 B
Code/wiki/alignment.md
636 B
Code/wiki/VLM.md
611 B
Code/wiki/security.md
601 B
Code/wiki/overfitting.md
553 B
Code/wiki/MoE.md
409 B
Code/wiki/PyTorch.md
388 B
Code/wiki/scaling.md
372 B
Code/wiki/tokenization.md
352 B
Code/wiki/notebook-services.md
337 B
Code/wiki/distributed.md
331 B
Code/wiki/GPU-rental.md
325 B
Code/wiki/merging.md
323 B
Code/wiki/test.md
271 B
Code/wiki/online-finetuning.md
151 B
Code/README.md
130 B
Code/wiki/scripts.md
115 B