Schedule

  • Event
    Date
    Description
    Course Material
  • Lecture
    11/22/2024
    Friday
    • 关于NLP的一些基础知识:NLP简介、了解常见的NLP任务、词向量(word2vec)、预训练模型(ELMo、BERT)发展历程
    • 回顾NLP中语言模型任务的发展历史:N-gram LM、FFN LM、RNN LM、GPT
    • 理解向量(Embedding)的重要性,代码链接
      • 词向量可视化
      • 调用SiliconFlow Embedding API 计算句子向量的余弦相似度
      • 基于transformers BERT fine-tuning的中文文本分类
      • 基于arXiv论文数据 + SiliconFlow API + faiss + streamlit 构建论文搜索引擎demo
    • 一点数学计算:
  • Lecture
    12/02/2024
    Monday
  • Lecture
    12/16/2024
    Monday
    • GPT-1 && GPT-2
    • Train-time Compute Scaling Laws
      • 解析(Train-time Compute) Scaling Laws for LM, Empirically
      • 计算 GPT模型参数和FLOPs
      • Kaplan Scaling Laws && Chinchilla Scaling Laws
      • 编程实践:Scaling Laws for MNIST
    • GPT-3 and Beyond
      • 涌现、幻觉、位置编码、合成数据、提示工程、SLMs …
  • Lecture
    12/20/2024
    Friday
    LLM Post-training
    • instruction tuning
    • RLHF
    • DPO
    • 代码实践:unsloth、llama-factory
  • Lecture
    12/21/2024
    Saturday
    Efficient LLM Fine-tuning
    • Mixed Precision Training
    • Lora
    • qlora
  • Lecture
    12/24/2024
    Tuesday
    LLM reasoning
    • Inference Scaling Laws
    • verifier
    • ORM/PRM/MCTS/DPO/RL
  • Lecture
    12/25/2024
    Wednesday
    Multimodal LLM
    • 原生多模态模型
    • 扩展现有LLM模型
    • LLaVA
    • GraphGPT
  • Lecture
    12/25/2024
    Wednesday
    RAG
    • RAG, GraphRAG

    • 代码实践:

      • LightRAG
  • Lecture
    12/26/2024
    Thursday
    LLM Agents

    参考 Shunyu Yao的博士论文、CS294/194-196 Large Language Model Agents和相关的Tutorials

  • Lecture
    12/29/2024
    Sunday
    MoE和Mamba

    Hippo, S4, Mamba, RWKV

    MoE/Mamba reasoning