1.大模型技术概览 | Python技术交流与分享

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

1.1大模型Emergent Abilities（新兴能力）现象

模型规模达到某个阈值时，模型对某些问题的处理性能呈现快速增长。这个过程类似于水加热到100度的过程。
目前一些大模型已达或接近这个阈值，个人觉得这些技术或方法功不可没：
一、软件方面
1.BP算法
2.注意力机制
3.强化学习
强化学习一大贡献就是弥补了传统机器学习评估标准的不足，传统机器学习一般基于损失函数进行评估，希望预测与标签的差平方（或两者的分布近似度）越小越好。这种评估方式是一种绝对值的近似，不利于输出多样性的结果。而强化学习采用奖励或评分的方式，看重的是输出与期望值的对齐程度。

4.大数据平台，如PyTorch，TensorFlow，及CUDA架构等
5.GEMM
二、硬件方面
GPU、TPU等地助力。

1.2 几种正助力拓展序列长度的几种算法

（1）FlashAttention，FlashAttention-2
FlashAttention从软件和硬件两个方面对Transformer模型进行优化，软件方面采用了分块、在线softmax，重计算（一种类似于Python迭代器的思路，用规则或算法表示数据，而不实际存在大数据）；硬件方法，充分考虑了GPU的架构特点，如A100,H100等HBM,SRAM等优缺点。
HBM,SRAM等优缺点
（2）Learned、Relative、RoPE等位置编码方法
（3）多种注意力机制

1.3.各种大模型使用技术概览

下面我选择8个比较典型的大模型，统计了它们使用的一些技术，供大家参考。

————————————————
版权声明：本文为CSDN博主「wumg3000」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/wumg3000/article/details/135242873

推荐文章

酷酷的排球 · module' object has no attribute 'matlib' abaqus - CSDN文库

昨天

坚韧的稀饭 · How to fix AttributeError: module numpy has no attribute float' in Python - GeeksforGeeks

昨天

傻傻的课本 · Python 教程 — Python 3.13.1 文档

昨天

英姿勃勃的火柴 · PEP 0 – Index of Python Enhancement Proposals (PEPs) | peps.python.org

昨天

开朗的茄子 · Spark - RCC User Guide

16 小时前

豪气的眼镜 · 换位思考：解决下属不愿执行命令的困境作为企业老板，遇到下属不愿执行命令的情况是很常见的。面对这种情况，发火或者强制下属执行并不能解决问题，相反可能引发更大的... - 雪球

2 周前

温柔的汽水 · 品读百镇陕西省乡村振兴示范镇 ——安康市汉阴县双河口镇-安康市住房和城乡建设局

3 月前

闯红灯的泡面 · 亿华通-北京清华工业开发研究院

4 月前

斯文的春卷 · 银行经营策略转向：贷款倾向制造业，“商投行”一体化加速 | 南方周末

5 月前

暴走的充值卡 · encoding/json: ignore tag "-" not working on embedded sub structure when decoding · Issue #30701 · g

6 月前