中学生能看懂：10 分钟理解大模型

我将以**「交互演示」**方式：

尝试帮你在 10 分钟内，理解大模型的基本原理。

大模型的“生成”，不过是续写

大模型，能够写一篇很长的内容：不过是“文字接龙”的小游戏。

简单来说，就是：根据前面的内容，预测下一个词是什么，然后把这个词接上，再预测，再接上，循环往复。（你也可以管这个叫：自回归）

这里有一个简单的演示，可以点击天气来试试

大模型就这么一个个词的猜，直到猜完一整篇文章。

不过这里就有了一个新问题：AI 是如何判断哪个词可能性最大？又是如何理解我们写的内容呢？

大模型自己“划重点” ：所谓的“注意力”

**AI 在“续写”时，不会对所有词都一视同仁，它会“划重点”！**这项能力叫做 “注意力机制”：把注意力更多地放在重要的词语上。

在下面的演示中，点击阳光花香人们微风感叹或者今天，来看看大模型都关注到了什么。