https://mp.weixin.qq.com/s/WxmIYR7EHKaiNj-8cYRX6A

我将以**「交互演示」**方式:

尝试帮你在 10 分钟内,理解大模型的基本原理。

大模型的“生成”,不过是续写

大模型,能够写一篇很长的内容:不过是“文字接龙”的小游戏。

简单来说,就是:根据前面的内容,预测下一个词是什么,然后把这个词接上,再预测,再接上,循环往复。(你也可以管这个叫:自回归)

这里有一个简单的演示,可以点击 天气 来试试

大模型就这么一个个词的猜,直到猜完一整篇文章。

不过这里就有了一个新问题:AI 是如何判断哪个词可能性最大?又是如何理解我们写的内容呢?

大模型自己“划重点” :所谓的“注意力”

**AI 在“续写”时,不会对所有词都一视同仁,它会“划重点”!**这项能力叫做 “注意力机制”:把注意力更多地放在重要的词语上。

在下面的演示中,点击 阳光 花香 人们 微风 感叹或者 今天 ,来看看大模型都关注到了什么。