https://mp.weixin.qq.com/s/WxmIYR7EHKaiNj-8cYRX6A
我将以**「交互演示」**方式:
尝试帮你在 10 分钟内,理解大模型的基本原理。
大模型的“生成”,不过是续写
大模型,能够写一篇很长的内容:不过是“文字接龙”的小游戏。
简单来说,就是:根据前面的内容,预测下一个词是什么,然后把这个词接上,再预测,再接上,循环往复。(你也可以管这个叫:自回归)
这里有一个简单的演示,可以点击 天气 来试试
大模型就这么一个个词的猜,直到猜完一整篇文章。
不过这里就有了一个新问题:AI 是如何判断哪个词可能性最大?又是如何理解我们写的内容呢?
大模型自己“划重点” :所谓的“注意力”
**AI 在“续写”时,不会对所有词都一视同仁,它会“划重点”!**这项能力叫做 “注意力机制”:把注意力更多地放在重要的词语上。
在下面的演示中,点击 阳光 花香 人们 微风 感叹或者 今天 ,来看看大模型都关注到了什么。