关于Llama 3 AI大模型的几点总结

type

status

title

summary

slug

Created

Apr 19, 2024 02:07 PM

tags

Date

icon

password

Meta最近终于发布了Llama3大模型，OpenAI和CloseAI又要“开战了”，以下是关于Llama3的几点总结：

1、发布时间

Llama3的发布时间是北京时间4月19号0点37分，这主要是依据Meta的首席AI科学家 Yann LeCun 发布Twitter帖文的时间。

2、发布型号

目前Llama3发布了两款模型，分别是 Meta-Llama-3-8B 和 Meta-Llama-3-70B

3、Llama3 VS Llama2

4倍的词汇量（Llama3是128k，Llama2是32k）

使用 15T token训练，是 Llama2 的7倍

2倍的上下文，Llama3是8k，Llama2是4k（个人认为还是太小了，不过据说后续会发布更大的）

两个模型都具备分组查询注意力(GQA) ，Llama2只有70B这个模型具备

整体性能优于Llama2

4、性能测试

Llama3 在MMLU（学科知识理解）、GPQA（一般问题）、HumanEval（代码能力）、GSM-8K（数学能力）、MATH（比较难得数学）五个基准测试上，不管是Llama3-8B，还是Llama-70B，都优于目前比较优秀的大模型。

但是这个我觉得看看就行，毕竟比别人差的东西还发出来肯定会被用户吐槽，但性能肯定是不错的。

另外，为了寻求Llama3在现实场景的性能，开发人员还开发了一套新的高质量人类评估集。该评估集包含 1,800 个提示，涵盖 12 个关键用例：寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色/角色、开放式问答、推理、重写和总结。而且为了避免模型在此评估集上过度拟合，即使是Llama3的模型开发人员也无法访问它。

这是Llama3在这些评估集的测试结果，整体是优于其他模型的