淘客熙熙

主题:茗谈149:赤雁 -- 本嘉明

  • 共: 💬 423 🌺 2377 🌵 67
你太外行了

模型的训练成本,是一次训练的成本。就是该版本模型从头开始,训练到当前发布权重所花的GPU时间。

你多看几篇大模型的论文,比如meta的llama3.0的,里面都会说自己一次训练成本是多少。



有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河