我们荣幸地报告 GPT-4 的开发,它是一款大规模多模态模型,能够接受图像和文本输入并生成文本输出。虽然在许多现实场景中 GPT-4 的能力仍然不及人类,但它在各种专业和学术基准测试中展现出人类水平的表现,包括在模拟的律师考试中获得了前 10% 的考生得分。GPT-4 是一种基于 Transformer 的模型,预先训练以预测文档中的下一个词汇。后续的对齐过程提高了模型的准确性,使其在事实性和符合预期行为的度量方面表现更好。在这个项目中,我们着重开发了基础设施和优化方法,以确保其在各种规模下的可预测性,这使得我们可以根据使用不超过 GPT-4 计算量的 1/1,000 的模型来准确预测 GPT-4 的某些性能方面。
GPT-4 技术报告已经发布,现在即可下载,格式为PDF
提交历史
来自:阿德里安·埃科菲特 [view email]
[v1] 2023 年 3 月 15 日星期三 17:15:04 UTC (3,853 KB)
[v2] 2023 年 3 月 16 日星期四 04:59:24 UTC (3,855 KB)
原文链接: [2303.08774] GPT-4 技术报告
© 版权声明
本站所有文章,仅代表文章作者个人观点,如对观点有疑义时不用怀疑,您绝对是对的。
您也可以联系文章作者本人进行修改,若内容侵权或非法,可以联系我们进行处理。
任何个人或组织,转载、发布本站文章到任何网站、书籍等各类媒体平台,必须在文末署名文章出处并链接到本站相应文章的URL地址。
本站文章如转载自其他网站,会在文末署名原文出处及原文URL的跳转链接,如有遗漏,烦请告知修正。
如若本站文章侵犯了原著者的合法权益,亦可联系我们进行处理。
您也可以联系文章作者本人进行修改,若内容侵权或非法,可以联系我们进行处理。
任何个人或组织,转载、发布本站文章到任何网站、书籍等各类媒体平台,必须在文末署名文章出处并链接到本站相应文章的URL地址。
本站文章如转载自其他网站,会在文末署名原文出处及原文URL的跳转链接,如有遗漏,烦请告知修正。
如若本站文章侵犯了原著者的合法权益,亦可联系我们进行处理。
THE END
暂无评论内容