大语言模型幻觉是指模型可能会“编造”答案,看似可信但实际上并不正确。Vectara制定了Hughes幻觉评估模型,评估在总结文档时引入幻觉的概率,并进行持续更新。

数据最后更新于:2025 年 2 月 28 日

Hughes幻觉评估模型发布:https://github.com/vectara/hallucination-leaderboard

最后修改:2025 年 03 月 01 日
如果觉得我的文章对你有用,请随意赞赏