TAGGED IN
大模型
共有 448 篇文章
“越长”就越强?为何通义千问卷不动Kimi
最近,受到Kimi大火的刺激,国内大模型们又开始了新一轮“我有多长”的比赛了。在Kimi目前200万文本长度打底的情况下,其他各家没个四五百万打底,都不好意思见
LLM上下文窗口突破200万!无需架构变化 复杂微调,轻松扩展8倍
大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophicvalues)等问题
为什么说这些倒腾AI的方式会把自己“搞死”
近来看了些基于大模型的产品,真的是差点把自己看哭了。倒不是悲天悯人,而是想起了过去十年里被这些创意和产品折磨的日子。这些产品是死路,但新的一波同学们可能太新,所
开源模型越来越落后?Meta甩出全新Llama 3应战
如同闷了很久,突然下的一场雨——Llama3终于来了。美国当地时间4月18日,Meta公司推出其开源大语言模型“Llama”(直译是“羊驼”)系列的最新产品——