726
2万
5万
论坛元老
举报
624
禁止发言
2377
6万
1万
0
8627
8697
aaxmmx 发表于 2026-4-24 15:47 这样的资讯还是非常有意思的了
一个人的精彩 发表于 2026-4-25 09:56 DeepSeek V4深度:一次注意力机制的结构性颠覆
如履薄冰 发表于 2026-4-25 10:13 这模型真是把注意力玩明白了,以前的都像瞎猜
1
7827
4927
如履薄冰 发表于 2026-4-25 10:13 这波真是把注意力机制玩明白了,1M上下文直接标配,算力成本砍到27%,真·结构级突破 ...
本版积分规则 发表回复 回帖后跳转到最后一页
Archiver|手机版|小黑屋|多博社区
GMT+8, 2026-5-21 01:28 , Processed in 0.051659 second(s), 21 queries .
Powered by Discuz! X3.5
© 2001-2026 Discuz! Team.