小火箭节点

小火箭

时隔六年互联网女皇340页AI猛料刷屏大佬熬夜头秃

互联网女皇、传奇投资者Mary Meeker，再度出山！曾经，女皇的《互联网趋势报告》一出，整个科技圈都要抖三抖。硅谷大佬觉都不睡了，都要连夜研读这份刷屏圈内……

shadowrocket 2026年1月25日

0

小火箭

HappyLLM项目正式发布一起快乐学习大模型

开源初心很多小伙伴在看完《self-llm：开源大模型食用指南》后，感觉意犹未尽，想要深入了解大语言模型的原理和训练过程。于是我们就从去年密谋到现在，决……

shadowrocket 2026年1月25日

0

小火箭

从零开始200行python代码实现LLM

以下文章来源于阿里云开发者，作者思潜阿里云开发者 . 阿里巴巴官方技术号，关于阿里的技术创新均呈现于此。前言大语言模型（LLM）很火，讨论的文……

shadowrocket 2026年1月25日

0

小火箭

TextDiffusion来了

相比AR的建模方式，Diffusion建模有三个优势：并行推理，速度可以快好几倍双向上下文建模，避免reversal curse [2] 同样可以做到test-time scaling 但是……

shadowrocket 2026年1月25日

0

小火箭

RAG挑战赛冠军方案解析从数据解析到多路由器检索的工程实践推荐阅读

以下文章来源于ChallengeHub ，作者ChallengeHub ChallengeHub . 由互联网大厂和中科院研究所的算法数分小伙伴们创建，热爱竞赛知识分享，获得过Kaggle……

shadowrocket 2026年1月25日

0

小火箭

Llama核心团队大面积跑路14人中11人出走Mistral成主要去向

在继 Llama 4 模型被爆出实际性能与宣传不符，在测试集上进行训练的「丑闻」之后，Meta 近期又被爆出其 AI 团队的近八成员工已离职。据 businessinsider 报道……

shadowrocket 2026年1月25日

0

小火箭

吴恩达如何在人工智能领域打造你的职业生涯

以下文章来源于腾讯研究院，作者吴恩达腾讯研究院 . 腾讯公司设立的社会科学研究机构，依托腾讯公司多元的产品、丰富的案例和海量的数据，围绕产业发展……

shadowrocket 2026年1月25日

0

小火箭

刚刚北大校友LilianWeng自曝公司首个产品一篇论文未发估值却已90亿

或许，这就将是公司即将打造的第一个爆品？这个产品所揭示的理念，可谓十分惊人—— 在训练过程中，研究人员可以直接用它来手动调整所有的超参数了！ Lili……

shadowrocket 2026年1月25日

0

小火箭

Qwen306B能击败Bert吗

作者：惧怕滴小白，知乎： https://zhuanlan.zhihu.com/p/1906768058745349565 01 Changelog 新增 Qwen3-0.6B 在 Ag_news 数据集 Zero-Shot 的效果。新增……

shadowrocket 2026年1月25日

0

搜索内容

最新对话吴恩达评AIAgents现状

时隔六年互联网女皇340页AI猛料刷屏大佬熬夜头秃

HappyLLM项目正式发布一起快乐学习大模型

从零开始200行python代码实现LLM

TextDiffusion来了

RAG挑战赛冠军方案解析从数据解析到多路由器检索的工程实践推荐阅读

Llama核心团队大面积跑路14人中11人出走Mistral成主要去向

吴恩达如何在人工智能领域打造你的职业生涯

刚刚北大校友LilianWeng自曝公司首个产品一篇论文未发估值却已90亿

Qwen306B能击败Bert吗

节点推荐

标签

热门文章