小火箭节点
-
最新对话吴恩达评AIAgents现状
前几天,吴恩达与 LangChain 联合创始人 Harrison Chase 展开了一场对话,而这场对话的背景,正是当前 AI 领域既充满机遇又挑战重重的一个现实。 原视频链接:…… -
时隔六年互联网女皇340页AI猛料刷屏大佬熬夜头秃
互联网女皇、传奇投资者Mary Meeker,再度出山! 曾经,女皇的《互联网趋势报告》一出,整个科技圈都要抖三抖。硅谷大佬觉都不睡了,都要连夜研读这份刷屏圈内…… -
HappyLLM项目正式发布一起快乐学习大模型
开源初心 很多小伙伴在看完 《self-llm:开源大模型食用指南》 后,感觉意犹未尽,想要深入了解大语言模型的原理和训练过程。 于是我们就从去年密谋到现在,决…… -
-
TextDiffusion来了
相比AR的建模方式,Diffusion建模有三个优势: 并行推理,速度可以快好几倍 双向上下文建模,避免reversal curse [2] 同样可以做到test-time scaling 但是…… -
RAG挑战赛冠军方案解析从数据解析到多路由器检索的工程实践推荐阅读
以下文章来源于ChallengeHub ,作者ChallengeHub ChallengeHub . 由互联网大厂和中科院研究所的算法数分小伙伴们创建,热爱竞赛知识分享,获得过Kaggle…… -
Llama核心团队大面积跑路14人中11人出走Mistral成主要去向
在继 Llama 4 模型被爆出实际性能与宣传不符,在测试集上进行训练的「丑闻」之后,Meta 近期又被爆出其 AI 团队的近八成员工已离职。 据 businessinsider 报道…… -
-
刚刚北大校友LilianWeng自曝公司首个产品一篇论文未发估值却已90亿
或许,这就将是公司即将打造的第一个爆品? 这个产品所揭示的理念,可谓十分惊人—— 在训练过程中,研究人员可以直接用它来手动调整所有的超参数了 ! Lili…… -
Qwen306B能击败Bert吗
作者:惧怕滴小白,知乎: https://zhuanlan.zhihu.com/p/1906768058745349565 01 Changelog 新增 Qwen3-0.6B 在 Ag_news 数据集 Zero-Shot 的效果。新增……


