🚀 每日科技速递 - 2026-03-13

过去 48 小时里,开发者社区对大模型可靠性、科研质量和产品话术的质疑明显升温,相关讨论几乎包揽了 LLM / Agent 板块最高分。与此同时,Gemini 手机任务自动化、Gumloop 与 Wonderful 的大额融资,把“AI Agent 从 demo 走向组织级部署”这条线推到台前。开源生态则继续保持高频迭代,Cherry Studio、Transformers、TensorFlow 冲上热榜,OpenClaw、LangChain、vLLM 等项目同步发版。

🧠 LLM / Large Models

• 🔥16 | 机器学习社区里一条高分讨论直指“别再神化大厂和名校”,核心是在反思研究注意力是否过度集中到品牌与机构,而忽略了独立复现、工程质量和真实贡献。原帖 [Reddit r/MachineLearning, 242↑]

• 🔥14 | 另一条热门讨论指出一篇 ICML 审稿论文几乎像是“整篇由 AI 拼出来”,把学术评审里的人机边界、审稿负担和研究可信度问题再次顶上台面。原帖 [Reddit r/MachineLearning, 120↑]

• 🔥11 | 围绕 GPT-5.4 与 GPT-5.4-Pro 在 MineBench 上表现差异的实测帖走红,社区开始更细颗粒度地比较“同系列不同档位模型”在真实任务里的稳定性与性价比。原帖 [Reddit r/OpenAI, 218↑]

• 🔥10 | “The plan is to make you dumber so you have to rely on it” 这条高互动帖子,集中反映了用户对 AI 产品设计、依赖性和潜在“话术化交互”的不安。原帖 [Reddit r/ChatGPT, 1971↑]

• 🔥10 | 另一篇热帖试图把最近的模型争议从情绪宣泄拉回到“只看事实”的讨论框架,说明社区正在主动建立新的评估语言。原帖 [Reddit r/ChatGPT, 6228↑]


🤖 AI Agent

Read more »

#INFO5990/week3

INFO5990 Week 3 Tutorial 总结

一、Tutorial 目标

Week 3 tutorial 主要围绕 组织(organization)商业(business)、以及 IT 如何服务组织目标 展开。

这周的重点不是技术实现本身,而是帮助学生建立一种更“职业化”的视角:

  • 组织是如何运作的;
  • 不同组织结构会如何影响沟通、决策和 IT 配合;
  • IT 投资为什么不能只看成本,而要看它是否能真正创造组织价值;
  • IT 专业人士为什么必须理解 business model 和 operating model。

从课程定位来看,这一周是在训练学生:

不要只把自己当成“做技术的人”,而要学会从组织、业务和价值创造的角度看 IT。


二、Learning Outcomes 对应理解

Read more »