这个系列会阶段性的分享一些读到的、看到的优秀的内容,以及一些思考,希望对你有帮助。

1、8月24日,李沐在母校上海交大进行了一场1小时的演讲,确实听下来挺有共鸣的
先介绍下李沐:上海交大2011届计算机科学与工程系本硕系友。曾担任亚马逊资深首席科学家,任加州大学伯克利分校和斯坦福大学的访问助理教授,是前Marianas Labs联合创始人。他的研究关注分布式系统和机器学习算法,发表了50余篇人工智能顶级会议论文,在CMU读博期间更是两年内发表了理论计算机领域的FOCS、神经网络领域的NIPS、数据挖掘领域的KDD和操作系统领域的OSDI等不同领域的顶级国际会议一作论文。他是深度学习框架Apache MXNet的创始人之一,合著了开源深度学习教材《动手学深度学习》。目前是BosonAI的联合创始人。B站有80w粉丝,很多AI领域的学生都看过他的视频。
再说下这个讲座,我觉得比较精彩的两个地方是:第一,是他仅仅用了了30分钟,他就从硬件、算法、到数据,甚至是带宽详细拆解了目前大模型的瓶颈所在,从文本、到音乐、到图像、到视频,AI不同领域的应用也做了非常客观的解读,从原理上解释,破除了很多媒体营销号上夸张的宣传。第二呢,分享打工、读博、创业这几段经历的思考,并且给年轻人很多建议。相比之前在知乎上凡尔赛的文章(下面会附上),这个分享其实非常有诚意了,说了很多真心话,强烈建议看下原视频,如果不是技术背景的朋友,可以看后半段。
几个观点:
1)评估是解决任何实际问题的50%的事情,评估不等于打榜,各种大模型评测榜单上表现好的,综合体验下来可能并不尽如人意。评估打榜现在更多成为宣传手段了,但企业不能自己骗自己,能有更好的评估方法,对大模型能力提升会有更好的帮助。
2)AI写代码,在他认为目前能代替程序员一小时内完成的复制粘贴工作,距离解决复杂问题,还差很远。
3)预训练模型的重要性正在转变为一个工程问题,而非单纯的技术问题,比如花在数据准备上的时间和资源,可能远远大于训练。
4)硬件层面,李沐重点提到了带宽对分布式训系统的影响,这点确实不常被关注。
以下是现场的一些PPT截图:






两个原文:
李沐在知乎的凡尔赛文章(看似在讲困难,实际是在赤裸裸的炫耀啊~):创业一年,人间三年 – 知乎 (zhihu.com)
李沐在交大的分享视频:杰出系友面对面|李沐讲座:大语言模型的实践经验和未来预测_哔哩哔哩_bilibili
2、碳基和硅基生命的融合
马斯克的Neuralink 第二名试验患者已经能打CS了,还能还CAD。
这名患者说:“现在我左右看就能让人物到处跑,不再需要用 Quadstick 左右移动了,这实在是太棒了……我看哪里,它就能指向哪里。这太神奇了”
马斯克脑机接口的愿景是让 AI 与人类融合,这也是我对于未来的预测,碳基生命和硅基生命融合,可能是我们文明长期发展下去的唯一路径。
原文地址:马斯克Neuralink受试者玩起了CS,还能画CAD,机械飞升还远吗? (qq.com)
3、看了一个江南春在周鸿祎直播间里现场分享广告词怎么写,意思都懂,但能用他这样精炼、生动的语言表达出来还是非常厉害:
1)广告语是选择你不选择别人的理由,是营销战略的浓缩。
2)一个好的广告语:顾客要认、销售要用、对手要恨。(非常精辟)
我建立了一个分享AI资讯、知识、工具等信息的社群(目前超过几百名群成员),现在还是免费加入,我也会经常发一些福利,比如一些工具的体验权限等。如果你想加入,请加我的微信:aipcz1900
