拾月周刊(第15期):停止担心并学会热爱人工智能
这是拾月周刊第15期,标题仿自第一篇文章。总体而言,这周看了不少人工智能与科技史相关的内容,其中有几篇旧文,标题后的数字是发表年份。
最近两期都是围绕特定主题阅读,有两个感受:
- 需要主动检索信息,能找到一些历久弥新的旧内容。
- 能在不同文章之间发现联结,串起不同的知识和观点。
这种感觉很美妙。
人工智能与科技史
这部分共5篇内容,除木遥的播客是最近的内容,另外4篇都是2019年以前的,最早的一篇是1999年的。
How to Stop Worrying and Learn to Love the Internet - Douglas Adams / 1999
《银河系漫步指南》的作者Douglas Adams在1999年写的文章(2年后的2001年去世了),很有洞见的文章,最近AI带给人的震撼估计与1999年互联网类似,并且未来回顾历史,当下的AI产生的影响也很可能与20世纪末互联网技术带来的影响相当,甚至更大。
文章核心观点已经体现在了标题当中:停止担心并学会热爱互联网。非常适合当下AI时刻重读。
摘录一段如下:
- 你出生时就已经存在的事物,你会习以为常。
- 出生后到30岁前,出现的新发明,会让你兴奋,运气好的话,可能还会成为你的职业。【想想80后、90后的互联网行业从业者】
- 而任何在30岁后出现的新发明,都是违背自然规律的,是文明的终结者,直到新发明存续10年以上,会发现它并没有那么可怕。
从人的适应性角度,让我想起罗曼·罗兰一句名言:「大多数人在二十岁或三十岁就死了,他们变成自己的影子,往后的生命只是一天天不断地复制自己。」
此外,目前ChatGPT的价格不便宜,性能却一般,应用场景也不多,所有这一切也和当初的互联网一样,同样也会有后来的互联网一样,未来AI服务将变的非常强大且易于获取、价格便宜。
木遥播客居然更新了,距离上次一年多。这期讲了最近大热的AI,大部分内容在其微博中都有涉及。对我来说的一些新知识点:
- 社会价值排序。同样赚很多钱,漂亮主播的社会认可度不如高知人士,对「聪明」的推崇是工作革命之后产生的(因工业革命后,某种程度上聪明人产生的社会价值更大),是一种观念。如果AI能替代知识工作,反而是格雷伯所说的照料类工作不容易被替代,价值序列将重排。
- 接受一种革命性的新技术,可能需要两代人。木遥举了1840年,英国打过来了,文官阶层肯定也知道工业革命的厉害。但科举制度直接到60年后才取消。这是因为到孙子辈,是浸润在新技术下成长起来的,且无历史包袱,才有魄力去革新。【与上面那篇讲到一块了】
The History of Artificial Intelligence - Rockwell Anyoha / 2017
Harvard网站上一篇2017年发布的,关于人工智能历史的简述文章。内容不长,但历史的关键节点都覆盖到了,并且有比较多的高质量外链引用,方便深入了解。
比如:
- 图灵1950年提出著名图灵测试的论文《计算机器与智能)》
- 表达早年计算机很贵(制约了AI发展)给了一篇干货《Early Popular Computers, 1950 - 1970 - ETHW》,有很多早年计算机型号介绍及价格信息。
- 著名的《Logic Theorist - Complete History of the Logic Theorist Program》
等等。
人工智能教父Hinton怼战记 - sayonly / 2018
杰弗里·辛顿(Geoffrey Hinton)被誉为「深度学习之父」,本文介绍了深度学习在人工智能研究领域从非主流到主流的转变以及辛顿的一些故事。
文中提到神经网络被置疑的三点:
- 缺乏理论:黑盒子,不可解释
- 不能推理:ChatGPT现在已经出现了CoT(Chain of Though)能力
- 生物学不成立:NN用的是BP,而大脑神经元连接权重的变化是基于STDP。
前两条在很多文章中看到过,第3条倒是第一次听说,非常的技术。
在讨论「缺乏理论」的置疑时,作者用了「数学与物理」的关系作为比较。历史上,很长时间数学理论都走在物理的前面,但到了近代,物理反而走在数学前面,一些物理的研究催生新的数学进步。
对神经网络的研究,谁说不会呢?
关于神经网络的成功,有一个推到极致的猜测:人的智慧,底层能力不是理性(推理相关能力),而是模仿。
The Bitter Lesson - Rich Sutton / 2019
2019年的旧文,作者Rich Sutton是一位计算机科学家,同时在DeepMind供职。
关于人工智能,曾经有过路线之争:在系统中加入人类的知识规则 vs 纯统计与计算实现智能。
本文的核心观点是,要从历史中吸取教训,给AI加入人类规则在短期内虽然有效,但长期来看,只要算力得到突破,加入的人类经验规则,无足轻重。
GPT模型技术拆解
这两篇,也可认为是历史,是ChatGPT的技术细节史。
GPT-3是2020年6月发布,ChatGPT是22年11月底发布,中间有2年多时间,本文即通过公开信息,对OpenAI这两年工作进行了梳理和推测,GPT-3是如何一步步演变为让人惊艳的ChatGPT的。
本文介绍突现能力(另一个常见翻译是涌现能力)。
文中有提到知识,ChatGPT是没有外挂知识数据的,即所有的知识都存在于模型之中,而模型之中,就是1750亿个参数。也即,世界知识被大模型隐式的储存在了1750亿参数中,这和人类知识被隐式的存储在神经元中非常类似(抽象层面)。
随便看看
Advice to young critics - Matt Zoller Seitz / 2014
如果写影评:
- 多看,包括老电影,了解电影史
- 看的时候,随时记录冒出来的想法
- 学习历史和心理学,电影涉及最多的两个主题
- 每天写两个小时,无论是否发表
非常有趣的实践,Neverland把苹果服务上的数据全部导出存档,同时研究苹果收集了哪些数据。
工具资源
一次本地免费过滤RSS的尝试:NetNewsWire - UNTAG
我正在用NetNewsWire作为主力RSS阅读器,刚好有过滤文章的需求,找到这篇文章,它使用AppleScript实现文章过滤需求,将命中特定关键词的文章直接标记为已读,间接实现过滤。
文中代码直接使用可能报错,需要结合自己的订阅进行适当修改。我还在研究当中,尚未形成完善的过滤能力。
就好像90年代末,国人用电脑和互联网创业起步一样,今天我们如何抓住AI这个创业风口,用AI去解决部分人的需求。
机会确实很多,而且很多人已经赚了第一桶金。
但同时也会发现,在这波AI中赚第一桶金的人,如果在互联网初期,也会赚到第一桶金。
某种程度上,与时代机遇无关,与人有关。