OpenAI带动大模型火了,很多公司开始搞自己的大模型,甚至很多大模型创业公司如雨后春笋展露出来,对于他们的执行力,表示佩服,但正如我所说,尊重但不看好。
作为一个无足轻重的人,我说这大话应该也无伤大雅,权当自己的思考记录罢了。
为啥不看好?我有3点看法:
-
大模型创新成本奇高(我说的是真的自己做,不是拿开源套壳),AI基本三元素:算力、算法、数据,既然自研大模型,算法就是站在前人肩膀上创新,数据可以使用开源、自有、爬取、蒸馏其他模型等,但算力,就是自己实打实的 GPU,虽然算法创新可以让算力要求下降,但目前来看大模型的研发基本的算力门槛是很难平易近人的,23年初我给部门做分享时曾了解过,GPT3.5 动用了上万 英伟达当时最新 GPU 跑了几个月,这投入成本、时间成本、人才成本都不是一般的创业公司可以尝试的。并且这事情还不能靠着给云服务花钱就能解决,因为云服务公司也要搞自己的大模型,他们可以提供的资源也非常有限,尤其是,在ChatGPT 火起来之前,其实大家对于GPU的关注度并没有那么高,很多公司/云平台都没有太多投入,再加上现在政治管控受限,这方面算力资源十分紧俏,等你解决了,其他大公司又出现更牛的大模型了,创业永远处于追赶的位置,可不是个好事情;
-
大模型的收益并不明朗,大模型很可能是一个赢家通吃的服务,因为 LLM 这个东西是一个通用模型,而非个性化定制的模型,最智能的模型会被所有人蜂拥使用,其他服务可以快速切换到自己想要的大模型API,这样的情况会导致两个问题:
- 赢家通吃,最好的几个模型可能占据市场大部分利润,其他模型捡漏都不容易;
- 拼杀严重,虽然AI智力可能在未来一段时间一直持续上升,但行业的竞争愈加激烈,当产品差异较大的时候,是品质、产品的竞争,但在产品同质化、标准化的市场,就可能变成价格战的竞争;
以上可以推测,大模型创业公司很可能在一路追赶的过程中越来越失去希望。
-
壁垒模糊,从AIGC、Stable Diffusion 的发展我看到了一个情况,保密可以建立一时的优势,但很难长久保持,这个行业发展太快了,尤其是大家都开源的情况下,形成了一种全球行业范围的创新协作潮,你会发现,这个行业要么开放开源,要么靠着保密/闭源,来建立一点点优势,但在AIGC 方面看到了开源挑战闭源 甚至 挑翻了闭源的情况(比如SD 生态 对于 MD),大模型领域也有 Meta 开源,不知道Meta 及各种开源模型生态环境是否可以挑战 OpenAI 和 Claude 等。不论结果如何,我们发现开源是有一定攻势的,并且,我们可以预测,随着行业老大、老二真正开始大量盈利,绝对会有人对这门生意动心,即使不是开源挑战,也会出现个CloseAI来挖人才去挑战,会过来想想,在如此高度协作的研发创新时代,靠着几百年前「东家保密方子」的方法建立壁垒说多么不可靠,随便一次涨薪就可能挖走你的「方子」;
当然,虽然不看好,但越来越多的公司去研发大模型,对于推动大模型的发展肯定是有贡献的,而这种贡献都可能让AI的智力提升,都是一次创新探索,有助于全人类的AI发展,即使失败,也值得我们尊重。