1月10日,中国初创公司DeepSeek推出了第一个AI聊天机器人DeepSeek-R1。西方股票市场对恐慌反应:一天之内,将近$ 1TN从纳斯达克综合指数中消失了,而Nvidia的股价下跌了美国历史上最大的股价下跌。但是,为什么在一个已经挤满了Openai,Google和Microsoft的产品的领域中推出了另一个AI聊天机器人?
“它的成本仅为一小部分:培训花费了600万美元,而Chatgpt花了超过1亿美元”
答案的一部分在于地缘政治背景。美国试图防止中国进入最强大的计算机芯片,以减少中国不断发展的技术领域。中国公司尚未掌握制造这些复杂芯片的技术,这些芯片已在诸如Chatgpt之类的西方AI模型中广泛使用。许多人认为这些强大的设备是任何成功的AI大型语言模型(LLM)的要求。但是,DeepSeek的出现从水中吹出了这一假设。
DeepSeek基于较慢的NVIDIA H800芯片组,这些芯片集仍被允许出口到中国,而不是西LLM中使用的更强大的H100芯片。但是,它的性能仍然像Chatgpt这样的模型一样,甚至更好。为了将樱桃放在蛋糕上,它的开发成本的一小部分:训练花了600万美元,而Chatgpt则超过1亿美元。
“这是美国政策的明显失败点”
西方政府和公司都担心,但出于略有不同的原因。这是美国防止中国高科技行业发展的政策的明显失败点。它甚至可能适得其反。面对缺乏强大的芯片组,DeepSeek被迫创新他们的模型,以减少记忆使用。对于目前的大型击球手(例如Openai),不仅是中国公司担心的竞争的前景,而且对DeepSeek模型的低训练成本却蒙蔽了双眼。
尽管这听起来可能是一件好事,但这确实表明,在培训Chatgpt上花费的资金中约有95%是浪费。投资者将不再为无法证明其高昂成本合理的AI模型提供资金,因此他们将被迫降低成本,否则将其留在灰尘中。另一个问题是,因此,为了急于创新,AI安全将受到损害,而支持开发更快,更强大的模型。但是,该领域的竞争增加可能对像我们这样的消费者来说是积极的,而AI模型的成本较低,使他们的收益变得更加易于使用。
未来是不确定的。如果西部AI制造商设法降低成本,同时仍在提高绩效,这可能只是他们对市场的控制权。但是,如果这很困难,我们可能会离开硅谷统治地位的时代。
想分享您对本文的想法吗?向我们发送一封信给[email protected]或使用此信件 形式。