“所有0和1我这辈子都没做,我做的全是看到美国人做了0和1,我做1×10、10×100的事。”开源中国董事长马越对第一财经表示。他认为国内的一些知名企业家做的也是类似的工作。
马越是一位在科技领域闯荡多年的老兵。DeepSeek以及人工智能的进展,让他感慨新一代的科技创业者,更可能做出从无到有的创新性工作。
人工智能正在开启大航海的时代,没有人手里有明确的航海图,但年轻创业者们更有冒险精神。“ag凯发_凯发一触即发看现在的大模型公司,谁家的研发团队大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界、权威、层级很多,它的研发效率多半比较慢的。”MiniMax副总裁刘华也说。
炮灰的觉悟
马越生于中国改革开放之前,既经历过中国的贫困时期,也见证过中国的经济腾飞。
尽管他是一位连续的创业者,而且在科技企业里有所成就。但他回头看自己的过往,他这一辈人从小受的教育的经历等,塑造了他的工作方式。马越自我调侃“也就这么点出息,没有想象能力”。
在科技领域,想象力与创造力紧密相关。那些科技发展历程中颠覆性的创新,比如半导体、计算机图形界面、智能手机以及大模型等,都是从美国市场上走出来的。
马越认为,一些国内知名的企业家,做出的也不是开创性的工作,而是摸着石头过河。过去二十年间,中国市场上风生水起的搜索、电商、云计算等概莫能外。
这一轮的大模型浪潮,OpenAI珠玉在前,但DeepSeek是中国创业者带来的惊奇。
DeepSeek一夜之间给美国股市造成万亿美元的蒸发。它以史上最快的速度触达了上亿用户,B端的企业投入开源模型的怀抱。它也改变了很多大模型企业的发展道路。
OpenAI在考虑某种形式的开源,百度也摒弃闭源道路,转而选择开源其最新的大模型产品。
一些初创型科技企业,此前融资数亿,购买算力卡,训练自己的模型,在尚未成功之际发现DeepSeek以一种更具性价比的方式实现了更优的模型性能。关键是,DeepSeek开源,任何企业都可以学习模仿,并在此基础上二次开发。
大模型公司的估值和融资机会,因此受到DeepSeek的压制。
“过去的估值都建立在做这件事必须投大钱的基础上,因为起手的目标融资10亿美金,你不给我100亿美金估值都不行。”一家投资机构的合伙人认为,现在融资会变得更难了,“大家觉得你不需要几十亿美金,10亿美金是不是就行了,几亿美金是不是也能干得不错。”
科技创新的代价一直很高。一些大模型企业此前为研发、预训练而做的巨大投资,面临迅速贬值。
“中国本身这种沉没成本就是巨高。”马越说:“今天的积累都是给年轻人做土壤,ag凯发_凯发一触即发变成炮灰。产业烧了几百亿,可能最终成就的是DeepSeek这样的公司。没有一点问题,我乐见其成。”
OpenAI没有出现在谷歌,也不是诞生于亚马逊。DeepSeek并非产生于腾讯或者阿里巴巴。
马越认为,颠覆式的创新,大厂很难。国内大厂习惯了拿来主义的路径依赖,内部是职业经理人的思维,“我完成 KPI还不简单,写PPT就完了,我跟自己较什么劲?彻底的创新这件事儿,大厂员工背着免责盾牌搞创新,拳头根本挥不开。”
新一代的科技创业者,更可能做出0-1的、从无到有的创新性工作。
“至少比ag凯发_凯发一触即发这代人靠谱得多了。”马越表示:“因为ag凯发_凯发一触即发穷,没想象力。年轻人现在不应该这样了。”
大模型创新靠谁
中国大模型向前发展,推动力是什么?
“ag凯发_凯发一触即发认为依赖于高度组织化精细化的研发团队,它绝对不仅仅依赖于学界权威、院士、教授、博导。”刘华说。
MiniMax是大模型六小虎之一,它的产品已经开始落地海外20多个国家,是中国地域覆盖范围最广的大模型开放平台。
2017年,谷歌几位员工提出Transformer架构。大模型刚出现的时候,是以Transformer为底层架构的稠密模型。但是经过八年发展,企业界认为Transformer碰到了它的瓶颈。现在企业在探索非Transformer架构,稠密模型已经被逐渐放弃,MoE(混合专家模型)成了共同的选择。
“Transformer处理任务的长度跟它的算力消耗程度是成平方的关系。比如我现在处理100Token任务的算力消耗是一个恒定值。如果处理10000Token的任务,处理的任务增加100倍,算力消耗要增加100的平方,一万倍。”刘华说。
随着多模态的发展,大模型处理Token的规模远不止百倍增长,将来可能是万倍。大模型解决超长文本处理能力,需要研发新的模型底层架构,MiniMax选择的是线性注意力机制,其新一代的MiniMax-01模型,可以做到基本性能和GPT4o、Claude3.5齐平,但是能够处理400万Token的长文本,是4o和Claude3.5的20倍、30倍。
MiniMax在2023年拥抱MoE架构。大模型研发的底层框架迭代,MiniMax的经验是,要去聘用年轻的研究员,给予充分的授权,让他们敢于尝试新的思路,让他们用充沛的算力做大量的实验,才可以敏锐地捕捉到大模型迭代的方向。
刘华表示:“现在的大模型公司,如果谁家的研发团队是大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界权威、层级很多,它的研发效率多半是比较慢的。”
马越认为,中国传统文化里缺少对年轻人的尊敬,更不必提敬畏了。老一辈的人都是基于功利主义,而年轻人的价值观跟过去不一样了。
“DeepSeek是一个年轻的团队打造的,少年强则中国强。ag凯发_凯发一触即发这种年过半百的封建残余,满脑子的旧认知,一天到晚吹牛也好,抱大腿也好。”马越说,“你得有觉悟,ag凯发_凯发一触即发这一辈子到今天是给年轻人当梯子的。”
人工智能拉开了一个大航海的时代,年轻人是更好的冒险者。
“新大陆在哪儿,ag凯发_凯发一触即发不知道,每条海岸线都是迷雾。所有的旧认知都没价值,ag凯发_凯发一触即发没有罗盘,也不知道自己的方向在哪里,也不知道终点在哪里,所以它才有意思。”马越表示。
成人🔞免费漫画黄品汇 | 2天前 |
美女私密㊙️调教81网站 |
宵宫被❌喷水自慰爽 | 4天前 |
18🈲乳液啪啪免费软件 |
动漫小说被❌爽🔞巨乳视频 | 7天前 |
卡夫卡被狂揉下部❌ |
班花撩起我的🍌蹭来蹭去小说 | 7天前 |
脱裤子❌打屁屁游戏 |
疯狂❌自慰羞羞动漫 | 5天前 |
同性男同yaoi❤♂疯狂做小说 |
男c女🔞黄㊙️❌打睾丸动漫 | 5天前 |
甘雨女被❌🐻黄漫扒衣服动漫 |
被爆🌿17禁止🚫久久影视 | 3天前 |
18🈲白浆自慰 |
美女裸体㊙️无遮挡壁纸 | 8天前 |
扒开美女❌狂揉❌拔萝卜3D |
美女被❎免费网 | 7天前 |
精品㊙️无码 |
亚洲熟妇色❌❌❌❌APP | 7天前 |
JJ❌X |