-
对YouWare创始人明超平3小时访谈:今天Agent像大猩猩刚拿起一根烧火棍。From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-05-28 23:30
The guest today is Ming Chaoping (Xiao Ming/Leon), an AI application entrepreneur. In 2024, the AI narrative was still about large models. *Commercial Interview* interviewed Yang Zhilin, Wang Xiaochuan, Li Kaifu and other founders of large model companies. In the blink of an eye, the AI narrative in 2025 has become about application companies and Agents—**a new protagonist has appeared.** This episode, like the previous "3-Hour Interview with Xiao Hong, Founder of Manus: The World is Not a Linear Extrapolation, Be an Important Variable in the Game", **also comes from the front lines of "AI application explosion" and "Agent explosion."** In China's venture capital circle, Ming Chaoping is an entrepreneur who has received relatively consensus capital support from the very beginning. Born in 1995, he has worked on products at OnePlus, ByteDance, and Moonshot. This is his first time as CEO, and the first product he launched is called YouWare. He has some connections with our previous two guests: one is Yang Zhilin. In 2023, he had an in-depth conversation with Yang Zhilin for 10 hours, from day to night, and decided to join Moonshot after the conversation. The other is Xiao Hong. Sometimes I hear people in the venture capital industry compare Xiao Ming and Xiao Hong, saying that they both belong to **"Hands-on, product-oriented entrepreneurs."** Is this the case? Today's 3-hour interview hopes to present Xiao Ming's true state. Whether it is true is up to everyone to decide. However, although they are often associated, Xiao Hong and Xiao Ming have never met. Looking forward to 2025, we will progress together with AI : ) Our podcast is premiered on Tencent News, you can go and follow us, so you can get program information and more news as soon as possible : ) 03:16 Quick Q&A; begins **Those scattered, rebellious, and frustrating teenage years** 04:36 Childhood and teenage fragments 06:52 I debated at Wuhan University, especially good at the fourth speaker 13:00 The most important thing I learned from debating: **"Always have a third-party perspective, debating is not about convincing your opponent," "Turn yourself into an idiot in 1 second" (by Zhang Xiaolong)** 14:40 I basically slept in the lab for the last two years of college, immersed in the "Intelligent Vehicle Competition" and won the national prize 19:43 **Oh, so miserable, a painful experience - I was the team member who lost the most competitions and also won the most best debater awards** 23:06 That was the senior's retirement match, and I still feel very guilty today **The first three stops on the road to product manager: OnePlus, ByteDance, Moonshot** 26:37 First stop on the road to product manager: OnePlus mentor took us to take the subway and go shopping 30:18 "Experience is not data": Battery life data and battery life experience are not equal. 95-100% and 0-5% battery level are the times when users are most sensitive and anxious about the experience. 33:58 Second stop on the road to product manager: I was very uncomfortable when I first went to ByteDance and felt like I was a rookie 37:42 **What are the disadvantages of ByteDance's product methodology? "It will wipe out many flashes of inspiration"** 39:35 "Data is the 'rearview mirror of driving', but it cannot guide you forward" 41:03 **ByteDance doesn't have Steve Jobs, ByteDance doesn't have Zhang Xiaolong, but ByteDance has Yiming** - Yiming has talked to some very small startup teams. 42:08 What do you think of the fact that many entrepreneurs have emerged from ByteDance in recent years, but none have achieved great success? 43:28 **I talked with Yang Zhilin for 10 hours in 2023**, talking about music, art, hobbies, products, and past experiences. It was really 8 pm when we were going to eat pizza, and I said, "Why don't you tell me about the technology?" 50:14 The popularity and sudden stop of the overseas product Noisee 01:03:03 ByteDance was able to become ByteDance because it coincided with several important variables of the times (the popularity of mobile devices, bandwidth speed, recommendation engine) **Jump off the big ship and start a business!** 01:05:05 Immediately encountered the bitter lesson 01:11:59 The instinct to carve patterns, uncontrollably giving it more scaffolding, you will run counter to the biggest variable of this era 01:12:45 Suddenly realized that something was wrong - the product was stopped before it was launched 01:13:18 Insomnia epiphany: **One of the key indicators in the AI era is "token consumption speed", and we must pursue "per token valuation"** 01:16:33 **The "shell" is underestimated, it should be called "container" and "environment"** (the environment is the reactor of people) 01:17:52 It is quite irresponsible to only give users a Chatbot input box 01:21:18 Today's Coding development is similar to Camera in those days. In the early days, talking about cameras was about "people holding SLRs." The huge change was the emergence of a new group of people - "mobile photographers" 01:23:50 The early trend variable is the emergence of a new group of people, with rapid growth. **Today's new group of people is "Vibe Coder"** 01:25:23 Is Anthropic playing the role of Sony today? Other startups spend time on Camera/base models, or on - with the iteration of Camera, Snapchat, Instagram, TikTok, TikTok Live appeared **Today's Agent is like a gorilla just picking up a burning stick** 01:37:12 Two possible future ecosystems for Agents: analogous to Singapore vs. the United States 01:40:44 Page rank becomes Agent rank 01:42:07 If you turn all to C companies into to B companies, you will be resisted by everyone 01:44:02 The network effect of Agents 01:46:02 We also want to become OS Agent! - The path doesn't tell you : ) 01:46:30 I said to the team: **"99.9% of us are going to die"** 01:46:57 Today's Agent is like a gorilla picking up a stone and starting to smash things 01:47:58 "Always believe that the Model will get better, always believe that the Model has nothing to do with you" 01:49:50 The underlying model is creating smarter people, and application companies are adapting to our production needs through environment/experience 01:53:54 The OS Agent I envision: it is alive 01:58:26 Agents will next appear like tribes in human society, encountering trust issues, and needing ID cards and password locks 02:03:33 Observations on AI technology and products in the past 2 years (consuming tokens and squeezing intelligence in a more efficient way) **First time as CEO** 02:14:50 Provide emotional value to your employees 02:19:53 Post-90s founders are more confident, more free and easy, and more rebellious 02:21:17 Fundraising is booming, but I feel like I'm walking on thin ice 02:23:35 Consciously fighting against Ego 02:33:45 Chess player and the person playing chess 02:36:57 Final quick Q&A; Related episodes: Talking with Yang Zhilin about the year of large model entrepreneurship: the increment of human ideals, the probabilistic non-consensus, and Sora Talking with Wang Xiaochuan about the year of re-entrepreneurship: Responding to Zhu Xiaohu and the third possibility of China's AGI Talking with Li Kaifu: What should we do if the United States forms an AGI hegemony? 3-Hour Interview with Xiao Hong, Founder of Manus: The World is Not a Linear Extrapolation, Be an Important Variable in the Game 【More Information】 Contact us: Weibo @张小珺-Benita, Xiaohongshu @张小珺 For more information, please follow the official account: 张小珺
Original title: 101. 对YouWare创始人明超平3小时访谈:今天Agent像大猩猩刚拿起一根烧火棍
Original description: <figure><img src="https://image.xyzcdn.net/Flo18nNUSP7OUNlTf8UgCdHxio6O.jpg" /></figure><p>今天的嘉宾是明超平(小明/Leon),一名AI应用创业者。</p><p>2024年的AI叙事还是大模型,《商业访谈录》访谈了杨植麟、王小川、李开复等大模型公司创始人;稍一转眼,2025年的AI叙事已然变成应用公司和Agent——<strong>新的主角登场了。</strong></p><p>这集节目和往期<a href="https://www.xiaoyuzhoufm.com/episodes/67c3d80fb0167b8db9e3ec0f" rel="noopener noreferrer nofollow" target="_blank">《对Manus创始人肖弘的3小时访谈:世界不是线性外推,做博弈中的重要变量》</a>一样,<strong>也是来自一线“AI应用爆发”、“Agent爆发”的前沿声音。</strong></p><p>在中国创投圈,明超平是一位创业伊始就受到资本相对共识的创业者。他出生于95年,曾先后在OnePlus、ByteDance、Moonshot做产品。这是他第一次做CEO,发的第一个产品叫YouWare。</p><p>他和我们此前的两位嘉宾有一些渊源:一个是杨植麟,2023年他和杨植麟深谈了10个小时,从白天到黑夜,聊完决定加入Moonshot;另一个是肖宏,有时候我会听到创投业人士将小明与小红对比来聊,说他们都属于<strong>“Hands-on型、产品型创业者”</strong>。</p><p>是不是这样呢?今天的3小时访谈希望能呈现小明的真实状态,是不是大家说了算。</p><p>不过,虽然老被关联,小红与小明至今没见过。</p><p>期待2025,我们和AI共同进步:)</p><figure><img src="https://image.xyzcdn.net/Fm2F9n8vMm_n-xafqMi98xs3T3K8.png" /></figure><figure><img src="https://image.xyzcdn.net/FnQOGRhNOAkScnGSulOXQlc0KLhZ.png" /></figure><blockquote><p>我们的播客节目在<a href="https://view.inews.qq.com/u/8QIf3n5c64Ucuzne7gI%3D?devid=FF4E49E6-9C89-4986-A413-04E856F31262&qimei=766696f2cd8f313d744bc2c9000012918102&uid=100161026780" rel="noopener noreferrer nofollow" target="_blank">腾讯新闻首发</a>,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)</p></blockquote><figure><img src="https://image.xyzcdn.net/FvV-R5FBydYHGZAMyXAV1K1A9iJT.png" /></figure><p>03:16 开始的快问快答</p><blockquote><p><strong>那些散漫的叛逆的挫败的少年成长</strong></p></blockquote><p>04:36 童年和少年片段</p><p>06:52 我在武大打辩论,尤其擅长四辩</p><p>13:00 辩论让我学会的最重要的:<strong>“永远具有第三方视角,辩论不是说服你的对手”,“1秒钟把自己变成傻子”(by张小龙)</strong></p><p>14:40 大学后两年基本睡在实验室里,沉浸式打“智能汽车竞赛”,拿了国奖</p><p>19:43 <strong>哎,好惨,惨痛的经历——我是输掉比赛最多的队员,也是拿最佳辩手最多的队员</strong></p><p>23:06 那是学长的退役比赛,我到今天还很愧疚</p><blockquote><p><strong>产品经理之路的前三站:OnePlus、ByteDance、Moonshot</strong></p></blockquote><p>26:37 产品经理之路第一站:OnePlus导师带我们去坐地铁、逛商场</p><p>30:18 “体验不是数据”:续航数据和续航体验不划等号,95-100%和0-5%电量是用户对体验最敏感焦虑的时候</p><p>33:58 产品经理之路第二站:刚去字节极不适应,觉得自己很菜</p><p>37:42 <strong>字节产品方法论劣势是什么?“它会磨灭掉很多灵光一现的创意”</strong></p><p>39:35 “数据是‘开车的后视镜’,但它不能指引你前进”</p><p>41:03 <strong>字节没有乔布斯,字节没有张小龙,但字节有一鸣啊</strong>——有一些很小很小的创业团队,一鸣都聊过了</p><p>42:08 怎么看字节过去这些年出来了许多创业者,但无人大成?</p><p>43:28 <strong>23年和杨植麟聊了10个小时</strong>,聊音乐、艺术、爱好、产品、过去的经历,实在是到晚上8点我们要去吃pizza,我说“要不给我讲讲技术吧”</p><p>50:14 海外产品Noisee的走红与骤停</p><p>01:03:03 字节能成为字节,契合了时代几个重要变量(移动设备普及、带宽速度、推荐引擎)</p><blockquote><p><strong>跳下大船创业啦!</strong></p></blockquote><p>01:05:05 立马就遇到the bitter lesson(苦涩的教训)</p><p>01:11:59 想雕花的本能,情不自禁给它更多脚手架,你会和这个时代的最大变量背道而驰</p><p>01:12:45 突然意识到,这个东西不对劲——产品没上线就停掉了</p><p>01:13:18 失眠的顿悟:<strong>AI时代关键指标之一是“token消耗速度”,要追求“per token valuation”</strong></p><p>01:16:33 <strong>“壳”被低估了,应该叫“容器”和“环境”</strong>(环境是人的反应器)</p><p>01:17:52 只给用户一个Chatbot输入框,是蛮不负责任的</p><p>01:21:18 今天Coding发展和当年Camera类似,早期聊相机说的是“拿着单反的人”,巨大变化是出现了新的人群——“手机摄影师”</p><p>01:23:50 早期趋势变量是出现新的人群,增速快,<strong>今天的新人群是“Vibe Coder(氛围编程师)”</strong></p><p>01:25:23 今天Anthropic是不是承担索尼的角色?其他创业公司把时间花在Camera/基座模型上,还是花在——随着Camera迭代出现了Snapchat、Instagram、TikTok、TikTok Live</p><blockquote><p><strong>今天的Agent就像大猩猩刚拿起一根烧火棍</strong></p></blockquote><p>01:37:12 Agent未来可能的两种生态:类比新加坡vs美国</p><p>01:40:44 Page rank变成Agent rank</p><p>01:42:07 如果你把所有to C公司都变成to B公司,会受到大家的反抗</p><p>01:44:02 Agent的网络效应</p><p>01:46:02 我们也想成为OS Agent呀!——路径不告诉你:)</p><p>01:46:30 我对团队说:<strong>“咱们99.9%是要死掉的”</strong></p><p>01:46:57 今天的Agent像一个大猩猩拿起石头开始砸东西</p><p>01:47:58 “永远相信Model会变好,永远相信Model和你无关”</p><p>01:49:50 基础模型在造更聪明的人,应用公司在通过环境/经验适用我们的生产需求</p><p>01:53:54 我设想的OS Agent:它是活的</p><p>01:58:26 Agent接下来会像人类社会出现部落,遇到信任问题,需要身份证、密码锁</p><p>02:03:33 过去2年对AI技术和产品的观察(以更高效的方式消耗token、压榨智能)</p><blockquote><p><strong>第一次做CEO</strong></p></blockquote><p>02:14:50 给你的员工提供情绪价值</p><p>02:19:53 90后founders更自信、更洒脱、更叛逆</p><p>02:21:17 融资风生水起,我却感觉如履薄冰</p><p>02:23:35 有意识地对抗Ego</p><p>02:33:45 棋手和对弈的人</p><p>02:36:57 最后的快问快答</p><figure><img src="https://image.xyzcdn.net/FvVbUNblF7FHIjfdp3MmmbAdLZ8G.png" /></figure><p>相关单集:</p><p><a href="https://www.xiaoyuzhoufm.com/episodes/65e16b5b6144a933b1d968b5" rel="noopener noreferrer nofollow" target="_blank">和杨植麟聊大模型创业这一年:人类理想的增量、有概率的非共识和Sora</a></p><p><a href="https://www.xiaoyuzhoufm.com/episodes/65f77b6e6764957079e5d8eb" rel="noopener noreferrer nofollow" target="_blank">和王小川聊再创业这一年:回应朱啸虎与中国AGI第三种可能</a></p><p><a href="https://www.xiaoyuzhoufm.com/episodes/6730aa0bf373fe5d4d215d0c" rel="noopener noreferrer nofollow" target="_blank">和李开复聊聊:如果美国形成AGI霸权,我们应该怎么办?</a></p><p><a href="https://www.xiaoyuzhoufm.com/episodes/67c3d80fb0167b8db9e3ec0f" rel="noopener noreferrer nofollow" target="_blank">对Manus创始人肖弘的3小时访谈:世界不是线性外推,做博弈中的重要变量</a></p><p>【更多信息】</p><p>联络我们:微博<a href="https://weibo.com/u/6486678714" rel="noopener noreferrer nofollow" target="_blank">@张小珺-Benita</a>,小红书<a href="https://www.xiaohongshu.com/user/profile/5fede947000000000100603e?xhsshare=CopyLink&appuid=5fede947000000000100603e&apptime=1710049463" rel="noopener noreferrer nofollow" target="_blank">@张小珺</a></p><p>更多信息欢迎关注公众号:张小珺</p><figure><img src="https://image.xyzcdn.net/Fn7o36NtUYpCM_rQiFj1LW-TIwk8.JPG" /></figure>
-
对话梅赛德斯-奔驰全球CEO康林松:转型期CEO和转型之中的139岁梅赛德斯-奔驰From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-05-23 08:11
In late March 2025, Mercedes-Benz global CEO Ola Källenius visited China for 9 days, during which I interviewed him. Mercedes-Benz is the world's first company to invent gasoline vehicles and is now in the most significant period of transformation in its 139-year history. It can be said that **Ola Källenius is the "CEO of a transitional period" who is leading this critical transformation.** Born in Sweden in 1969, he joined Mercedes-Benz in 1993 and has spent most of his career there. Six years ago, in 2019, he became the global CEO of Mercedes-Benz. It is worth mentioning that he is the first non-German CEO in Mercedes-Benz history upon taking office. I talked with Mr. Källenius about **his key strategic decisions in the past 6 years (including luxury car strategy, electrification strategy), the successes and failures of the Chinese market, whether technological equality and luxury cars are paradoxical, and the most significant critical transformation in Mercedes-Benz history under his leadership.** What I want to present to you is a 139-year-old giant in transition. Our podcast program premiered on Tencent News. You can go and follow it to get program information and more news as soon as possible :) * **04:12 Part 1: Talking about the Chinese market** * What are your most important views on the Chinese market in the past 6 years? * Your market share in China has been declining for the past 3 years, what are the reasons? * Does this mean you have lost the electric vehicle battle in China? * Do you emphasize luxury car strategy rather than electrification transformation? * Do you like the color TVs, refrigerators, and large sofas in Chinese cars? * Will your success or failure in the Chinese market determine the success or failure of the global transformation? * What innovative strategies are planned to reverse the situation in the Chinese market? * **18:24 Part 2: Talking about AI and new technologies** * The outside world says Tesla is 10 years ahead of you in electric vehicles, how do you respond? * But if you can't control all the technology, can you control your luxury cars? * As the automotive industry shifts to electrification and intelligent driving, Mercedes-Benz has not fully led these new technologies. Can Mercedes-Benz still dominate luxury? * You are testing solid-state batteries, can you share more progress? * How will artificial intelligence change the rules of the game in the global automotive industry? * China's DeepSeek is rising globally, would you consider cooperation? * With "technology democratization," technology is no longer super exclusive. Do consumers still need luxury cars? * If you had to choose between luxury and technology, which would you choose? * If Karl Benz were still alive, which one do you think he would choose? * **40:17 Part 3: Talking about the CEO in transition and Mercedes-Benz in transition** * Is the 139-year-old Mercedes-Benz giant now at an unprecedented turning point in its history? * Back to May 22, 2019, the day you took over as CEO, what happened that day? * As the helmsman of the era of change, please tell us the biggest difficulties you have faced so far. * Tesla and Chinese car companies are still founder-driven, while German automakers have gone through generations of professional managers. Will this make German automakers more conservative? * Do you ever feel that the 139-year-old giant is transforming slowly? * When you make every major decision, do you feel that Mr. Benz is watching you? Does this put a lot of pressure on you? * If you could ask Karl Benz a question, what would you ask?
Original title: 100. 对话奔驰全球CEO康林松:转型期CEO和转型之中的139岁奔驰
Original description: <figure><img src="https://image.xyzcdn.net/Flo18nNUSP7OUNlTf8UgCdHxio6O.jpg" /></figure><p>2025年3月底,奔驰汽车全球CEO康林松先生(Ola Källenius)来华9天,期间我对他做了一次访谈。</p><p>奔驰是世界上第一个发明了燃油车的公司,现在正处于奔驰139年历史上最重大变革时期,可以说<strong>康林松是主导这场关键变革的“一名转型期CEO”。</strong></p><p>他1969年出生于瑞典,1993年加入了奔驰,绝大多数职业生涯都在奔驰;6年前,他在2019年担任了奔驰全球CEO。值得一提的是,他是奔驰历史上第一位在上任时非德裔的CEO。</p><p>我和康林松先生聊了聊<strong>他上任6年的重要战略决策(包括豪华车战略、电动化战略)、中国市场的成与败、科技平权与豪华车是否有悖论,以及在他领导之下的这场奔驰有史以来最重大的关键变革。</strong></p><p>我想给大家呈现的是一个,转折之中的139岁巨人。</p><figure><img src="https://image.xyzcdn.net/Fm2F9n8vMm_n-xafqMi98xs3T3K8.png" /></figure><figure><img src="https://image.xyzcdn.net/FreJb-NMmeSH5rseRc5RzdK5mm-5.png" /></figure><blockquote>我们的播客节目在<a href="https://view.inews.qq.com/u/8QIf3n5c64Ucuzne7gI%3D?devid=FF4E49E6-9C89-4986-A413-04E856F31262&qimei=766696f2cd8f313d744bc2c9000012918102&uid=100161026780">腾讯新闻首发</a>,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)</blockquote><figure><img src="https://image.xyzcdn.net/FvV-R5FBydYHGZAMyXAV1K1A9iJT.png" /></figure><ul> <li><strong>04:12 第一部分:谈中国市场</strong></li> <li>过去6年,你对中国市场最重要的观点是什么?</li> <li>你们在中国的市场份额过去3年一直下降,什么原因导致的?</li> <li>这是否意味你们在中国的电动车之战中,输了?</li> <li>你们更强调豪华车战略,而不是电动化转型,是这样吗?</li> <li>你喜欢中国汽车里的彩电、冰箱、大沙发吗?</li> <li>你们在中国市场的成败会决定全球转型的成败吗?</li> <li>计划采用哪些创新策略来扭转在中国市场的局面?</li> <li><strong>18:24 第二部分:谈AI和新技术</strong></li> <li>外界说特斯拉在电动车上比你们领先10年,你如何回应?</li> <li>但如果你们无法控制所有技术,你们能控制自己的豪华车吗?</li> <li>随着汽车行业转向电动化和智能驾驶,奔驰没有完全引领这些新技术,奔驰还能主导豪华吗?</li> <li>你们正在测试固态电池,能否分享更多进展?</li> <li>人工智能将如何改变全球汽车行业的游戏规则?</li> <li>中国DeepSeek正在全球范围内崛起,你会考虑合作吗?</li> <li>随着“技术民主化”,技术不再是超级排他性,消费者还需要豪华车吗?</li> <li>如果必须在豪华和科技之间选择,你会选择哪一个?</li> <li>如果卡尔本茨先生还在世,你觉得他会选哪一个?</li> <li><strong>40:17 第三部分:谈转型期CEO和转型之中的奔驰</strong></li> <li>拥有139年历史的奔驰巨头,如今正处于其历史上前所未有的转折点上?</li> <li>回到2019年5月22日,你接任首席执行官的那一天,那天都发生了什么?</li> <li>作为变革时期掌舵者,请说出你至今面临过的最大困境</li> <li>特斯拉和中国车企仍然是创始人驱动,而德国汽车制造商经历了几代职业经理人,这是否会让德国汽车制造商更加保守?</li> <li>你有没有感觉过,这位139岁的巨人转型缓慢?</li> <li>当你做出每一个重大决定时,有没有觉得本茨先生在关注着你?这会让你有很大压力吗?</li> <li>如果能问卡尔本茨先生一个问题,你想问什么?</li></ul><figure><img src="https://image.xyzcdn.net/Fn7o36NtUYpCM_rQiFj1LW-TIwk8.JPG" /></figure>
-
99. Three-hour interview with Yang Zhao, founder of Energy Singularity: How far is humanity from taming controllable nuclear fusion?From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-04-28 00:00
In 2021, Sam Altman personally invested $375 million in Helion Energy, an American nuclear fusion startup, his largest personal bet to date. Helion boasts that it will build the world's first 50-megawatt fusion power plant by 2028. Musk has a different view. He once said, "We have an inexhaustible nuclear fusion reactor above our heads – the sun." He believes solar energy is the fundamental path to solving humanity's energy problems. However, in the eyes of many, **controlled nuclear fusion is still the "holy grail of energy."** As we move towards AGI today, energy will be the biggest bottleneck for civilization's evolution – after all, AGI may not fear humans, but it certainly fears power outages. In this episode, I invited Yang Zhao, the founder of Energy Singularity, a Chinese controlled nuclear fusion startup, to talk about it. Compared to AI, controlled nuclear fusion is a longer and less traveled entrepreneurial path. **It is almost facing one of the most complex physical problems in human history, standing on the edge of technology and human civilization, exploring technology.** In the program, Yang Zhao gave us a popular science introduction to the cutting-edge technology of controlled nuclear fusion; as a participant in China's controlled nuclear fusion cause, he also relatively clearly calculated **how much funding is still needed for humans to tame controlled nuclear fusion? How much further do we have to go?** We also talked about what our world and our civilization will be like in the more distant future when energy becomes infinite. Our podcast program premiered on Tencent News, you can go and follow it, so you can get program information and more news as soon as possible :) Quick Q&A from 03:00 **High-frequency professional term explanation** 04:10 Nuclear fusion, nuclear fission, controlled nuclear fusion, tokamak, high-temperature superconducting tokamak, there are only 3 full low-temperature superconducting devices in the world 13:22 The "International Thermonuclear Experimental Reactor (ITER)" jointly launched by many countries, a super-large tokamak device, has invested 25 billion euros and has a construction period of 30 years 14:47 Both high-temperature superconducting materials and low-temperature superconducting materials are low-temperature (high-temperature superconductivity can reduce the device volume by two orders of magnitude under the condition of energy gain, which also means that the construction cost is reduced by about two orders of magnitude) 19:17 A key indicator: Q value/energy gain is determined by the triple product (plasma density × temperature × confinement time), the world's highest Q value has just passed 1, and currently pursuing Q>10 **History of Controlled Nuclear Fusion** 21:55 Starting from Einstein's mass-energy equation E=MC², very small mass loss will produce huge energy 27:09 From hydrogen bombs to inertial confinement to magnetic confinement, different magnetic field shapes correspond to different magnetic confinement bifurcation technology routes 27:50 In the 1960s, the Soviet Union thought of the tokamak route with a donut-like magnetic field configuration 28:50 There are probably more than 100 tokamak devices in the world 29:11 Transition from the era of using copper to make tokamaks to using superconductors to make tokamaks 30:17 In 2024, we built the world's first full high-temperature superconducting tokamak ("Honghuang 70" device) **4 Years of Nuclear Fusion Entrepreneurship** 34:01 2021 idea: Maybe high-temperature superconductivity significantly reduces the device volume and reduces the cost by two orders of magnitude 39:43 After thinking clearly, build a team, starting with 4 people 41:05 Yang Zhao's personal background: Stanford Ph.D. direction is relatively basic physics, quantum gravity, string theory, the intersection of quantum gravity and quantum information, basic physics that is far from this world 46:36 Human science's "pearl" and "lifetime" series 51:05 Between graduating with a Ph.D. and starting a nuclear fusion business? Doing EIR (Entrepreneur in Residence) at GSR Ventures in the United States, the first venture combining artificial intelligence and music education 55:36 Early 2021, market research for nuclear fusion research institutes and suppliers **"Honghuang 70", "Honghuang 170" and Jingtian Magnet** 59:37 How is "Honghuang 70" built? What are the steps to make a full high-temperature superconducting tokamak? 01:07:33 Problems are constantly emerging in every link. The closer you get to the real object, the bigger and more problems you have, and the higher the cost of modification and repair 01:15:43 The significance of "Honghuang 70" 01:18:49 The "three-step" to the first controlled nuclear fusion product 01:21:10 The significance of Jingtian Magnet (large-aperture magnet) and "Honghuang 170" 01:35:18 Comments on the world's 3 full low-temperature superconducting devices (EAST in Hefei, China, KSTAR in South Korea, and JT-60SA in Japan) 01:38:40 "Honghuang 380", made according to the requirements of a demonstration power station that can run for a long time with complete energy **How much further do humans have to go to tame controlled nuclear fusion?** 01:41:40 Sam Altman's largest personal investment to date is Helion Energy: "The magnetic field configuration is linear, unlike ours which is a donut" 01:45:06 What is the relationship between nuclear fusion and AI? 01:52:13 The division and differences of the Chinese and American nuclear fusion market pattern 01:54:10 Our technology route is similar to that of CFS (Commonwealth Fusion Systems, a federal nuclear fusion system company spun off from MIT) 01:56:40 The raw material for true fusion commercialization needs to use deuterium-deuterium to generate electricity, not deuterium-tritium 02:03:16 What will the world be like when energy is infinite? 02:04:57 Talking about self and organization, climbing and falling 02:30:57 Final quick Q&A Energy Singularity site and device diagram located in Lingang, Shanghai: (Above: Outside the company) (Above: Inside the factory) (Above: "Honghuang 70" under construction) (Above: "Honghuang 70" plasma) (Above: The moment "Honghuang 70" was completed) (Above: "Jingtian Magnet") (Above: The testing system of "Jingtian Magnet", "Jingtian Magnet" lies in a large tank) 【More information】 Contact us: Weibo @张小珺-Benita For more information, please follow the official account: 张小珺
Original title: 99. 对能量奇点创始人杨钊3小时访谈:人类驯服可控核聚变还有多少路程?
Original description: <figure><img src="https://image.xyzcdn.net/Flo18nNUSP7OUNlTf8UgCdHxio6O.jpg" /></figure><p>2021年,Sam Altman以个人名义向美国核聚变初创公司Helion Energy注资3.75亿美金,这是他迄今最大的一笔个人下注。Helion豪言称,将在2028年前建成全球首座50兆瓦聚变电厂。</p><p>马斯克持不同看法。他曾说:“我们的头顶一直就有一个取之不尽、用之不竭的核聚变反应堆——太阳”。他相信太阳能才是人类能源问题的根本路径。</p><p>不过,在许多人眼中,<strong>可控核聚变仍然是“能源界的圣杯”。</strong></p><p>随着今天我们向AGI迈进,能源将是文明演进的最大瓶颈——毕竟,AGI或许不惧怕人类,但一定害怕断电。</p><p>这集节目,我邀请了中国可控核聚变创业公司、能量奇点创始人杨钊来聊聊。相比AI,可控核聚变是一条更漫长、更人迹罕至的创业之路。</p><p><strong>它几乎是面对人类有史以来最复杂的物理难题之一,站在科技与人类文明的边界上,做技术摸索。</strong></p><p>节目中,杨钊帮我们做了一次关于可控核聚变的前沿技术科普;作为中国可控核聚变事业的参与者,他也相对清晰地计算出了,<strong>人类驯服可控核聚变还需要多少资金要消耗?还有多少路程要走?</strong>我们也聊了聊,在更远处的未来,当能源成为无限,我们的世界、我们的文明又将怎样?</p><figure><img src="https://image.xyzcdn.net/Fm2F9n8vMm_n-xafqMi98xs3T3K8.png" /></figure><figure><img src="https://image.xyzcdn.net/FpvoKOCqm9m1BUQBqMrHw96qKSQf.png" /></figure><blockquote>我们的播客节目在<a href="https://view.inews.qq.com/u/8QIf3n5c64Ucuzne7gI%3D?devid=FF4E49E6-9C89-4986-A413-04E856F31262&qimei=766696f2cd8f313d744bc2c9000012918102&uid=100161026780" rel="noopener noreferrer nofollow" target="_blank">腾讯新闻首发</a>,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)</blockquote><figure><img src="https://image.xyzcdn.net/FvV-R5FBydYHGZAMyXAV1K1A9iJT.png" /></figure><p>03:00 开始的快问快答</p><blockquote><strong>高频专业名词解释</strong></blockquote><p>04:10 核聚变、核裂变、可控核聚变、托卡马克、高温超导托卡马克,全世界只有3台全低温超导装置</p><p>13:22 多国联合推出的“国际热核聚变实验堆计划”(ITER), 一个超大型托卡马克装置,已投入资金250亿欧元,建设周期30年</p><p>14:47 高温超导材料和低温超导材料都是低温(高温超导在的能量增益的条件下,可以将装置体积缩小两个数量级,也意味建造成本大约缩小两个数量级)</p><p>19:17 一个关键指标:Q值/能量增益由三乘积(等离子体的密度×温度×约束时间)决定,Q值全球最高刚过1,目前追求Q>10</p><blockquote><strong>可控核聚变的历史</strong></blockquote><p>21:55 从爱因斯坦质能方程E=MC²开始说起,非常小质量损失会产生巨大能量</p><p>27:09 从氢弹到惯性约束到磁约束,不同磁场形状对应不同磁约束分叉技术路线</p><p>27:50 上个世纪60年代,苏联想到用甜甜圈一样的磁场位形托卡马克路线</p><p>28:50 全世界大概有100台以上托卡马克装置</p><p>29:11 从用铜做托卡马克的时代过渡到用超导做托卡马克</p><p>30:17 2024年,我们建成全世界第一台全高温超导托卡马克(“洪荒70”装置)</p><blockquote><strong>核聚变创业这4年</strong></blockquote><p>34:01 2021年想法:也许高温超导显著缩小装置体积,将成本两个数量级降低</p><p>39:43 想清楚以后搭团队,最开始4个人</p><p>41:05 杨钊的个人背景:斯坦福博士方向是比较底层的物理,量子引力、弦论、量子引力和量子信息的交叉,离这个世界比较远的基础物理</p><p>46:36 人类科学的“明珠”和“有生之年”系列</p><p>51:05 从博士毕业到核聚变创业之间?在金沙江创投美国做EIR(驻场准创业者)、第一段人工智能和音乐教育结合的创业</p><p>55:36 2021年初,针对核聚变科研院所和供应商的市场调研</p><blockquote><strong>“洪荒70”、“洪荒170”和经天磁体</strong></blockquote><p>59:37 “洪荒70”是怎么建造的?做一台全高温超导托卡马克需要几步?</p><p>01:07:33 每个环节都在不断出问题,你越接近实物状态,你的问题越大、问题越多,改动修补成本越高</p><p>01:15:43 “洪荒70”的意义</p><p>01:18:49 通往第一个可控核聚变商品的“三步走”</p><p>01:21:10 经天磁体(大孔径磁体)和“洪荒170”的意义</p><p>01:35:18 点评世界上3台全低温超导装置(中国合肥的EAST、韩国的KSTAR、日本的JT-60SA)</p><p>01:38:40 “洪荒380”,按照完整能长时间运行的示范电站的要求做</p><blockquote><strong>人类驯服可控核聚变还有多少路程?</strong></blockquote><p>01:41:40 Sam Altman迄今为止最大的一笔个人投资是Helion Energy:“磁场位形是直线性的,不像我们是甜甜圈”</p><p>01:45:06 核聚变和AI的关系是什么?</p><p>01:52:13 中美核聚变市场格局的分割与差异</p><p>01:54:10 我们和CFS(Commonwealth Fusion Systems,美国麻省理工学院分拆出来的联邦核聚变系统公司)技术路线是相似的</p><p>01:56:40 真正聚变商业化的原料需要用氘氘去发电,而不是氘氚</p><p>02:03:16 当能源无限,世界会怎么样?</p><p>02:04:57 聊聊自我与组织、登山与跌落</p><p>02:30:57 最后的快问快答</p><figure><img src="https://image.xyzcdn.net/FvVbUNblF7FHIjfdp3MmmbAdLZ8G.png" /></figure><p>位于上海临港的能量奇点现场及装置图:</p><figure><img src="https://image.xyzcdn.net/FtoDf-jIxBPk5UcLWXsH2bx6cpnq.heic" /></figure><p>(上图:公司外)</p><figure><img src="https://image.xyzcdn.net/FlXzl7UYF1m6EqwuwPNgPVt2nOIg.heic" /></figure><p>(上图:厂房内)</p><figure><img src="https://image.xyzcdn.net/Fmm2ggP6exvPmlcbSpSV3ta_rbvk.jpg" /></figure><figure><img src="https://image.xyzcdn.net/Fny0cq8_EMT6r75CF2acahr18qBQ.jpg" /></figure><p>(上图:“洪荒70”建设中)</p><figure><img src="https://image.xyzcdn.net/FmZ1w85ssuv4Oc1hYJHPk-mt9KlZ.jpg" /></figure><p>(上图:“洪荒70”等离子体)</p><figure><img src="https://image.xyzcdn.net/FmyHUa_akdXsPDNFCo9NWhlX_GI7.jpg" /></figure><p>(上图:“洪荒70”建成时刻)</p><figure><img src="https://image.xyzcdn.net/FvpfDdcsAYING4Ev9n-fa70EG9lK.jpg" /></figure><figure><img src="https://image.xyzcdn.net/FkU1jHH4FxDVg2GZjeRcWyJ9ScsB.jpg" /></figure><figure><img src="https://image.xyzcdn.net/Fu-NkpbGsZ8xE-9SvZprld6PefFT.jpg" /></figure><p>(上图:“经天磁体”)</p><figure><img src="https://image.xyzcdn.net/FgvxPre7Y6V5DFnNKqYD4KJVmoZB.jpg" /></figure><p>(上图:“经天磁体”的测试系统,“经天磁体”躺在大罐子里)</p><p>【更多信息】</p><p>联络我们:微博<a href="https://weibo.com/u/6486678714" rel="noopener noreferrer nofollow" target="_blank">@张小珺-Benita</a></p><p>更多信息欢迎关注公众号:张小珺</p><figure><img src="https://image.xyzcdn.net/Fn7o36NtUYpCM_rQiFj1LW-TIwk8.JPG" /></figure>
-
98. 逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA”From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-04-06 23:00
今天的嘉宾是清华大学交叉信息研究院助理教授、星动纪元创始人陈建宇。他的研究和创业方向都是人形机器人。大语言模型浪潮爆发后,学界和工业界看见了机器人从专用走向通用的可能迹象,机器人革命随之而来。其中,本轮革命最重要的是,对机器人底层架构,也就是机器人“大脑”的探索。但通用机器人还在科学研究阶段,处于产业发展早期。这集节目,陈老师将带领大家,概览式阅读机器人基座模型和当下最前沿的架构VLA架构(Vision-Language-Action Model,视觉语言动作模型)的经典论文。希望我们的节目能直观地帮助更多人靠近科学前线,感受技术之美,并且能直观感知当前技术拐点。还是那句话:期待2025,我们和AI共同进步!(因为因为,陈老师真的分享了很多很多的动图和视频,本集结合视频服用效果更佳噢!可以前往:含投屏的视频版本。嘿嘿!预祝你学得开心!学得顺利啦!)我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)02:30 陈建宇的研究和创业方向04:11 讲解开始前,先提问几个小问题17:36 当下最大变量:从专用模型到通用模型(robot foundation model)的可能性21:12 大模型浪潮爆发后,机器人领域经历了两个阶段:从利用基础模型进行机器人研究(leveraging foundation models in robotics)到为机器人预训练基础模型(pretraining foundation models for robotics)第一阶段:利用基础模型进行机器人研究(leveraging foundation models in robotics)21:59 机器人传统三板块:Planning+Perception+Actuation(规划+感知+执行)——第一步,用LLM(Large Language Model,大语言模型)替代Planning23:54 由Google Robotics团队提出的具身智能开创性论文Say Can《Do As I Can, Not As I Say: Grounding Language in Robotic Affordances》(中文名:我能做到,而不是我说到:将语言与机器人的可供性相结合)27:03 第二步,用VLM(Vision-Language Models,视觉语言模型)替代Perception27:52 来自Google的论文《Inner Monologue: Embodied Reasoning through Planning with Language Models》(中文名:内心独白:通过语言模型规划进行具身推理)29:51 由清华和上海姚期智研究院提出的《DoReMi: Grounding Language Model by Detecting and Recovering from Plan-Execution Misalignment》(中文名:DoReMi:通过检测和恢复规划-执行不一致来落地语言模型)32:47 第三步,想把Actuation进一步自动化,用Code LM(专门用于代码相关任务的大型语言模型)来替代Actuation32:24 由李飞飞团队提出的《VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models》(中文名:VoxPoser:使用语言模型进行机器人操作的可组合3D价值地图)第二阶段:为机器人预训练基础模型(pretraining foundation models for robotics)38:36 VLA端到端模型(Vision-Language-Action Model,视觉语言动作模型)——“人是很智能的VLA Agent”39:53 关于VLA的经典论文及分类:40:17 Aloha论文《Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware》(中文名:学习用低成本硬件进行精细双手操作)47:36 Mobile Aloha论文《Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation》(中文名:移动ALOHA:使用低成本全身远程操作学习双手移动操作)50:15 论文《A Generalist Agent》介绍了一个名为Gato的通用型人工智能代理(中文名:通用型代理)52:45 RT-1论文《RT-1: Robotics Transformer for Real-World Control at Scale》(中文名:RT-1:机器人Transformer用于大规模现实世界控制)59:02 Octo论文《Octo: An Open-Source Generalist Robot Policy》(中文名:Octo:一个开源的通用机器人策略)01:02:20 CrossFormer论文《Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation》(中文名:扩展跨具身学习:操控、导航、运动和飞行的统一策略)01:06:58 字节跳动AI Lab的两个工作GR-1和GR-2:《Unleashing Large-Scale Video Generative Pre-Training For Visual Robot Manipulation》(为视觉机器人操控释放大规模视频生成预训练模型)《A Generative Video-Language-Action Model with Web-Scale Knowledge for Robot Manipulation》(用于机器人操作的网络规模知识生成视频-语言-动作模型》)01:15:02 Palm-E论文《PaLM-E: An Embodied Multimodal Language Model》(中文名:PaLM-E:具身多模态语言模型)01:20:02 当前VLA最有名的开山工作:Google推出的RT-2论文《RT-2:Vision-Language-Action Models Transfer Web Knowledge to Robotic Control》(中文名:RT-2:视觉-语言-动作模型将网络知识迁移到机器人控制中)01:26:05 RT-X论文《Open X-Embodiment: Robotic Learning Datasets and RT-X Models》(中文名:开放X具身:机器人学习数据集与RT-X模型)01:31:16 《OpenVLA: An Open-Source Vision-Language-Action Model》(约等于开源版RT-2)(中文名:OpenVLA:一个开源的视觉-语言-动作模型)01:32:56 陈建宇课题组《HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers》(中文名:HiRT:利用分层机器人Transformer增强机器人控制)01:38:40 Figure AI Helix,没发论文,但是今年Figure最新架构01:39:28 Pi0论文《π₀: A Vision-Language-Action Flow Model for General Robot Control》(中文名:π₀:一个视觉-语言-动作的流模型用于通用机器人控制)01:41:36 英伟达最近发布的GROOT N1模型《GR00T N1: An Open Foundation Model for Generalist Humanoid Robots》(中文名:GR00T N1:通用人形机器人的开放基础模型)01:42:32 《Diffusion Policy: Visuomotor Policy Learning via Action Diffusion》(中文名:扩散策略:通过动作扩散进行视觉运动策略学习)01:47:39 清华发布的《RDT-1B: A Diffusion Foundation Model for Bimanual Manipulation》(中文名:RDT-1B:双手操作机器人的扩散基础模型)01:51:04 《Prediction with Action: Visual Policy Learning via Joint Denoising Process》(动作预测:通过联合去噪过程进行视觉策略学习)和续作《Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations》(视频预测策略:一个预测视觉表征的通才机器人策略)02:03:06 两个未来方向:《UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent》(UP-VLA:具身智能体的统一理解与预测模型)《Improving Vision-Language-Action Model with Online Reinforcement Learning》(通过在线强化学习改进视觉-语言-动作模型)02:09:22 最后的提问【技术之美】系列:逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学”【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
97. 25年Q1大模型季报:和广密聊当下最大非共识、AGI的主线与主峰From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-03-30 23:00
很多人在催更《全球大模型季报》的2025年第一集,在Q1的最后一天,终于和大家见面了!这一集广密依然带来了信息满满的有关于全球大模型最新的的前沿认知。经历了最近几个月的全球AI格局巨变,他最大的变化是,重新坚信了Pre-training(预训练)——认为只有Pre-training才能决定模型内在的上限,涌现新能力,而Post-training+RL(后训练+强化学习)是加强。在这一集季报中,我们对于Q1的全球明星DeepSeek、作为模型“盗火者”的Manus、OpenAI的烟雾弹、硅谷的认知分歧与价值观、未来的范式级新路线,都进行了一一讨论。更重要的是,他更新了在一位AGI原教旨主义者的眼中,AGI的主线、珠峰与路途。希望《全球大模型季报》能持续陪伴你,2025,我们和AI共同进步!我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)04:22 Pre-training叙事卷土重来今天最大非共识是Pre-training空间还非常大,Pre-training决定了模型内在的上限还是要再喊一下,大家还是要重视Pre-training了,这个最本质OpenAI现在不那么重视Pre-training,为什么?OpenAI的Pre-train核心团队一直挺动荡11:56 Coding是最通用赛博世界的环境,是模型的手我对两年内实现AGI有前所未有的信心Coding意义不在于编程本身,而在于Coding是数字经济GDP活动最重要的环境,是最通用的赛博世界的环境Coding是比搜索引擎和推荐引擎重要的东西19:55 OpenAI vs Anthropic:战略是不同组织能力的表达OpenAI和Anthropic同宗同源,最开始路线一样,但走着走着,核心战略bet或路线已经发生了分化OpenAI是frontier team做出了O系列,frontier team的老大Mark Chen现在成为了仅次于Sam/Greg的三号人物硅谷的认知分歧?这个问题本质是:智能重要,还是流量重要?我有点担心OpenAI过早的走向一家消费互联网公司30:18 一位AGI原教旨主义眼中的AGI roadmap(路线图)智能提升是唯一主线,智能本身就是最大应用今天回头看,ChatGPT只是这座高山山脚的第一站,后面还有很多个山头:Coding、Coding Agent、General Agent、AI for Science、RoboticsChatGPT只是前菜,接下来Agent才是正餐今天还是围绕智能主线,最重要的是push智能能力往上走,做应用的要构建一个环境或容器,承接研究溢出的智能红利文生图有可能是OpenAI烟雾弹今天做Robotics Foundation model/Research的做法不够本质26/27年可能是AI for Science爆发的时间点43:00 智能的本质是什么?这是个极好的问题——大家有想法可以打在评论区:)人类进化就3个关键词:1. 生存,2. 探索,3. 自动化智能进步的衡量标志是什么?一个Chatbot对话可能消耗几千个Token,一个Perplexity搜索大概几十K Token,但一个Manus平均可能要70-80万个Token48:03 Agent是新物种“智能水平离AGI越近,可能就越像宇宙大爆炸”Agent落地最关键的3个能力:1. Long Context reasoning, 2. Tool use, 3. Instruction following指令遵循AGI接下来的milestone是long-term memory,这个会取代long context55:49 未来范式级的路线,可能Online Learning是一个如果说未来还有范式级的路线,可能Online Learning是一个,让模型可以在线自主探索并学习对GPU或者英伟达叙事影响有多大?怎么看待贾扬清的公司(Lepton AI)被卖掉?英伟达在下一盘什么大棋?01:02:45 模型与产品的关系、壁垒和商业模式今天定价为什么20美元,是copy SaaS的定价吗?但SaaS不会消耗大量token裸模型发布的时代即将结束?形成壁垒主要是两个:一是成为Cloud,OpenAI自己变成微软的Azure Cloud;二是成为OS,要有生态,后面打造新的Operating System投资人怎么投AI应用?模型长期会把产品吃掉吗?本质是,feature system vs Learning system哪个更快Perplexity/Cursor/Manus都是“模型的盗火者”01:15:11 全球大模型公司竞争格局和全球AI产品公司GPT-4.5算不算领先?GPT-5为什么一直在跳票?OpenAI有没有失败的风险?怎么看待OpenAI支持了Anthropic的MCP协议?OpenAI和微软为什么会有裂痕?分家对微软影响多大?Manus vs Perplexity,都是执行力很强的团队,被称作“套壳之王”理想的投资组合:25% Anthropic, 25% Bytedance, 10% OpenAI, 10% Mira Thinking Machine Lab, 5% SSI, 5% Cursor, 5% Manus, 另外15%还没想好如果DeepSeek融资,我会放基金的25%01:54:32中美格局:如何跨越地缘封锁科技投资不是靠“混”能混出结果的,很多VC investor到处混圈子,其实没意义,还是得靠“创造”【全球大模型季报】系列2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观2024年Q1:和广密聊AGI大基建时代:电+芯片=产出智能2024年Q2:口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态2024年Q3:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL2024年Q4:大模型季报年终特辑:和广密预言LLM产品超越Google之路【免责声明】单纯内容分享,不作为投资建议。【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
96. 和郎咸朋聊,自动驾驶10年演进史、关键技术细节和特斯拉From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-03-16 23:00
今天发布的是和理想汽车自动驾驶研发副总裁郎咸朋的聊天。本次访谈发生在2024年12月,和我们之前发布的《对李想的3小时访谈》在同一时期进行。郎咸朋13-18年在百度做自动驾驶,18年加入理想,过去10年都在中国的自动驾驶领域。他以亲历者的视角聊了自动驾驶10年演进史,详解了其中的关键节点和技术细节。这次谈话更像是对自动驾驶的一次技术科普。我觉得我们聊的还不错,所以决定分享给大家。(因为访谈发生在去年,如果大家听到今年,指的是24年;如果听到去年,指的是23年。)期待2025,我们和AI共同进步!我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)01:32 10年前的自动驾驶当成有轨电车研发,现在看起来很可笑04:30 2018年,从高精地图+激光雷达到BEV+Transformer,Tesla是标杆12:07 当年激光雷达50-60万/台,早期百度/Cruise一辆车7-8个激光雷达,传感器成本远高于这辆车(当时我们在百度,一辆车500万人民币)13:09 为什么特斯拉要用视觉解决问题?为什么自己造芯片?15:16 特斯拉一辆车的传感器+芯片成本?一辆车有几个芯片?20:06 特斯拉总在用“升维”方式解决问题25:06 激光雷达和camera解决方案区别28:46 端到端、“我们以前做自动驾驶都做错了”41:14 我的工作经历:13-18年在百度,18年开始在理想50:50 “L3不是L2的延长,而是L4的先导”01:15:15 端到端是最典型的强化学习,端到端+VLM+世界模型是RL架构01:26:40 2024年3月李想对智驾团队发火01:32:23 “卫城”项目:“他就觉得你一定要跪下来求他”“老子就算死也要站着死”01:35:51 想过职业生涯栽在这儿吗?李想脾气不太好?【从蒸汽机到无人驾驶】系列对李想的3小时访谈(播客版):宅男、AI、家庭、游戏和天梯和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远”从蒸汽机到无人驾驶3|和孟醒聊特斯拉FSD进化史从蒸汽机到无人驾驶4|Waymo和它的对手们:我暗中考察了四个月【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
95. 对Manus创始人肖弘的3小时访谈:世界不是线性外推,做博弈中的重要变量From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-03-02 23:00
今天的嘉宾是肖弘(小红/小宏),一名AI应用创业者。我们从去年在不同时期进行谈话,可以算是展开了一场“接力式访谈”。大模型的模型能力还在迅速变化,身处其中的创业者要不断根据外部环境身段柔软地时时调整姿势。《商业访谈录》希望记录一名AI应用创业者,在技术变革之中、当一切都处于不稳定状态下的持续思考历程。而这个历程富有魅力之处就在于,它是变化的,而且还会继续变化。我们正在开启的2025可能会是AI应用爆发的元年、Agent爆发的元年,这集节目正是来自一线“AI应用爆发”、“Agent爆发”的前沿声音。肖弘提供了一种身处浪花中创业者的心态:“世界不是线性外推的,要让自己成为博弈中的重要变量。”期待2025,我们和AI共同进步!我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)第一次访谈发生在2024年秋天,彼时小红刚完成一轮融资。(提醒大家注意的是,第一次访谈中,当我们说到今年、去年这些词语的时候,可能脑海里需要转化一下——“去年”指的是2023年,“今年”指的是2024年)03:03 开始的快问快答05:15 连续创业者、第一段创业、沮丧时刻、不同年龄段毕业生的最优选17:04 已经把大学赚的钱花完了,山穷水尽33:16 “VC是很贵的集资手段”,它的贵不体现在你不好的时候,而是体现在好的时候42:10 最重要的转折点:预判大厂的预判、《大空头》、等待、诱惑52:27 每次觉得自己技能点还可以的时候,就会冒出一个新维度——这次是资本56:19 嗅到泡沫的味道58:15 卖过公司founder的生活和心态、“让你的生活状态变得昂贵是更昂贵的”01:05:55 第二段创业的第一款产品:浏览器插件、Monica.im、ChatGPT for Google01:28:04 从2022年底创业开始每年重要的决策01:48:38 有模型 vs 没模型,“贸工技”vs“技工贸”,“模型是技术平权”02:02:14 我脑海中大模型应用的分类和方法论:主场景补充、模型能力带来的变化、模型能力在特定领域的外溢第二次访谈发生在2025年春节后,此时DeepSeek一时间改写了中国AI应用底层生态,我们坐下来又聊了一次。这次话题主要围绕他即将要发布的Agent产品(Manus,但当时还没上线),他讲述了对新产品的完整思考过程。02:09:32 2025年春节真是梦回2023年呐!02:10:09 我尝试把火过的AI应用作为少量数据点,总结规律做预测02:20:00 开源一个AI创业idea:预判大模型的下一个能力是什么,先做好应用,在那里等着02:21:01 大模型原厂做什么 vs 应用公司做什么02:23:51 DeepSeek最佛却取得最好结果,精神上给了大家鼓励:BE YOURSELF!!02:26:27 从产品角度解析为什么DeepSeek全球爆火,而OpenAI o1遗憾错过(02:29:00-02:29:44 注:这里有几处口误,不是Perplexity而是DeepSeek)02:31:12 对即将要发布的新产品的完整思考:国内Agent的第一枪!02:47:49 这几天正在经历“A-ha moment”,真的觉得在制造生命一样的东西02:49:27 在一切都不稳固的状态下,AI应用创业者应该保持什么心态?02:51:36 大厂能理解你的创新的时候就是很危险的时候02:58:24 用时代的年龄思考,而不是用生理的年龄思考03:01:02 我让DeepSeek解释“贪、嗔、痴”03:01:53 为什么不做底层模型?03:04:39 Peak Ji(Manus首席科学家)问黄仁勋:接下来几年什么事情发生会让你觉得很惊讶?黄仁勋的回答:Basically nothing。03:09:08 Founder是没得选的03:12:20 Founder应该用“博弈的方式”思考,而不是用“逻辑推理的方式”思考03:15:00 一位founder的生活和对世界的认知03:17:50 最后的快问快答【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
94. 逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学”From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-02-23 23:00
今天这集节目延续我们的论文系列。我邀请MIT计算机科学与人工智能实验室的在读博士松琳,来给大家解读上个星期DeepSeek和Kimi发布的全新技术报告。DeepSeek和Kimi又一次技术对垒。在同一天发布论文,两篇集中在改进注意力机制以处理长文本任务上。而春节前,MiniMax也发布了一篇注意力机制相关的论文。松琳将带领大家阅读这3篇注意力机制有关的文章,解析不同模型公司的技术哲学和路线选择。我们希望能让更多人领略AI科技平权,体验技术之美。2025,我们和AI共同进步!(如果如果,你觉得光听还不够刺激,觉得一定要坐在电脑前看着投屏、拿起纸笔学习更有沉浸感…如果你实在是真心想要找虐的话…请前往:含投屏的视频版本。预祝你学习顺利啦!)我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)02:30 讲解开始前,先提问几个小问题15:36 DeepSeek最新论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》讲解论文中文名:《原生稀疏注意力:硬件对齐且原生可训练的稀疏注意力》路线:稀疏注意力机制本篇工作最大亮点:Native Sparse Attention 全线压制 Full Attention01:19:14 Kimi最新论文《MoBA: Mixture of Block Attention for Long-Context LLMs》讲解论文中文名:《MoBA:面向长文本上下文的块注意力混合架构》路线:稀疏注意力机制01:44:42 MiniMax春节前的论文《MiniMax-01: Scaling Foundation Models with Lightning Attention》讲解论文中文名:《MiniMax-01:利用闪电注意力扩展基础模型》路线:线性注意力机制02:30:07 最后强化学习一下【技术之美】系列:逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
93. 离开字节、MiniMax的张前川,发出AGI对人类威胁的预警From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-02-20 23:00
今天这集节目是春节前,我和前今日头条用户产品负责人、前MiniMax产品负责人张前川的一次聊天。张前川从2005年开始入行成为产品经理,经历过百度、360、字节、知乎等公司,最后一次出现在新闻是他从大模型公司MiniMax离职。这次聊天分成两个部分:第一部分是他作为一位20年的产品经理的思考,特别是他观察到的中国内容产品演变史。第二部分是他最近半年的所思所想。和上一集节目张亚勤对AGI勾勒的乐观前景不同,关于AGI,张前川发出了对人类威胁的预警,并分析人类灭绝的n种可能性。他告诉我,他接下来会考虑成立一家pro-human的非营利组织。(本集节目录制于春节前)我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)内容产品的20年演变史 02:00 张前川自我介绍:一位产品经理的20年 (曾供职过的企业:百度、360、字节、新浪微博、知乎、MiniMax) 03:39 搜索引擎、拉里·佩奇和俞军 17:35 2005-2025,过去20年,内容分发产品的演化历史和内生逻辑 24:28 推荐引擎、今日头条和张一鸣 28:28 小红书在推荐引擎范式的延长线上吗?为什么小红书不是字节做的? 39:29 微信送礼物的功能maybe对于小红书更有意义 42:50 泛化如水流有方向:女生向男生,年轻向年长用户的泛化更容易 52:00 面试时张一鸣问我的问题离开大模型公司的张前川,发出AGI预警这里对AGI推演和92集张亚勤的观点截然不同 54:10 AI是人类的最后一个发明,加速度无限大 57:00 把AI当目的 vs 把人当目的(更多公司是在for AI的目的?) 01:09:08 Agent就是“baby阶段的AGI” 01:19:56 人类灭绝的n种可能性(人利用AI灭绝人类/AI有意识的灭绝人类/AI无意识的灭绝人类) 01:24:30 人类如何幸福生存下去? 01:26:03 如果AI产品收费模式是付费制,大部分人类会逐渐失去和AI的连接 01:40:21 AGI公司的承诺和制度安排 01:58:48 人类不要逃避危险本身而逃避思考【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
92. 和张亚勤院士聊,意识、寿命、机器人、生物智能和物种的延伸From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-02-17 08:47
人人都谈论AGI,但在可见的未来,AGI到底是一幅什么样的画面?针对这个话题,我邀请了清华大学智能产业研究院(AIR)院长、前百度公司总裁张亚勤院士,来聊聊。在他的脑海中,人工智能会按照信息智能〉物理智能〉生物智能的图谱逐步实现AGI。这种构想和信仰之下,AGI呈现的是一个乐观的前景画面。但这不是人们预感AI进化的全部图景,在之后的节目中,我也会推出对AGI的另一种思考与隐忧。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 01:45 在AI冬眠期,微软亚洲研究院成立了 03:57 微软怎么管理亚洲研究院?目标如何设置? 05:53 清华智能产业研究院(AIR)的目标和路径,不做基层通用大模型 10:45 我脑海中的AGI地图:信息智能〉物理智能〉生物智能 12:40 信息智能是大脑的智商,5年内达到AGI水平 14:25 物理智能首先落地是自动驾驶,人形机器人需要10年 15:51 机器人分三类:家庭机器人、工厂机器人、社会机器人 21:05 人形机器人:未来可能每个人有一个你的copy、你的“分身” 22:25 为什么大模型大幅加速了自动驾驶和具身智能的开发速度? 39:38 生物智能:20年实现,人的寿命更长,诞生新物种 45:56 构想10年后的世界 51:27 最后推荐两本书【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
91. 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-02-11 04:41
2025年这个春节,DeepSeek一举改写了全球AGI大叙事。在万般热闹之际,我们特别想沉下来做一些基础科普工作。在《商业访谈录》89集节目中,我邀请了加州大学伯克利分校人工智能实验室在读博士生潘家怡,为大家对照解读了春节前的DeepSeek-R1-Zero、R1、Kimi发布的K1.5,以及OpenAI更早发布的o1技术报告。这些模型聚焦的都是大模型最新技术范式,RL强化学习,简单来说就是o1路线。今天这集,我邀请的是香港科技大学计算机系助理教授何俊贤。他的研究方向是大模型推理,从很早就开始关注DeepSeek的系列研究。我们会focus在最近引发全球AI届关注的DeepSeek上。何老师将带领大家从DeepSeek的第1篇论文开始,阅读经过挑选的这家公司历史上发布的9篇论文。我们希望帮助大家从一个更延续、更长期、也更技术底层的视角来理解DeepSeek,以及它所做的复现与创新工作;与此同时也希望能让更多人感受到技术之美。(如果如果,你觉得光听还不够刺激,觉得一定要坐在电脑前看着投屏、拿起纸笔学习更有沉浸感…如果你实在是真心想要找虐的话…请前往:含投屏的视频版本。嘿嘿!预祝你学习顺利啦!2025我们和AI共同进步!)我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)03:01 讲解开始前,先提问几个小问题整体风格:Open、Honest、低调、严谨的科学态度DeepSeek基座模型21:00 《DeepSeek LLMScaling Open-Source Language Models with Longtermism》技术讲解45:48 《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》技术讲解01:06:40 《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》技术讲解01:40:17 《DeepSeek-V3 Technical Report》技术讲解DeepSeek推理模型02:05:03 《DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence》技术讲解02:12:16 《DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence》技术讲解02:47:18 《DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data》和《DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search》技术讲解02:52:40 《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》技术讲解03:01:41 9篇论文到这里都讲完啦!最后我们一起强化学习一下!关于强化学习往期节目:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4和OpenAI前研究员吴翼解读o1:吹响了开挖第二座金矿的号角王小川返场谈o1与强化学习:摸到了一条从快思考走向慢思考的路逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”开源一场关于DeepSeek的高质量闭门会:一场关于DeepSeek的高质量闭门会:“比技术更重要的是愿景”【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
90. 朱啸虎又来了:中国现实主义AIGC故事的1周年连载From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-02-07 09:47
1年前,在我的报道《朱啸虎讲了一个中国现实主义AIGC故事》中,他的观点淋漓尽致地展现了一个现实版中国AI故事。他用“我们一看就知道,这个肯定没戏”,“我们一开始就说了,我就不看好大模型”,“ 我都不愿意去聊,你知道吗?这没有意义”,表态绝不会投资6家中国大模型创业公司中的任何一家。然而,时隔1年,Allen Zhu对待通用人工智能的态度出现了惊奇的逆转。这是朱啸虎现实主义故事的1周年连载。希望《商业访谈录》能持续为大家呈现中国AI市场的风云变幻与市场中人的心态起伏。2025,期待我们和AI共同进步!我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 01:30 DeepSeek快让我相信AGI了 03:08 这是对领先者的curse、诅咒 05:21 闭源模型还有没有价值?是很严峻的灵魂拷问 06:00 20天做到2000万DAU:DeepSeek是全球App增速历史第一,不需要任何限定语 07:00 梁文锋觉得,意识不一定是一个非常高技能、高门槛的事情 11:19 不用担心在别人的地基上盖房子,对AI应用公司是极大的解放 14:40 初始语料需要博士级别、各个领域专家级别的人来打标签 15:53 DeepSeek这次唯一没有公开的可能就是预训练语料 17:40 OpenAI成本很高,如果不能持续保持领先,挑战会挺大 18:09 中国大模型公司都需要重新思考 20:05 今天的DeepSeek是追赶者还是创新者角色? 21:02 怎么看梁文锋?梁文锋是你的反面吗? 21:40 我肯定会投啊!我肯定会投!——这个价格已经不太重要了,关键是参与在这里面 22:59 我今天上午和梁文锋说,R1可能会被认为是机器AI意识的元年 24:00 至少搜索肯定是被彻底取代了——这是毫无疑问的! 26:14 AI产品的数据飞轮价值不大,这是我这两年最大一个教训 27:51 如果你是DeepSeek CEO,你当下最关切、最紧要需要解决的问题是什么? 31:32 怎么看特朗普上任第二天宣布的Stargate(星际之门)项目?怎么看英伟达? 33:29 “朱啸虎们”怎么看待“梁文锋们”? 34:07 复盘1年前《朱啸虎讲了一个中国现实主义AIGC故事》里的观点,哪些被打脸?哪些更坚定? 36:16 尤其在中国,你可以假设底层模型是免费的! 37:07 回顾2024年的大模型行业,你会把哪些时刻当作关键节点? 40:45 字节今天如果马上改开源追赶,那也不太容易 41:30 今年会不会看到通义千问把自己的生态向DeepSeek兼容,这样一个标志性事件? 42:08 点评新出现的AI产品(包括但不限于Perplexity、Cursor、Devin) 47:39 聊小红书、具身智能、杭州和理想汽车 52:26 现在全世界就只有中美有AI能力,出海都是Low-Hanging Fruits(低垂的果实) 52:57 我今天看到在新加坡的泡泡玛特,买盲盒还要配货,你想到吗?!买盲盒都要配货!! 55:30 答DeepSeek问 59:50 最后的快问快答朱啸虎往期节目:你们要的朱啸虎,来了1年前的报道:《朱啸虎讲了一个中国现实主义AIGC故事》【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
89. 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-02-04 06:56
2025年这个春节,DeepSeek一举改写了全球AGI大叙事。在万般热闹之际,我们特别想沉下来做一些基础科普工作,一起来研读这几篇关键的技术报道。今天这集节目,我邀请加州大学伯克利分校人工智能实验室在读博士生潘家怡,来做技术解读。他的研究方向是语言模型的后训练。这期播客中,家怡将带着大家一起来读,春节前DeepSeek发布的关键技术报告,他在报告中发布了两个模型DeepSeek-R1-Zero和DeepSeek-R1;并对照讲解Kimi发布的K1.5技术报告,以及OpenAI更早之前发布的o1的技术博客,当然也会聊到它春节紧急发布的o3-mini。这几个模型聚焦的都是大模型最新技术范式,RL强化学习。希望我们的节目能帮更多人一起读懂这几篇论文,感受算法之美,并且准确理解目前的技术拐点。(以下每篇技术报告都附了链接,欢迎大家打开paper收听✌️)期待2025,我们和AI共同进步!【嘉宾小记】加州大学伯克利分校人工智能实验室在读博士生,上海交通大学本科毕业。他的研究方向主要集中在语言模型的后训练领域,通过强化学习等方法提升AI在智能体行为决策与推理方面的能力。这是他做的有关R1-Zero小规模复现工作:github.com我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)03:46 讲解开始前,先提问几个小问题16:06 OpenAI o1技术报告《Learning to reason with LLMs》讲解报告链接:openai.com中文标题翻译:《让大语言模型学会推理》OpenAI在报告中有几个重点: Reinforcement Learning — 强化学习 It learns to recognize and correct its mistakes. It learns to break down tricky steps into simpler ones. It learns to try a different approach when the current one isn’t working. (它学会识别并纠正自己的错误,学会将复杂的步骤分解为更简单的步骤,学会在当前方法行不通时尝试不同的解决途径。)这些是模型自己学的,不是人教的。 我们还在技术早期,他们认为这个技术可拓展,后续性能会很快攀升。33:03 DeepSeek-R1-Zero and DeepSeek-R1技术报告《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》讲解报告链接:github.com中文标题翻译:《DeepSeek-R1:通过强化学习激励大语言模型的推理能力》35:24 摘要(Abstract)37:39 导论(Introduction)44:35 发布的两个模型中,R1-Zero更重要还是R1更重要?47:14 研究方法(Approach)48:13 GRPO(Group Relative Policy Optimization,一种与强化学习相关的优化算法)57:22 奖励建模(Reward Modeling)01:05:01 训练模版(Training Template)01:06:43 R1-Zero的性能、自我进化过程和顿悟时刻(Performance, Self-evolution Process and Aha Moment)值得注意的是,“Aha Moment”(顿悟时刻)是本篇论文的高潮:报告称,在训练DeepSeek-R1-Zero的过程中,观察到一个特别引人入胜的现象,即“顿悟时刻”。这一时刻出现在模型的中间版本中。在这个阶段,DeepSeek-R1-Zero通过重新评估其最初的方法,学会了为一个问题分配更多的思考时间。这种行为不仅是模型推理能力不断增长的有力证明,也是强化学习可能带来意想不到且复杂结果的一个迷人例证。这一时刻不仅是模型的“顿悟时刻”,也是观察其行为的研究人员的“顿悟时刻”。它凸显了强化学习的力量与美感:我们并没有明确地教导模型如何解决问题,而是仅仅为其提供了正确的激励,它便自主地发展出高级的问题解决策略。这种“顿悟时刻”有力地提醒我们,强化学习有潜力在人工智能系统中解锁新的智能水平,为未来更具自主性和适应性的模型铺平了道路。01:14:52 模型能涌现意识吗?01:16:18 DeepSeek-R1:冷启动强化学习( Reinforcement Learning with Cold Start)01:24:48 为什么同时发布两个模型?取名“Zero”的渊源故事?01:28:51 蒸馏:赋予小模型推理能力(Distillation: Empower Small Models with Reasoning Capability)01:35:27 失败的尝试:过程奖励模型(PRM)与蒙特卡罗树搜索(MCTS)01:42:33 DeepSeek-R1技术报告是一片优美精妙的算法论文,有很多“发现”,这是它成为爆款报告的原因01:43:50 对DeepSeek-R1训练成本的估算:往高里估,一万步GRPO更新, 每步就算1000的batch size(试一千次),一次算一万个token;模型更新用的 $2.2 / 1M tokens, 总共是100B tokens — 0.22M 算上效率损失,模型训练也有一定开销,说破天也就1M;如果优化的话很有可能只有10万美金左右的成本 相比之下,预训练用了600万美金,相当便宜01:49:05 KIMI K1.5技术报告《KIMI K1.5:SCALING REINFORCEMENT LEARNING WITH LLMS》讲解中文标题翻译:《KIMI K1.5:利用大语言模型扩展强化学习》报告链接:arxiv.org该报告公开了许多技术技巧细节,对于想要复现的人,两篇paper一起使用更佳。如,数据构造、长度惩罚、数学奖励建模、思维链奖励模型、异步测试、Long2short、消融实验等。02:20:07 DeepSeek论文的结尾谈未来往哪里发展?02:24:35 以上是三篇报告所有内容,接下来是提问时间,我们继续强化学习一下!“数据标注”在几篇论文中藏得都比较深,小道消息OpenAI一直以100-200美元/小时找博士生标数据“DeepSeek的论文隐藏了技术细节,但把算法的精妙之处和美展现给你,让你感受技术之美,给你震撼。”它解密了后训练范式革命可以何处去,让你发现原来算法这么简单!再一次验证——“最优美的算法永远是最干净的。”关于强化学习往期节目:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4和OpenAI前研究员吴翼解读o1:吹响了开挖第二座金矿的号角王小川返场谈o1与强化学习:摸到了一条从快思考走向慢思考的路开源一场关于DeepSeek的高质量闭门会:一场关于DeepSeek的高质量闭门会:“比技术更重要的是愿景”【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
88. 和吴翼技术解读OpenAI Operator:推理从抽象世界走向物理世界的开端From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-01-24 23:00
2025刚开年,全球AI届就已高度共识,将2025年定义为“智能体元年”。北京时间1月24日凌晨,OpenAI率先抢跑,发布智能体产品Operator(操作员),打响了全球智能体竞赛的第一枪。在Operator发布前,广密在我们的节目中预言,25年核心关键词是Agent、Agent、Agent,这些AI产品最终会演变成一个任务容器,朝着“下一个Google”方向进发。本集节目,在Operator发布后,我邀请前OpenAI研究员、清华叉院信息研究院助理教授吴翼,从技术视角解读Operator和Agent之年。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:55 对Operator的感官感受 04:19 Operator在AGI路线图上的地标:多模态、连续交互、闭环控制系统 06:34 OpenAI内部还有更好的模型,智力会刷得很高,Operator带有泛化性 08:17 Operator是多模态、闭环的o1,一个Agent o1的版本 08:57 为什么Operator是单独入口? 11:13 Operator包含的技术要点:基座模型、高质量数据集、高效大规模支持Agent的强化学习系统 14:10 有关Operator底层用的新模型:Computer-Using-Agent(CUA) 19:02 2025是Agent之年:多模态模型+强化学习 20:49 回溯到2016年,OpenAI成立后第一个大项目就是Web Agent,但失败了 22:40 OpenAI的5级分类:聊天机器人Chatbots〉推理者Reasoners〉智能主体Agents〉创新者Innovators〉组织Organizations,技术演进轨迹,人类参与越来越少 31:26 Operator在与人类协作时,如何平衡自主决策和人类指令的优先级? 32:30 Operator怎么整合语言、视觉和动作等不同模态的信息? 34:11 Operator能否支持与其他Agent的协作?这种协作的机制是什么? 38:45 广密说Chatbot不是提取智能最有效的交互方式,Operator能有效提取智能吗? 42:14 OpenAI智能提升与更多产品的关系 49:48 Agent这个词从博弈论进入人工智能,现在指大语言模型调用外部世界 54:29 Agent中有创业公司的机会吗? 58:57 Operator释放了信号:逻辑推理从抽象世界走向视觉物理世界的开端 01:02:27 如果Agent在未来成为主流,人类与AI的协作方式会发生哪些变化? 01:06:46 大公司全部开着重装坦克往前走,其他人怎么办?预言单集:大模型季报年终特辑:和广密预言LLM产品超越Google之路吴翼往期:和OpenAI前研究员吴翼解读o1:吹响了开挖第二座金矿的号角【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺更多信息欢迎关注公众号:张小珺
-
87. 对李想的3小时访谈(播客版):宅男、AI、家庭、游戏和天梯From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-01-02 14:18
这里是《张小珺商业访谈录》2025年与大家见面的第1集节目,我邀请的嘉宾是理想汽车创始人兼CEO李想。2024年12月,理想将车机助手理想同学作为手机版App推出,并于此前做了基座大模型。这相当于,这家人们认知中的新能源车企,要跨界参与到与字节豆包、Kimi等个人助手的红海之战。这场对话涵盖了这名非技术背景、被认为在产品上有天赋的创始人,过去两年对人工智能完整的技术与产品观的思考。他也首度谈了谈,MEGA失利、苹果放弃造车、雷军造车成功、如果他当了OpenAI CEO、理想会做机器人吗、怎么管理00后等各种话题。此外,播客还放出了一部分加长版聊天。这部分和此前两小时会稍微有一些重复,保留的都是一些觉得李想有增量表达,也许能给大家一些启发的地方(如果不想听,可以直接跳过)。同时,这部分偏后的篇幅会更加个人,聊了聊一名宅男的日常生活,他长达几十年的玩游戏史,改变过他的游戏,以及从游戏中获得的世界观。祝大家2025年,正直勇敢有阅读量:)我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)02:55 第一节:谈人工智能 1. 我绝对不止做一棵树了 2. 你都不能让你雇的人相信,你怎么让大众相信? 3. 我做OpenAI CEO会比Sam Altman更好吗? 4. 理想同学+Mind GPT要去和豆包、Kimi竞争了? 5. 基座模型是操作系统+编程语言 6. L4就是智能体 7. 终极产品想象是硅基家人 8. 人工智能表达的是能力,不是功能 9. 李想有理想吗?56:12 第二节:谈智能驾驶 1. 三年我们能推出把方向盘摘掉的产品 2. 我们相比特斯拉又不缺胳膊少腿 3. L4实现,买车的人会更多 4. 我们100%会做机器人,但不是现在01:17:50 第三节:谈汽车之战 1. 买法拉利 2. 复盘MEGA失利 3. 今天做的所有事是为了拿L4门票 4. 对雷军说,小米车要想成功,你必须all in 5. 2030年,我们有概率做一辆超级跑车 6. 我从来没有司机01:42:47 第四节:消失的李想 1. 典型的李想的一天 2. AI是知识、认知和能力平权 3. 我人生最大改变是,对自己好 4. 从对事不对人,到先对人再做事 5. 只要所有的中国企业不放弃02:08:42 以上是对李想的正式访谈内容,以下是播客的加长内容。 02:08:42 补充内容(可跳过) 02:31:49 宅男、家庭、孩子、《再见爱人》、游戏和天梯 02:49:24 最后的快问快答嘉宾推荐的书:《高效能人士的七个习惯》苹果三部曲:《史蒂夫·乔布斯传》《蒂姆·库克传》《乔纳森传》【更多信息】本集文字版本:腾讯新闻原文 & 作者的收藏夹联络我们:微博@张小珺-Benita,小红书@张小珺jùn更多信息欢迎关注公众号:张小珺
-
86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路From 🇨🇳 张小珺Jùn|商业访谈录, published at 2024-12-22 00:00
今天这集是我和广密【全球大模型季报】第5集,是2024年Q4季报,也是我们录制的第二次跨年特辑。提前和大家见面啦:)这次你会发现,我们的聊天篇幅开始从大模型技术转向对大模型产品的探讨。很大概率来说,产品会是2025年AI的最大趋势之一。AI产品会如何落地?产品形态又会如何演变?广密带来了最新猜想。他提出,过去半年他最强烈的认知变化是,不管国外的ChatGPT、Anthropic、xAI、Perplexity,还是国内的豆包、Kimi,甚至是做Coding相关的Cursor、Devin……虽然各个产品的产品形态不一,从不同路径发散,但最后会殊途同归。他们最终很可能收敛到同一个叙事之下,争夺同一片领地。很开心转眼之间,【全球大模型季报】已经陪伴大家1年,明年仍然希望这个系列能持续地帮大家了解最前沿的AGI动态并带来认知进化。本集是《张小珺Jùn|商业访谈录》和《海外独角兽》的串台节目。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯。02:33 Part 1: OpenAI ChatGPT本质是奔着“下一个Google”方向去了,如何beat Google是最大的牌 一定要逛计算机历史博物馆,理解“计算架构+信息分发”演变的主线逻辑 Google也是从Yahoo边缘市场撑大做起来,伟大公司是从边缘市场起来 小红书非常有意思,融合了搜索+推荐+问答+做任务一体化 这些产品最终的最终会变成任务引擎、任务容器,是下一个Google 电商过去最核心的是GMV,订单转化率,AI时代我感觉是任务完成率 Chatbot对话形态大概率不是提取智能最有效的交互方式,模型如何更主动? 可能的一个产品形态是个人助理或者超级助理 Context非常核心,绝大多数人都还没意识到,是一条关键的暗线 如果AI的生成能力增强了,未来会生成的是什么?Mobile最大增量是内容,LLM最大增量新型软件 既然这些LLM产品想成为Google已经变成了一张明牌,你觉得Google有能力阻止这件事发生吗? “下一个Google”的产品,会是一家垄断吗? 微软和OpenAI同床异梦,微软可能会投资Anthropic51:04 Part 2: 硅谷其他AI公司和产品 Anthropic:得Coding,得开发者,得API消耗,有机会得生态,做OS Anthropic比较专注Agent,怎么让Agent更快落地是更高优先级 Killer App长期要有竞争力,要端到端垂直整合能力,向下优化,优化成本、模型架构、模型大小、调整模型数据分布、甚至向下优化推理芯片 xAI:还是注定要成功,但是upside还有多少不太确定 Perplexity:更像是一个信息处理的Agent Cursor:Coding产品形态要快速迭代,之前补全下一个代码,Cursor补全下一个Action,明年可能端到端生成软件 Devin:第一个真正意义上做长距离复杂任务的Agent,明年最具有商业价值的是long horizon Agent(长期规划智能体) Mistral:已经不用再关注了,他们内部也正式放弃预训练了01:02:24 Part 3: 对2025/2026关键预言性判断 1/ Long horizon task 是下个重点,重要核心圈子几个大佬级人物都在重点做 2/ 产品形态的探索,全新的交互界面 3/ AI商业模式的探索,今天商业模式还是移动梦网时代 4/ 高质量+scalable的数据,尤其是各个垂直行业里面,有没有几千条甚至上万条,任务+Reward数据,要高水平专家标注 5/ GPT-5/4.5 Orion:提升能有多大 6/ O1后面天花板走到哪:大规模scale RL/o1之后会怎么样,会不会很快遇到瓶颈 7/ 假设Coding能力明年提升10倍,软件开发范式怎么改变 8/ Context很重要,大家都还不够重视 创业公司没法同时做好这么多,得找锋利的切入点,一根针捅破天01:11:11 Part 4: 再谈Scaling Law Ilya最近提的pretrain data wall(预训练数据壁垒)是什么? 后训练中有一个关键问题是奖励模型(reward model),整个地球上没有一个reward model衡量所有人,你相信会未来有吗? O1系列天花板会卡在哪?这条路通往AGI吗? Scaling Law关键阻碍不是算力,不是算法,是data问题 ChatGPT有数据飞轮吗?未来会出现吗?哪些产品里有高价值数据?01:22:19 Part 5: 复盘2024 回顾一下,能定义2024年全球大模型产业的关键时刻? 全球大模型又狂卷一年,卷出了什么? 今天想要进入决赛圈,条件是什么? 哪些去年的判断你今天更坚信了,哪些去年的判断你今天认知有改变? Mega7巨头里面最看好哪个? 硅谷人才在流向哪几家公司? 明年如果只投一个方向,投什么? 这一轮大的机会,我总结是这3个…… 2024关键词?2025关键词?【全球大模型季报】系列2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观2024年Q1:和广密聊AGI大基建时代:电+芯片=产出智能2024年Q2:口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态2024年Q3:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺jùn更多信息欢迎关注公众号:张小珺
-
85. 与总统竞选成员聊,总统候选人与美国叙事如何PMF?From 🇨🇳 张小珺Jùn|商业访谈录, published at 2024-12-15 23:00
Kevin Xu曾经参加奥巴马总统竞选,并在美国商务部和白宫都工作过。今天,我邀请他来聊聊美国总统大选的幕后故事。由于Kevin在科技业从业多年,他提供了一种有意思的视角来看美国政治与大选活动——总统候选人作为一个产品,它在走向市场的过程中,如何与国家叙事实现PMF(Product Market Fit,产品市场匹配度)?我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 01:30 自我介绍 02:23 22岁参与奥巴马竞选团队,后担任他在白宫的新闻助理 03:13 美国大选的框架:scale up、地推、集资、媒体… 06:46 大选就是把产品(候选人)和市场(国家环境)做Product Market Fit 08:25 总统竞选成员每天具体在干嘛? 14:31 大选输赢对于竞选团队成员的职业生涯有多大影响? 15:30 大选怎么获胜?“首先你的产品要好” 19:25 从商务部(骆家辉任上)到白宫新闻部,给奥巴马写新闻稿 22:08 特朗普的胜选在预期内,有些与08年雷同 25:09 特朗普是个好产品吗?共和党缘何胜利?民主党缘何惨败? 30:12 奥巴马这个产品如果放在现在,还能fit今天的美国吗? 31:35 哈里斯是一个仓促的、还没有准备好的产品? 32:19 我在大选框架中亲历4次,大选当天都是枯燥的一天 33:36 是共和党跟着特朗普走,不是特朗普跟着共和党走,特朗普就是特朗普 34:50 特朗普如何争取硅谷精英选票?他对美国科技业的后续影响?【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺jùn更多信息欢迎关注公众号:张小珺
-
84. 融了近4亿的AI创业者在干嘛?岂凡超的第一次访谈From 🇨🇳 张小珺Jùn|商业访谈录, published at 2024-12-10 02:23
做这集节目是因为,我想看看那些融了很多钱的AI创业者在干嘛?他们似乎已经很久不出来发声了,把整个舆论场留给几家基础大模型公司和巨头们。本集嘉宾是深言科技创始人岂凡超。他公司的融资规模没有大模型公司那么大,但相比一般的创业者,也已经属于账上有非常多钱的了。在去年融资中,估值12亿元人民币。拿了这么多钱找方向,做了1年,他们现在怎么样了?这是岂凡超第一次接受访谈。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 01:48 自我介绍 02:45 94年,博士还没毕业开始创业 12:49 清华AI创业的脉络和门派 14:34 ChatGPT之前,见了100个投资人 22:18 ChatGPT之后,资本环境发生过山车式的变化 25:39 23年下半年开始发现差异化训模型变难,于是战略转型 29:30不认可模型即产品,未来没有模型公司 33:50 我们产品有5个模型组合,试图解决模型输出不确定性 40:11 产品构想:新闻阅读?信息助手? 42:40 内容生产消费分发变迁史 44:52 内容是信息的载体,从以内容为颗粒度到以信息为颗粒度 53:36 内容生产消费链路变化,重心一直从内容创作者往消费者移 56:49 新一代创作者会是什么样? 60:06 刚上线的产品:语鲸 70:30 聊聊好产品:Cursor、NotebookLM、Perplexity 73:55 创业像航海,没有航海图 81:18 我干的一件很蠢的事 83:18 90后CEO幼稚吗?大发雷霆吗?两面三刀吗?画饼吗?喜欢管理者做信息差管理吗? 88:28 大模型输出的不确定性很大程度影响AI组织 102:15 最后的快问快答嘉宾推荐的书:《自私的基因》《学会提问:批判性思维指南》【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺jùn更多信息欢迎关注公众号:张小珺
-
83. 黄仁勋和3万亿美元英伟达是如何炼成的?From 🇨🇳 张小珺Jùn|商业访谈录, published at 2024-12-04 14:17
最近关于英伟达战略和组织的新书《英伟达之道》上线,这本书的作者Tae Kim专访了黄仁勋。我邀请本书译者和上过我们节目的王亚军来聊聊:黄仁勋和3万亿美元英伟达是如何炼成的?我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:45 黄仁勋的危机感来源:移民家庭、在“问题少年学校”受霸凌 09:54 服务员黄仁勋特别不喜欢顾客点奶昔 16:16 英伟达的三位创始人和创办(黄仁勋、普里姆和马拉科夫斯基) 22:05 Nvidia为什么叫Nvidia:要成为让所有人嫉妒的公司? 23:52 英伟达发展的三个阶段:从NV1、NV2的败笔开始 36:22 细数英伟达发展史上的重大战略决策,成功的和再次失败的 48:57 黄仁勋怎么治理公司?白板文化、Top 5、机长、“战略不是文字,是行动”、“运送一整头牛”… 01:30:16 联合创始人普里姆的离开,黄仁勋没有二号位 01:33:11 3万亿美元英伟达是如何炼成的?往期英伟达节目:谈谈黄仁勋搭建的组织系统:分布式操作系统,“就像一台GPU”【更多信息】联络我们:微博@张小珺-Benita,小红书@张小珺jùn更多信息欢迎关注公众号:张小珺
-
82. 和以太坊Vitalik Buterin聊:LLM的权力、技术哲学观与猫From 🇨🇳 张小珺Jùn|商业访谈录, published at 2024-11-25 23:00
最近,我访谈了以太坊联合创始人Vitalik Buterin,他站在加密技术(Crypto)的彼岸远眺人工智能技术。Vitalik是俄裔加拿大人,出生于1994年,19岁大学辍学创立以太坊,20多岁成了最年轻的加密亿万富翁。在中国,人们称他“V神”。他试图阐述一种技术哲学观。在他的认知中,AI和Crypto代表的是两种底层哲学。AI更中心化、富有权力,它可能正在构建史无前例的强大权力中枢;而Crypto相反,倡导的是一种去中心、平等的生存主义哲学。技术革命或将推动关乎人类命运的“权力游戏”。我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:00 我会6门语言 05:00 站在Crypto技术浪潮那一端看人工智能革命,在想什么? 10:03 AI是非常有权力的,ChatGPT是非常中心化的应用 13:35 OpenAI第一步为了安全牺牲了开源,第二步为了利益牺牲了安全 28:21 如果人工智能的终极势力抑或是“老大哥”要毁灭人类… 35:18 比人类更聪明的东西一定会出现,有两种选择 37:56 Crypto和AI可以如何结合? 41:13 如果我们行业就是发个币、做个交易所,这个行业是失败的 44:44 为什么以太坊生态或Web3生态依然没有实际应用? 46:40 中心化的应用 vs 去中心化的应用(提到的产品名:Farcaster、Twitter、Warpcast、Firefly) 53:30 如何看待Crypto行业中的投机分子? 56:19 谈自己:生活、思考、恐惧【更多信息】本集文字版本:腾讯新闻原文 & 作者版本联络我们:微博@张小珺-Benita,小红书@张小珺jùn更多信息欢迎关注公众号:张小珺