亚快企业服务(亚快集团)旗下外贸供应链综合服务平台



梁文锋幻方创业旧事

日期:2025-04-10 06:17 来源:美高梅官网正网



  2023年4月,幻方颁发过文章 《幻方新征程》,提出要全力打制AGI。其时的宣传海报上,用的就是特吕弗的一句写给年轻导演的警告,务需要疯狂地拥抱大志,同时疯狂地热诚。这句话的后面一句是明天的片子将会片如其人。明天的片子将是一次爱的步履。

  2015年起头,一些中国的AI创业公司起头测验考试将NLP、深度进修等手艺使用正在金融范畴。其时,有2个事务,使得量化基金的概念正在中国市场上起头遭到关心。

  由于不是上市公司,幻方的收入不公开,但从能够查到的资产规模和产物收益来猜测,幻方这几年的办理费正在每年10亿摆布,业绩提成好的年份可能正在几十亿。近年来,幻方曾经很少对外募资,根基都是自有资金。

  现实上,除了NPU的营业,幻朴直在2020年前后,还测验考试过几回分歧的第二增加曲线营业。但最终都由于不达预期,最初放弃了。

  成立幻方而不是继续做雅克比的缘由是,他感觉其时中国量化买卖将从“单兵逛侠”的时代转向极客汇聚的私募基金时代。

  这里还有一段和大疆创始人汪涛的交集。梁文锋创业做幻方前,大疆的创始人汪涛曾想招募梁文锋。次要也取梁文锋其时的研究标的目的相关。

  梁文锋和幻方也根基着中国量化基金的保守,会按期做公益。据相关数据,2022年幻方量化共计向慈善机构捐赠2。2138亿元;梁文锋小我以“一只普通的小猪”的表面向慈善机构捐赠1。38亿元。

  2013年,28岁的梁文锋取同样来自浙江大学的同窗徐进一路开办了杭州雅克比投资办理无限公司。到2015年,幻方成立时,他本人就有过亿元的资产。

  “萤火二号”规划中的AI算力为1550PFLOPS(TF32)。按照其时的预估,该当是其时全球算力最强大的AI超算之一。正在2021岁首年月的时候,已交付的AI算力为325PFLOPS(TF32),是“萤火一号”的18倍,机能上有质的飞跃。“萤火一号”其时也正在拆解。后续卖卡,听说也没有吃亏出格多钱。

  幻朴直在AI上的投入,正在2018年摆布就正在中国市场上被关心到,从18年起头,幻方一曲是中国AI公司里GPU具有量最高的几家公司之一。

  2015年,成立幻方的时候,梁文锋其时是看到了正在美国,量化买卖的日成交量曾经占领金融市场的近八成份额;但中国方才起步。这此中,最次要的促成要素该当就包罗了2015年4月,中证500股指期货上市。他预见,跟着中国金融衍生品的日趋丰硕,出格是股指期权和个股期权的上市,中国的量化买卖将送来一个快速成长的黄金时代。

  2018年摆布,幻方的GPU数量就曾经达到千卡;2019年,梁文锋开办幻方AI公司,投资2亿元自从研发深度进修锻炼平台“萤火一号”,搭载了1100块GPU显卡;2020年,“萤火一号”投入利用。

  2023年7月,梁文锋开办了杭州深度求索人工智能根本手艺研究无限公司,就是DeepSeek。到11月时,发布了第一款模子,是一款名为Coder 的代码模子。12月,又发布了通用狂言语模子:DeepSeek LLM 67B。比拟开源的同级别模子 LLaMA2 70B,DeepSeek LLM 67B 正在近20个中英文的公开评测榜单上表示更佳。特别凸起的是推理、数学、编程等能力(如:HumanEval、MATH、CEval、CMMLU)。其时就选择了完全开源,正在中国市场也激发了惊动。

  算力的需求大一个缘由是营业需要。2016年10月21日,幻方量化推出第一个AI模子,第一份由深度进修生成的买卖仓位上线施行,利用GPU进行计较,正在此之前,梁文锋团队的算法次要依托线性模子和保守机械进修算法,模子计较次要依赖于CPU。2017年,幻方几乎所有的量化策略曾经都采用AI模子计较。

  创始人其时能找到的宣传的点还不多,讲的公司的次要价值仍是为市场贡献了超额的买卖印花税。不外,“幻方”成立没多久就曾经实现了每年买卖流水股票数百亿,期货过万亿。即便如斯,其时公司的息里,梁文锋就提到了本人的抱负是有朝一日可以或许取世界级的量化买卖泰斗——西蒙斯的文艺回复公司相媲美。

  梁文锋认为量化买卖的特点必定了成功的量化买卖者必需是一个高程度编程者。其时也分享了他的实现方式。最后他是通过数字图像处置的方式来截取行情软件中的数据,进而写外挂法式,破解买卖软件接口,正在国内量化买卖仍是荒蛮时代的2008年就挖掘到了本人的第一桶金。

  此后的幻方送来了快速成长。2016年,办理的资金规模曾经大约10亿元。2017年,达到30亿元。2019年,跨越百亿元。巅峰期是2021年,规模达到1000亿人平易近币。可是,昔时由于业绩欠好,此后本人也正在缩减规模。

  DeepSeek正在中国市场上第一次惹起大范畴关心是正在2024年 5 月 6 日。其时,DeepSeek发布二代MoE大模子DeepSeek-V2,能力对标 GPT-4、l 3-70B,订价为每百万 tokens 的输入和输出别离是1 元和2元,是GPT-4 Turbo价钱的近百分之一,掀起了中国市场上的降价潮。字节、智谱、阿里、百度、讯飞、腾讯等也先后插手到降价海潮中。到 5 月 22 日,ERNIE Speed、ERNIE Lite、讯飞星火 Lite、混元-lite 模子等均已实现限制前提下免费。

  幻方“萤火一号”超算占地面积相当于一个篮球场,功耗400KW,由一个存储集群和一个计较集群构成。存储集群供给每秒次IO响应、4。1Tbps读写带宽以及1。2PB容量。计较集群搭载1100张高端显卡,每秒能够进行1。84亿亿次浮点运算(18。4PFLOPS, 32位精度),相当于4万台小我电脑算力。所有节点通过200Gbps Infiniband互换机进行互联。

  正在近期发布的V3的论文里,特地提出了一系列对硬件厂商设想下一代芯片的方案的。从零星的员工分享消息来看,目前他们该当也正在做AI芯片。

  郑达韡正在插手幻方前身雅克比投资办理无限公司前,就有比力长时间的手艺工做经验,2011年到2012年期间,也曾正在昌大立异院做研究员。

  比来,DeepSeek激发了全球范畴内的关心。正在拾掇英文相关的内容时,也想到了一些做记者时记实的幻方晚期的笔记, 从头做了下梳理。

  DeepSeek团队以90后、95后为从,喜好“高潜力年轻人”。据报道,梁文锋曾正在采访中暗示,留住年轻人才的方式次要是“高薪”和“算力管够”两条。

  给公司取名“幻方科技”,是由于“幻方”取自于中国古代洛书《九宫图》,是一种特殊的矩阵,是科学的结晶取吉利的意味。

  现实上,2018年,梁文锋确立公司以AI为次要成长标的目的,幻方量化也碰到了算力瓶颈,日益添加的锻炼需求受限于无限的计较资本,梁文锋起头寻求大规模算力处理方案。2019年前后,幻方还成立过特地的团队做过AI NPU芯片的营业,其时的聘请薪资根基上是正在杭州50-150万元级别。

  正在2019年前,幻方的手续费是很高的。业绩也很好。其时,梁文锋也对外讲过压力很大,由于若是一年跑赢指数低于25%,投资人是不合错误劲的。”。

  DeepSeek所正在的公司为杭州深度求索人工智能根本手艺研究无限公司,由宁波程恩企业办理征询无限公司持股99%,梁文锋持股1%。

  2021年前后,幻方是国内为数不多的万卡集群的公司。一个说法是,幻方很可能取商汤是仅有的2家GPU过万的创业公司。另一个说法是,其时国内跨越1万枚GPU的企业不跨越5家,并且除了幻方之外,其他4家公司都是互联网大厂。2021年,幻方斥资10亿元扶植“萤火二号”,其时采购的次要是英伟达A100显卡。

  现实上,Deepseek的立异能力一曲很强。分歧的是,Deepseek几乎从根本设备搭建,到底层硬件优化,到模子算法立异,一整个本人沉做了一遍。

  第一个是政策,2015年4月,中证500股指期货上市,这被认为量化基金能够有更大阐扬空间。第二个是传说风闻,其时中国A股有一个传说风闻,一个俄罗斯的高级法式员团队,正在2014-2015年间,借帮量化买卖,仅用一两万万元本金,赔到了五六百亿。

  2008年,他带着8万元本金,起头了本人的量化买卖之。2015年,履历过7年熊市牛市大,以每年跨越100%的复合收益率迈入了亿元富豪的步队。这亿元的财富全数来自于中国证券和期货市场,窍门他本人开辟出的量化买卖系统。

  1985年,梁文锋出生于广东湛江。2002年,17岁的梁文锋考入了浙江大学电子消息工程专业。2007年,22岁的梁文锋考上浙江大学消息取通信工程专业研究生。他师从项志宇,次要做机械视觉研究。梁文锋其时正在读大学期间写了 一种鲁棒的PTZ摄像机方针算法 相关的论文。

  取过去十年,AI范畴的诸多创业公司分歧,这家公司一曲相对低调,很少接管采访。少有的几回接管采访,也只是为了聘请更优良的人才。

  有息跟据领英网坐检索样本拾掇,发觉DeepSeek员工85%以上具有硕士学位,40%以上有博士学位。团队平均春秋约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。

  虽然DeepSeek正在英语语境里是一家新公司 , 但正在中国跟着2018年前后,这家公司逐步成为中国市场上具有最大都量GPU的几家公司之一,幻朴直在AI范畴的出名度逐渐提高。

  一名曾取DeepSeek有过合做的猎头暗示,DeepSeek很是偏心没有工做经验的年轻人,并且指明不要资深人士,“工做经验正在3~5年曾经是最多的了,工做超8年的根基就pass了”。

  保守AI集群的设想方针往往是支撑多个小型模子同时进行锻炼,而“萤火一号”特地设想为锻炼一个超大规模的模子。一个4亿参数的大型经济阐发模子,正在幻方上一代高机能集群(4台DGX-2, 100G-IB互联)上锻炼需要2个月时间,而“萤火一号”仅需84小时。

  幻方晚期成立的时候,做为创业公司,关心度其实是不高的。好比,也有过靠一夜成名一夜暴富的实正在案例、HR同事照片、Herman Miller Embody奢华办公椅如许的故事,来吸引候选人,来聘请人才的阶段。

  股权穿透后,能够看到,公司次要有四位合股人,别离是:梁文锋、郑达韡、陈哲、李欢。这也是梁文锋正在浙大期间的同窗。彼此很熟悉很领会,晚期插手的良多员工也都是同窗或者低一两届的师弟师妹。此中,郑达韡和李欢担任人工智能,陈哲次要担任订价方面的事,就期权和债券,他曾正在广发证券资管处置量化策略研究及投资工做。