
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
来源:经管之家
今天凌晨2点,著名大模型平台Anthropic发文传言称,DeepSeek,、Moonshot AI和MiniMax,使用24000个账号,与Claude进行了1600万次交互蒸馏其模型。
这一传闻迅速引发了网友的激烈讨论。但令人意外的是,舆论的风向并没有一边倒地支持Anthropic,并对其做法持怀疑态度。
我真没看出有什么问题。人们花钱使用你的产品,只要不违法,他们想怎么用就怎么用。
我看到有人用逆向工程打比方。如果你花钱买了一辆车,你可以把它拆开来,研究它的工作原理等等。
你们难道不是把整个互联网偷来训练AI模型的吗?
我真心希望这家公司倒闭,失败者的心态。
一家公司居然因为有 2.4 万名付费用户使用产品而恼火。你要怎么去规模化一个你压根不想让人用的东西?
我很困惑,你为啥反对这件事情呢?
所以你的意思是DeepSeek V4很快上线了?太期待了!
针对Anthropic的恶意诽谤,月之暗面已向律师Mike Hunt寻求法律咨询。
Anthropic是一家散布恐慌的公司,正在游说反对开源人工智能,目的是阻止你运行属于你自己的人工智能模型。
他们打着议程支持监管,把安全当作控制手段,只想设限垄断,而非保护,用心险恶千万别信他们。
你们难道不是爬取了整个互联网,还违反了无数服务条款吗?
哦,那你们的模型是用哪些数据合法训练出来的?你们又取得了谁的同意?
在所有论点里,你们偏偏选了最恶心、最充满恶意的那一个。
开源会把你们埋了,美国人。
这怎么就非法了?你刚才还说蒸馏可以用来创建更小的模型。
目前,关于Anthropic的公告讨论度特别激烈评论超2000。但赞同其观点的人不多,多数人都在指责它。并且认为Anthropic再一次会影响自己在公众中的形象。
什么是模型蒸馏
大模型蒸馏是AI训练里很常见的一种方法,也属于正常安全范围内。
其技术原理一点都不复杂,说白了就是给超级大模型减减负、传本事,让小模型也能有大本事,还不费资源。
咱们先说说为啥要做这件事,现在很多超级大模型,比如那些能写文章、会聊天、懂画画的,参数有几千亿甚至上万亿,就像一个学识渊博但体型笨重的老师,虽然啥都懂,但跑起来特别慢。
还特别费电、占内存,普通电脑、手机根本装不下,更别说顺畅运行了。
可我们平时用的小程序、手机APP里的智能功能,不需要这么笨重的“老师”,只需要一个小巧、反应快,还能解决问题的小徒弟。
这时候蒸馏就派上用场了,它核心就是让这个大模型当老师,把自己的本事手把手教给小模型,不用小模型从头慢慢学,省时间还能保效果。
就是先让大模型去处理大量的问题,不管是聊天、答题还是分析内容,都把它的思考逻辑、判断方式还有最终的结果,一一记录下来,相当于老师把自己毕生所学的经验和技巧,都整理成了最简单易懂的笔记。
然后再让小模型拿着这份笔记去学习,不用再去啃海量的原始数据,只需要吃透老师总结好的精华,慢慢模仿老师的思路,直到小模型处理问题的效果,无限接近大模型,但体型却小了几十倍甚至上百倍。
这样一来,小模型就能轻松装在手机、普通电脑里,运行起来飞快,成本也低了很多,平时我们用手机聊天、查资料,背后可能就是经过蒸馏的小模型在工作,既好用又不卡顿,这就是大模型蒸馏最实在的作用。
目前,关于Anthropic的指责传闻尚未得到官方证实,但它折射出的是AI行业日益激烈的竞争态势。
一方面,模型开发者投入巨资,自然希望保护核心竞争力;另一方面,技术普惠、降低使用门槛又是行业发展的必然趋势。
正如网友所言,如何界定数据使用的边界,如何平衡版权保护与技术创新,或许是接下来整个行业需要共同面对的课题。
本文基于网络流传信息进行探讨,具体事实以官方公告为准
新浪声明:此消息系转载自新浪合作媒体,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
海量资讯、精准解读,尽在新浪财经APP
责任编辑:宋雅芳
乐盈配资提示:文章来自网络,不代表本站观点。