小道消息一直在說(shuō),昨天深夜或者今天凌晨,阿里會(huì)發(fā)Qwen3。
然后我特意早早的睡了一兩小時(shí),凌晨1點(diǎn)起床,就為了等Qwen3發(fā)。
結(jié)果這一等,就是好幾個(gè)小時(shí)。。。
不過(guò),功夫不負(fù)有心人。
凌晨5點(diǎn),我眼睛都睜不開的時(shí)候,終于等到了。
Qwen你賠我睡眠。。。
把報(bào)告看完,我總結(jié)一下,覺(jué)得*的亮點(diǎn)有6個(gè):
1. 模型能力登頂全球,這個(gè)沒(méi)啥可說(shuō)的,就是No.1。
2. *個(gè)開源的混合推理模型。
3. 8個(gè)不同尺寸的模型,幾乎覆蓋了所有場(chǎng)景。
4. 成本很低,旗艦?zāi)P?35B參數(shù)部署成本只要DeepSeek R1的三分之一。
5. 支持MCP協(xié)議。
6. 居然還支持了119種語(yǔ)言。
一起說(shuō)吧。
這次發(fā)了8個(gè)模型,Qwen3-0.6B、1.7B、4B、8B、14B、32B,這6個(gè)都是Dense稠密模型。
還有兩個(gè)重量級(jí)MoE模型,Qwen3-30B-A3B,和旗艦版的Qwen3-235B-A22B。
這次Qwen采用了新的命名方式,Qwen3-0.6B、1.7B、32B這種沒(méi)啥可說(shuō)的,大家都理解。
兩個(gè)MoE模型,把激活的參數(shù)寫在后面,Qwen3-235B-A22B的意思就是235B的參數(shù),但是在推理時(shí)只激活22B。
Qwen3-30B-A3B就是總參數(shù)量為30B,激活參數(shù)3B,這個(gè)還蠻有意思的。
而且,所有的模型,都是混合推理模型。
大概的意思就是,你既可以把它當(dāng)不會(huì)長(zhǎng)思考沒(méi)有思維鏈的普通模型用,也可以直接開啟推理模式,變成一個(gè)推理模型。
可以簡(jiǎn)單的理解為,把DeepSeek V3和R1直接揉在了一起。
就像我們其實(shí)都知道,DeepSeek這個(gè)深度思考,你打開的時(shí)候,是R1模型,但是你關(guān)掉,其實(shí)用的是v3來(lái)給你回答。
但是Qwen3,是一體的。
是一個(gè)模型,只不過(guò)支持了兩種模式,這個(gè)不管對(duì)于開發(fā)者還是使用者,都方便很多。
整體上,8個(gè)模型,誠(chéng)意足到爆炸,小到0.6B,大到235B,能打手機(jī)端側(cè),也能打旗艦體驗(yàn),全部一次性開源了,而且都是Apache 2.0協(xié)議,想怎么用就怎么用,想商用就商用,沒(méi)啥顧慮。
Qwen3-0.6B~4B的*Token都是32K,其他的都是128K。
性能上,稍微有點(diǎn)離譜。
Qwen3-4B的小模型,就已經(jīng)能和上一代QwQ-32B這玩意打得有來(lái)有回。而Qwen3-30B-A3B,更是幾乎就比QwQ-32B全方位的強(qiáng)。
至于最牛逼的那個(gè)Qwen3-235B-A22B,他們甚至沒(méi)只跟開源模型比,比的全都是最*的閉源模型。
最主要的是,這玩意部署成本,大概只有DeepSeek R1的三分之一啊。。。
什么叫便宜大碗,這就是。
但是這么一對(duì)比,忽然發(fā)現(xiàn),Gemini2.5-Pro,好像有點(diǎn)猛。。。
同時(shí),在性能水桶式提升的背景下,也有了更強(qiáng)的Agent能力,也支持MCP了。
他們官方自己放了一段視頻。
我也隨手把即夢(mèng)接了進(jìn)去,可以直接用Qwen3來(lái)調(diào)用即夢(mèng)畫圖了。。。
就還真的,挺好玩,你的下一個(gè)即夢(mèng),又何必是即夢(mèng)呢(狗頭。
除了這些模型的能力,Qwen3這次還有一個(gè)很有趣的東西。
就是語(yǔ)言。
上一代的Qwen2.5,只支持包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等 29 種語(yǔ)言。
而這一次,支持119種語(yǔ)言了。
不是,到底誰(shuí)才是真正的OpenAI啊。
這妥妥是為世界人民謀福利好吧。。。
項(xiàng)目地址都在這了。
Blog: https://qwenlm.github.io/blog/qwen3/
GitHub: https://github.com/QwenLM/Qwen3
你牛逼的話可以自己部署,我5080勉強(qiáng)跑個(gè)Qwen3-8B,實(shí)在跑不起。
想體驗(yàn)的話,可以直接去通義和Qwen Chat,都可以。
通義:https://www.tongyi.com/qianwen/
Qwen Chat:https://chat.qwen.ai/
我自己直接在Qwen Chat上面實(shí)測(cè)了一波,一進(jìn)來(lái)左上角就默認(rèn)是旗艦版Qwen3。
嗯,就是比較抽象的是,提示語(yǔ)都居然都變成早上好,卡茲克了。。。
你可以在左上角,切換3個(gè)這次Qwen3比較有代表的模型來(lái)進(jìn)行對(duì)比。
左下角的深度思考,就能是否開啟推理的開關(guān)。
而且這個(gè)開關(guān)還能拖動(dòng)滑塊,決定它的*思考長(zhǎng)度,雖然這個(gè)功能很極客,但是還有意思。
我自己的實(shí)測(cè)結(jié)論就是:水桶級(jí)別,中等偏上。
比如讓它給我生成一個(gè)登錄頁(yè)。
效果很不錯(cuò),能直接干出一個(gè)很酷的界面。
https://us4mpg09fz.app.yourware.so/
或者做藏師傅搞得可交互的網(wǎng)頁(yè),把吃瓜PDF變成在線時(shí)間線。
這時(shí)候你就會(huì)發(fā)現(xiàn),審美會(huì)差一點(diǎn),豐富度也會(huì)不是特別狗,稍微有一點(diǎn)點(diǎn)勉強(qiáng)了。
藏師傅之前的可視化網(wǎng)頁(yè)P(yáng)rompt如下::
我會(huì)給你一個(gè)文件,分析內(nèi)容,并將其轉(zhuǎn)化為美觀漂亮的中文可視化網(wǎng)頁(yè)作品集:## 內(nèi)容要求- 保持原文件的核心信息,但以更易讀、可視化的方式呈現(xiàn)- 在頁(yè)面底部添加作者信息區(qū)域,包含: * 作者姓名: [作者姓名] * 社交媒體鏈接: 至少包含Twitter/X: - 版權(quán)信息和年份## 設(shè)計(jì)風(fēng)格- 整體風(fēng)格參考Linear App的簡(jiǎn)約現(xiàn)代設(shè)計(jì)- 使用清晰的視覺(jué)層次結(jié)構(gòu),突出重要內(nèi)容- 配色方案應(yīng)專業(yè)、和諧,適合長(zhǎng)時(shí)間閱讀## 技術(shù)規(guī)范- 使用HTML5、TailwindCSS 3.0+(通過(guò)CDN引入)和必要的JavaScript- 實(shí)現(xiàn)完整的深色/淺色模式切換功能,默認(rèn)跟隨系統(tǒng)設(shè)置- 代碼結(jié)構(gòu)清晰,包含適當(dāng)注釋,便于理解和維護(hù)## 響應(yīng)式設(shè)計(jì)- 頁(yè)面必須在所有設(shè)備上(手機(jī)、平板、桌面)*展示- 針對(duì)不同屏幕尺寸優(yōu)化布局和字體大小- 確保移動(dòng)端有良好的觸控體驗(yàn)## 媒體資源- 使用文檔中的Markdown圖片鏈接(如果有的話)- 使用文檔中的視頻嵌入代碼(如果有的話)## 圖標(biāo)與視覺(jué)元素- 使用專業(yè)圖標(biāo)庫(kù)如Font Awesome或Material Icons(通過(guò)CDN引入)- 根據(jù)內(nèi)容主題選擇合適的插圖或圖表展示數(shù)據(jù)- 避免使用emoji作為主要圖標(biāo)## 交互體驗(yàn)- 添加適當(dāng)?shù)奈⒔换バЧ嵘脩趔w驗(yàn): * 按鈕懸停時(shí)有輕微放大和顏色變化 * 卡片元素懸停時(shí)有精致的陰影和邊框效果 * 頁(yè)面滾動(dòng)時(shí)有平滑過(guò)渡效果 * 內(nèi)容區(qū)塊加載時(shí)有優(yōu)雅的淡入動(dòng)畫## 性能優(yōu)化- 確保頁(yè)面加載速度快,避免不必要的大型資源- 實(shí)現(xiàn)懶加載技術(shù)用于長(zhǎng)頁(yè)面內(nèi)容## 輸出要求- 提供完整可運(yùn)行的單一HTML文件,包含所有必要的CSS和JavaScript- 確保代碼符合W3C標(biāo)準(zhǔn),無(wú)錯(cuò)誤警告- 頁(yè)面在不同瀏覽器中保持一致的外觀和功能請(qǐng)根據(jù)上傳文件的內(nèi)容類型(文檔、數(shù)據(jù)、圖片等),創(chuàng)建最適合展示該內(nèi)容的可視化網(wǎng)頁(yè)。
而如果再讓它寫一個(gè)之前我在文章里放的洛小山的彈球游戲。就確實(shí)沒(méi)有那么亮眼,在游玩的時(shí)候還有一些些BUG。
但是畢竟這個(gè)游戲還是太復(fù)雜了,人模型的尺寸也沒(méi)那么大,也沒(méi)法既要又要。
如果是做稍微簡(jiǎn)單一點(diǎn)的連連看游戲,就還是比較簡(jiǎn)單了。
,所有的游戲文字都是英文
除了代碼,邏輯問(wèn)題,現(xiàn)在基本也不太能難道現(xiàn)在的推理大模型了。
不過(guò)在遇到一些非常離奇非正常的測(cè)試prompt時(shí),還是會(huì)有一點(diǎn)點(diǎn)掉智。
文筆的話,親測(cè)會(huì)比DeepSeek好一些。
但是略遜于GPT-4o。
如果你還想玩一點(diǎn)花活,還能跟即夢(mèng)打通做結(jié)合。
就能實(shí)現(xiàn)類似于那種原生多模態(tài)模型,圖文混排的效果。
還是超級(jí)有意思的。
總之,這次Qwen3的發(fā)布,真的有點(diǎn)像是深夜街頭,突然亮起的那盞霓虹燈。
不僅亮,還便宜。
不僅便宜,還能庫(kù)庫(kù)的切換顏色。
這一波下來(lái),阿里確實(shí)是拿出了一種很阿里的態(tài)度。
8點(diǎn)了,天也亮了。
該去睡覺(jué)了。
最后。
Qwen3,歡迎來(lái)到這個(gè)荒誕又燦爛的時(shí)代。
咱們,下個(gè)奇點(diǎn)見(jiàn)。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...