圖片來(lái)源@視覺(jué)中國(guó)
(相關(guān)資料圖)
大模型的風(fēng)已經(jīng)不可避免地刮到了大數(shù)據(jù)行業(yè),火藥味還不小。
這不快臨近了有人注意到,兩家大數(shù)據(jù)行業(yè)的“宿敵”Databricks和Snowflake,今年雙雙把各自一年一度最重要的峰會(huì)選在了同一時(shí)段——6月26日-29日舉辦。
這可是這么多年來(lái)都沒(méi)有過(guò)的事。
不僅如此,他們還“不約而同”把今年大會(huì)的主題都往AI靠攏了。Databricks直接給大會(huì)取名叫“Data+AI Summit”,官網(wǎng)一點(diǎn)進(jìn)去就是一個(gè)碩大的“Generation AI”:
請(qǐng)輸入圖說(shuō)
Snowflake也給自己的大會(huì)加了一個(gè)很牛的定語(yǔ),“全球最大的數(shù)據(jù)、App和AI主題大會(huì)”:
這說(shuō)明了什么?說(shuō)明兩家公司在明目張膽逼著參會(huì)者們做選擇:你要去了他們的會(huì),再來(lái)我們這恐怕是來(lái)不及了。
要知道這倆公司,一個(gè)在舊金山,一個(gè)在拉斯維加斯,自駕要9個(gè)小時(shí),飛機(jī)也得飛1個(gè)半小時(shí)。參會(huì)者想兼得魚(yú)和熊掌,怕不是要折騰個(gè)夠嗆。
下面重頭戲來(lái)了,不僅時(shí)間重合,兩家公司都各自請(qǐng)到了重磅嘉賓來(lái)發(fā)表主題演講——Databricks請(qǐng)到的是微軟的CEO薩蒂亞·納德拉(Satya Nadella),Snowflake則是英偉達(dá)CEO黃仁勛。
個(gè)個(gè)都是大佬。
有網(wǎng)友提醒大家,鑒于兩家公司的峰會(huì)在同一時(shí)間舉辦,“如果你還沒(méi)選邊站,那么現(xiàn)在該你選擇的時(shí)候到了”。
當(dāng)然也有不乏準(zhǔn)備兩邊跑的人。Striim公司的產(chǎn)品經(jīng)理John Kutay就計(jì)劃在兩個(gè)大會(huì)上分別發(fā)表講話,不過(guò)也“將評(píng)估拉斯維加斯和舊金山兩地的路程和時(shí)間”。
有還沒(méi)做好決定的網(wǎng)友問(wèn)他在Databricks上的發(fā)言內(nèi)容會(huì)是啥,“我想去,但是到時(shí)候還得趕去SF,唉?!?/p>
對(duì)此,甚至還有個(gè)網(wǎng)友做了個(gè)離譜的夢(mèng),“剛剛夢(mèng)到所有人都在Snowflake的大會(huì)上感染新冠了,因?yàn)镾nowflake不想讓我們參加Databricks的峰會(huì)……”
Snowflake和Databricks都是目前大數(shù)據(jù)分析公司中的佼佼者。前者于2021年創(chuàng)辦,并在2020年9月上市,上市首日收盤(pán)股價(jià)飆升111.6%,報(bào)253.93美元,成為美國(guó)有史以來(lái)規(guī)模最大的軟件IPO。
此外,Snowflake的股東名單里還不乏Salesforce和巴菲特這樣大名鼎鼎的投資方。
創(chuàng)辦于2013年的Databricks則是目前一級(jí)市場(chǎng)中的超級(jí)獨(dú)角獸,曾在2021年連續(xù)獲得兩輪10億美元級(jí)別的大額融資,估值高達(dá)380億美元(2021年數(shù)據(jù))。
一些中國(guó)從業(yè)者也更習(xí)慣叫它“磚廠”。
兩家公司不僅經(jīng)常被外界拿來(lái)做比較,彼此之間也總是明著暗著各種較勁。
最著名的一次喊話是在2021年。當(dāng)時(shí)眼看著Snowflake靠著云數(shù)據(jù)倉(cāng)庫(kù)就做到了千億市值,Databricks坐不住了,發(fā)了一篇文章稱其數(shù)據(jù)湖技術(shù)創(chuàng)下了TPC-DS基準(zhǔn)測(cè)試新記錄。
重點(diǎn)是,Databricks還強(qiáng)調(diào)了第三方研究表明其實(shí)際性能可達(dá)Snowflake的2.5倍。
接著過(guò)了十天,Snowflake做出回應(yīng),發(fā)布了自己的測(cè)試結(jié)果,同時(shí)稱Databricks公布的性能比較結(jié)論缺乏完整性,而且研究本身也存在缺陷。
Snowflake創(chuàng)始人還強(qiáng)調(diào)這種基準(zhǔn)測(cè)試沒(méi)什么意義,在這個(gè)年代發(fā)布數(shù)據(jù)庫(kù)基準(zhǔn)測(cè)試結(jié)果是“將正常的技術(shù)交流變成了缺乏完整性的營(yíng)銷噱頭”。
不甘心的Databricks再次回應(yīng),創(chuàng)始人發(fā)了一篇博客,這次是更嚴(yán)重的指控:Snowflake為了測(cè)試結(jié)果竟然改了TPC-DS的輸入數(shù)據(jù)。
從那之后,兩家之間的互嗆就沒(méi)有停過(guò)。
在去年和投資人Matt Turck的一次對(duì)話中,Databricks的聯(lián)合創(chuàng)始人兼CEO Ali Ghodsi還不避諱地談到了與Snowflake的競(jìng)爭(zhēng)。
他先是商業(yè)性地夸了下Snowflake有著“可能是市場(chǎng)上最好的數(shù)據(jù)倉(cāng)庫(kù)”,并且“Databricks與Snowflake將共存于可能70%的客戶中”。
這里補(bǔ)充一點(diǎn),Snowflake主要用的是數(shù)據(jù)倉(cāng)庫(kù)技術(shù),Databricks用的則是數(shù)據(jù)湖技術(shù),這也是兩家技術(shù)思路最主要的不同。
接著Ali Ghodsi就宣傳起了自家的數(shù)據(jù)湖,“公有云計(jì)算供應(yīng)商有動(dòng)力推動(dòng)更多人把數(shù)據(jù)存到他們的數(shù)據(jù)湖中……我認(rèn)為數(shù)據(jù)湖的范式將獲勝?!?/p>
產(chǎn)品性能上的你追我趕還沒(méi)完,現(xiàn)在Databricks和Snowflake又暗戳戳在大模型上較上勁了。
Databricks在今年3月發(fā)布了一個(gè)名叫Dolly(據(jù)說(shuō)是為了向第一只克隆羊多莉致敬)的開(kāi)源大語(yǔ)言模型,稱“只需30美元、一臺(tái)服務(wù)器和三個(gè)小時(shí),我們就能教Dolly開(kāi)始進(jìn)行人類級(jí)別的交互”。
這明擺著也是在針對(duì)ChatGPT這樣門(mén)檻更高的產(chǎn)品,意思就是AI不再是只有大型科技公司才能負(fù)擔(dān)得起的東西,不用拿多少融資,任何人都能開(kāi)發(fā)出一個(gè)真正像人類的AI。
Databricks接著又在4月發(fā)布了該大語(yǔ)言模型的開(kāi)源迭代版本Dolly 2.0。
Snowflake這邊也在不斷炒作大模型,在4月發(fā)布文章稱正在為生成式AI和大語(yǔ)言模型搭建一個(gè)以數(shù)據(jù)為中心的平臺(tái),并在文中詳細(xì)解讀了這么做的依據(jù)和將帶來(lái)的影響。
隨后的5月,Snowflake宣布收購(gòu)初創(chuàng)公司Neeva,以在其數(shù)據(jù)云平臺(tái)中添加基于AI的生成搜索。
雖然在AI大模型方面兩家公司還沒(méi)有互踏進(jìn)對(duì)方的領(lǐng)地,不過(guò)這次年度峰會(huì)舉辦時(shí)間的重疊已經(jīng)說(shuō)明了他們的態(tài)度。
有趣的是,有人在谷歌搜索“Snowflake conference”,出來(lái)的第一個(gè)結(jié)果卻是Databricks家的大會(huì)鏈接,其次才是Snowflake的。
就等于說(shuō),Databricks買了競(jìng)爭(zhēng)對(duì)手的關(guān)鍵字,來(lái)賣自己的廣告。
我們也發(fā)現(xiàn),在谷歌同時(shí)輸入“Databricks+Snowflake”搜索,前兩條都是廣告(這個(gè)結(jié)果是動(dòng)態(tài)展示的)——Databricks依然在競(jìng)價(jià)排名的第一位置宣傳著自己取得的成績(jī),但第二則是一家技術(shù)服務(wù)商,在宣傳自己幫客戶遷移到Snowflake的服務(wù),這個(gè)投放甚至比前面有人發(fā)現(xiàn)的兩家直接競(jìng)價(jià)的情況更有意思,Databricks依然可以被解讀為(在商業(yè)攻勢(shì)上)進(jìn)攻性更強(qiáng)、更有戰(zhàn)斗力的一方,但在兩家的競(jìng)爭(zhēng)中一些技術(shù)服務(wù)商也在抓緊尋找商機(jī),而且似乎更認(rèn)為轉(zhuǎn)移到Snowflake 的需求更大…
不論如何,一場(chǎng)大戰(zhàn)又要打響了?,F(xiàn)在大模型領(lǐng)域不缺攪局者,到了Databricks和Snowflake這里,興許就成了誰(shuí)先干掉誰(shuí)的問(wèn)題。