国产精品久久久久久久久久久久午衣片,国产成人精品男人的天堂网站,熟女一区二区中文字幕,亚洲精品国产精品乱码在线

世界頭條:陶哲軒轉贊!ChatGPT自動(dòng)證明重大突破,10年后AI將稱(chēng)霸數學(xué)界

前幾天,一篇加州理工和MIT研究者用ChatGPT證明數學(xué)定理的論文爆火,在數學(xué)圈引發(fā)了極大關(guān)注。

英偉達首席科學(xué)家Jim Fan激動(dòng)轉發(fā),稱(chēng)AI數學(xué)Copilot已經(jīng)到來(lái),下一個(gè)發(fā)現新定理的,就是全自動(dòng)AI數學(xué)家了!


(資料圖)

紐約時(shí)報近日也發(fā)文,稱(chēng)數學(xué)家們做好準備,AI將在十年內趕上甚至超過(guò)最優(yōu)秀的人類(lèi)數學(xué)家。

而陶哲軒本人,也轉發(fā)了此文。

Siobhan Roberts參加了今年Machine Assisted Proofs舉辦的IPAM研討會(huì ),隨后她根據自己的經(jīng)歷和采訪(fǎng),寫(xiě)下了這篇關(guān)于A(yíng)I和數學(xué)的文章

AI也來(lái)顛覆數學(xué)界了!

如今,數學(xué)家們不得不正視一股最新的革命性力量——AI。

2019年,谷歌前雇員、現任灣區初創(chuàng )公司員工的計算機科學(xué)家Christian Szegedy預測,計算機系統將在十年內趕上或超過(guò)最優(yōu)秀的人類(lèi)數學(xué)家解決問(wèn)題的能力。而去年,他把目標日期修改為2026年。

卡內基梅隆大學(xué)的邏輯學(xué)家Jeremy Avigad(藍衣服),與學(xué)生在形式化數學(xué)暑期學(xué)校中

2018年菲爾茲獎得主、普林斯頓高等研究院的數學(xué)家Akshay Venkatesh目前還對使用AI不感興趣,但他十分熱衷于討論AI相關(guān)的話(huà)題。

去年的采訪(fǎng)中,Venkatesh表示,「我希望我的學(xué)生意識到,這個(gè)領(lǐng)域會(huì )發(fā)生非常大的變化?!?/p>

而最近他的態(tài)度是:「我不反對通過(guò)深思熟慮、甚至刻意地使用AI,來(lái)輔助人類(lèi)的理解。但我堅信,對于我們使用它的方式,我們需要保持正念,慎之又慎?!?/p>

在今年二月,加州大學(xué)洛杉磯分校理論與應用數學(xué)研究所,曾舉行了一場(chǎng)關(guān)于「機器輔助證明」的研討會(huì )。

研討會(huì )的主要組織者,就是2006年的菲爾茲獎得主、在UCLA任職的數學(xué)家陶哲軒。

他指出,用AI輔助數學(xué)證明,其實(shí)是非常值得關(guān)注的現象。

直到最近幾年,數學(xué)家才開(kāi)始擔心AI的潛在威脅,無(wú)論是AI對于數學(xué)美學(xué)的破壞,還是對于數學(xué)家本身的威脅。

而杰出的社區成員們,正在把這些問(wèn)題擺上臺面,開(kāi)始探索如何「打破禁忌」。

暑期學(xué)校的組織者,自左至右:Avigad,Patrick Massot和Heather Macbeth

從歐幾里得幾何原本到計算機代碼

幾千年來(lái),數學(xué)家已經(jīng)早已適應了邏輯和推理的最新進(jìn)展。不過(guò),他們準備好迎接人工智能了嗎?

洛杉磯蓋蒂博物館中17世紀古希臘數學(xué)家歐幾里得的肖像:他衣衫襤褸,舉著(zhù)自己的幾何論文《元素》

2000多年來(lái),歐幾里得的文本一直是數學(xué)論證和推理的范式。

卡內基梅隆大學(xué)邏輯學(xué)家Jeremy Avigad說(shuō),歐幾里得以近乎詩(shī)意的「定義」開(kāi)始,在此基礎上建立了當時(shí)的數學(xué)——使用基本概念、定義和先前的定理,每個(gè)連續的步驟都「清楚地遵循」以前的步驟,以這樣一種方式證明事物。

有人抱怨說(shuō),歐幾里得的一些「明顯」的步驟,其實(shí)不太明顯,但Avigad博士說(shuō),但這個(gè)系統奏效了。

但是到20世紀以后,數學(xué)家們不愿意再將數學(xué)建立在這種直觀(guān)的幾何基礎上了。

相反,他們開(kāi)發(fā)了正式的系統,這個(gè)系統中有著(zhù)精確的符號表示和機械的規則。

https://kilthub.cmu.edu/articles/journal_contribution/A_Formal_System_for_Euclid_s_Elements/6490703

最終,在這種系統下,數學(xué)可以被翻譯為計算機代碼。

1976年,四色定理成為第一個(gè)在暴力計算的幫助下被證明的主要定理。

四色定理:四種顏色足以填充地圖,使得沒(méi)有兩個(gè)相鄰區域顏色相同

會(huì )抱怨的AI:抱歉,我看不懂你們的定理

有這樣一個(gè)數學(xué)小工具,被稱(chēng)為證明助手,或交互式定理證明器。

數學(xué)家會(huì )一步一步地將證明轉換為代碼,然后用軟件程序檢查推理是否正確。

驗證過(guò)程會(huì )累積在一個(gè)動(dòng)態(tài)規范參考庫中,其他人都可以查閱。

https://www.andrew.cmu.edu/user/avigad/Papers/formal_turn.pdf

霍斯金森形式數學(xué)中心主任Avigad博士說(shuō),這種類(lèi)型的形式化為今天的數學(xué)奠定了基礎,就像歐幾里得試圖將那個(gè)時(shí)代的數學(xué)轉碼,從而為其提供基礎一樣。

最近,開(kāi)源證明助手系統Lean再次引發(fā)了大量關(guān)注。

Lean是現在的亞馬遜計算機科學(xué)家Leonardo de Moura在微軟時(shí)開(kāi)發(fā)的。

Lean使用的是自動(dòng)推理,由老式的AI GOFAI提供支持,這是一個(gè)受邏輯啟發(fā)的象征式AI。

截至目前,Lean已經(jīng)驗證了一個(gè)將球體從內到外轉動(dòng)的有趣定理,以及一個(gè)統一數學(xué)領(lǐng)域方案的關(guān)鍵定理。

但是,證明助手也有缺點(diǎn):它會(huì )時(shí)常抱怨自己不理解數學(xué)家輸入的定義、公理或推理步驟,因此它也被賜名「證明抱怨器」。

這些抱怨會(huì )讓研究變得繁瑣,但Fordham大學(xué)的數學(xué)家Heather Macbeth表示,這類(lèi)提供逐行反饋的功能,也會(huì )讓系統對教學(xué)很有用。

https://leanprover-community.github.io/courses.html

今年春天,Macbeth博士曾設計了一門(mén)「雙語(yǔ)」課程,她將黑板上的每個(gè)問(wèn)題都翻譯成講義中的Lean代碼,學(xué)生們需要用Lean和自然語(yǔ)言提交解決方案。

https://hrmacbeth.github.io/math2001/

「這給了他們信心,」Macbeth博士說(shuō),因為他們會(huì )收到即時(shí)反饋,關(guān)于證明何時(shí)完成,以及沿途的每一步是對還是錯。

而在參加研討會(huì )后,約翰霍普金斯大學(xué)的數學(xué)家Emily Riehl也嘗試了一把。

約翰霍普金斯大學(xué)的數學(xué)家Emily Riehl一直在使用實(shí)驗證明輔助程序

她用了一個(gè)證明助手小程序,來(lái)證明自己此前發(fā)表過(guò)的文章中的定理。

使用完后,她大為震驚?!肝椰F在很深入得了解了證明的過(guò)程,比我之前的理解要深刻得多。我的思路如此清晰,以至于我可以向最蠢的計算機解釋清楚?!?/p>

學(xué)生們在數學(xué)形式化暑期學(xué)校期間參加的一個(gè)小組項目

暴力推理——這很不「數學(xué)」

另一個(gè)計算機科學(xué)家們經(jīng)常會(huì )用來(lái)解決一些數學(xué)問(wèn)題的工具叫做「暴力推理」,但是數學(xué)界對于這種方法卻常常嗤之以鼻。

然而,AI科學(xué)家們好像并不太在意數學(xué)家們的想法,不斷地用他們自己熟悉的辦法,去攻占數學(xué)「高地」。

卡耐基梅隆大學(xué)的計算機科學(xué)家Heule曾經(jīng)在2016年用一個(gè)200T的「SAT 求解器」文件去解決「布爾畢達哥拉斯三元組問(wèn)題」。

https://cacm.acm.org/magazines/2017/8/219606-the-science-of-brute-force/fulltext

《自然》雜志在文章中卻說(shuō)到:200T的證明是史上最大的證明過(guò)程,用這些工具解決問(wèn)題是否真的算數學(xué)?

但是在解決問(wèn)題的論文作者本人,計算機科學(xué)家Heule看來(lái),「這種方法是解決超過(guò)人類(lèi)能力范圍的問(wèn)題所必須的?!?/p>

同樣的,在國際象棋比賽中戰勝了人類(lèi)(AlphaZero)之后,DeepMind又設計了機器學(xué)習算法來(lái)解決蛋白質(zhì)折疊(AlphaFold)。

DeepMind發(fā)表了一篇論文,認為他們取得這些成果的方式,是通過(guò)AI來(lái)引導人類(lèi)的直覺(jué),從而推進(jìn)數學(xué)發(fā)展。

https://www.nature.com/articles/s41586-021-04086-x

而一位前谷歌計算機科學(xué)家,現在正在灣區創(chuàng )業(yè)的Yuhuai Wu也表示,自己的創(chuàng )業(yè)的方向就是利用機器學(xué)習來(lái)解決數學(xué)問(wèn)題。

他目前的項目,Minerva,就是一個(gè)用來(lái)解決數學(xué)模型的微調大語(yǔ)言模型。

未來(lái),他希望這個(gè)項目能成長(cháng)為一個(gè)「自動(dòng)化數學(xué)家」,可以作為一個(gè)通用研究助理來(lái)「獨立解決數學(xué)問(wèn)題」。

數學(xué)是一個(gè)試金石

另一方面,很多深度接觸過(guò)AI技術(shù)的數學(xué)家也對AI在數學(xué)研究中不被重視提出了擔心。

他們認為,人工智能技術(shù)經(jīng)常能夠「直接地」幫助數學(xué)家們「找到」自己想要的答案。

雖然數學(xué)家或者AI專(zhuān)家們都搞不清楚AI是如何找到這個(gè)答案的。

與DeepMind合作過(guò)的數學(xué)家Geordie Williamson曾經(jīng)分享了一段與DeepMind合作的經(jīng)歷。

他在和DeepMind合作的過(guò)程中,DeepMind發(fā)現的一個(gè)神經(jīng)網(wǎng)絡(luò )可以預測他認為很重要的數據值,而且異常準確。

他就很努力地去試圖理解AI是如何做到的,因為這可能成為一個(gè)定理的基礎。

但他最后還是沒(méi)辦法搞懂AI的邏輯,而且DeepMind的人也沒(méi)法做到。

就像歐幾里得一樣,神經(jīng)網(wǎng)絡(luò )以某種方式找到了真理,但是邏輯原因卻很難被理解。

另一方面,從這位數學(xué)家的角度看來(lái),推理是數學(xué)的精髓,但卻是機器學(xué)習中一直缺少的一塊拼圖。

在科技圈中,如果有一個(gè)黑箱在大部分情況下都能提供解決問(wèn)題的方法,科技圈就會(huì )非常滿(mǎn)足了。

AI就是這樣一個(gè)黑箱。

但是數學(xué)家們卻不會(huì )滿(mǎn)足于這種狀況。

這位數學(xué)家看來(lái),嘗試理解神經(jīng)網(wǎng)絡(luò )的原理會(huì )引發(fā)出令人著(zhù)迷的數學(xué)問(wèn)題。

而解決這些問(wèn)題,會(huì )讓數學(xué)家「為世界做出有意義的貢獻」。

假如AI能證明數學(xué)定理

網(wǎng)友對此發(fā)出靈魂拷問(wèn),我對AI系統提出新的假設/公式是第一步有所懷疑,因為DeepMind早已在紐結理論中做到了。

我想知道,社區將如何應對AI輸出的大量新假設。check人工智能創(chuàng )建的邏輯論點(diǎn)是一回事;被數百萬(wàn)個(gè)「哦,這可能是真的」建議淹沒(méi)是另一回事。我不認為我們現有的評論和出版系統為此做好了準備。

這會(huì )對人們對數學(xué)的信任產(chǎn)生什么影響?

有人認為,機器并不能很快就能完成數學(xué)研究,但可以看到它改變了研究方式,就像機器學(xué)習模型和計算能力如何改變了生物學(xué)領(lǐng)域一樣。

還有網(wǎng)友表示,從AlphaDev開(kāi)始,我就一直在思考這個(gè)問(wèn)題,但是同樣的程序可以構建排序算法,也可以使用自動(dòng)證明檢查器來(lái)證明數學(xué)定理。真正的問(wèn)題是它是否可以用來(lái)證明一些重要的東西,而不僅僅是微不足道的發(fā)現。

不過(guò)還是有網(wǎng)友依然對GPT類(lèi)的工具能否真的發(fā)現有價(jià)值的真理持懷疑態(tài)度。

也有網(wǎng)友指出,可能人類(lèi)和AI對于數學(xué)理解和關(guān)注本就有區別,AI證明了什么是真的,而人類(lèi)總是關(guān)注為什么它是真的。

本文來(lái)源:新智元,原文標題:《陶哲軒轉贊!ChatGPT自動(dòng)證明重大突破,10年后AI將稱(chēng)霸數學(xué)界》

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞: