最好看的小说排行,完美世界有声小说全集,欢乐颂小说

以下文章來源于穿云尋恒星，作者Max

1. 從周五到周末ChatGPT已經(jīng)瘋傳開來，其對話能力讓人驚艷。從玩梗、寫詩、寫劇本，到給程序找bug，幫人設(shè)計網(wǎng)頁，甚至幫你生成AIGC的提示詞，一副無所不能的樣子?？梢匀witter上看Ben Tossell梳理的一些例子，或者自己去試試！一位MBA老師讓ChatGPT回答自己的管理學(xué)題目，結(jié)論是以后不能再布置可以帶回家的作業(yè)了。很多人用了以后無法自拔，就如這位所見：

Musk問ChatGPT怎么設(shè)計Twitter(不得不說還挺有創(chuàng)意）：

2. 有人讓ChatGPT參加了智商測試，得分83; SAT測試得分1020，對應(yīng)人類考生52%分位。要知道ChatGPT并沒有對數(shù)學(xué)方面做過優(yōu)化，已經(jīng)是相當(dāng)不錯的結(jié)果了。

3. ChatGPT的提升點

相比之前的GPT-3，ChatGPT的提升點在于能記住之前的對話，連續(xù)對話的感覺讓人舒服。

ChatGPT可以承認錯誤，如果你認為他的回答不對，你可以讓他改正，并給出更好的答案。

ChatGPT可以質(zhì)疑不正確的前提，GPT-3剛發(fā)布后很多人測試的體驗并不好，因為AI經(jīng)常創(chuàng)造虛假的內(nèi)容（只是話語通順，但脫離實際），而現(xiàn)在再問“哥倫布2015年來到美國的情景”這樣的問題，AI已經(jīng)知道哥倫布不屬于這個時代了。

ChatGPT還采用了注重道德水平的訓(xùn)練方式，按照預(yù)先設(shè)計的道德準則，對不懷好意的提問和請求“說不”；當(dāng)然，盡管OpenAI非常小心，這種準則還是可能被聰明的提問方式繞開。

4. ChatGPT的訓(xùn)練方法

當(dāng)下大模型的工作范式是“預(yù)訓(xùn)練-微調(diào)”。首先在數(shù)據(jù)量龐大的公開數(shù)據(jù)集上訓(xùn)練，然后將其遷移到目標(biāo)場景中（比如跟人類對話），通過目標(biāo)場景中的小數(shù)據(jù)集進行微調(diào)，使模型達到需要的性能。微調(diào)/prompt等工作從本質(zhì)上對模型改變并不大，但是有可能大幅提升模型的實際表現(xiàn)。人類問問題方式對于GPT-3而言不是最自然的理解方式，要么改造任務(wù)，要么微調(diào)模型，總之是讓模型和任務(wù)更加匹配，從而實現(xiàn)更好的效果。

ChatGPT是22年1月推出的InstructGPT的兄弟模型。InstructGPT增加了人類對模型輸出結(jié)果的演示，并且對結(jié)果進行了排序，在此基礎(chǔ)上完成訓(xùn)練，可以比GPT-3更好的完成人類指令。ChatGPT新加入的訓(xùn)練方式被稱為“從人類反饋中強化學(xué)習(xí)”（Reinforcement Learning from Human Feedback，RLHF）。

ChatGPT是基于GPT-3.5模型，訓(xùn)練集基于文本和代碼，在微軟Azure AI服務(wù)器上完成訓(xùn)練。原先GPT-3的訓(xùn)練集只有文本，所以這次新增了代碼理解和生成的能力。

5. 為什么ChatGPT的提升這么明顯

除了帶有記憶能力、上下文連續(xù)對話能帶給人顯著的交互體驗提升，ChatGPT的訓(xùn)練方式也值得關(guān)注。上述提到的RLHF方法首見于22年3月發(fā)表的論文(Training language models to follow instructions with human feedback)，但根據(jù)業(yè)界的推測，RLHF并未用到InstructGPT的訓(xùn)練中。InstructGPT所用到的text-davinci-002遇到了一些問題，會呈現(xiàn)出模式坍塌(mode collapse)現(xiàn)象，不管問他什么問題，經(jīng)常收斂到同樣的答案，比如正面情緒相關(guān)的回答都是跟婚禮派對相關(guān)。

這次RLHF的方法得以在ChatGPT上應(yīng)用，并取得了很好的效果。但RLHF實際上并不容易訓(xùn)練，強化學(xué)習(xí)很容易遇到模式坍塌，反饋過于稀疏這類問題，訓(xùn)練起來很困難。這可能也是為什么論文在3月發(fā)表，ChatGPT在12月才上線，中間需要大量的時間來調(diào)優(yōu)。

此外，指令調(diào)整（instruction tuning）的貢獻也很大。InstructGPT雖然在參數(shù)上比GPT-3少了100倍（13億 vs 1750億），它的輸出效果比GPT-3以及用監(jiān)督學(xué)習(xí)進行微調(diào)的模型都要好得多。

根據(jù)知乎用戶“避暑山莊梁朝偉”的觀點：“Instruction Tuning和Prompt方法的核心一樣，就是去發(fā)掘語言模型本身具備的知識。而他們的不同點就在于，Prompt是去激發(fā)語言模型的補全能力，比如給出上半句生成下半句、或者做完形填空，都還是像在做language model任務(wù)，而Instruction Tuning則是激發(fā)語言模型的理解能力，通過給出更明顯的指令，讓模型去理解并做出正確的反饋?！?/span>

參考下圖，以前大模型的提升重心更多放在了大模型（LLM）本身和Prompt Engineering上，而ChatGPT的迭代重點是右側(cè)的閉環(huán)。

action-driven LLM訓(xùn)練流程圖

最后，ChatGPT在過于保守不提供有效回答和提供虛假信息之間做出了較好的權(quán)衡。之前Meta用于科研的大模型Galactica上線僅3天就被迫下線，因為提供了過多虛假的信息。這跟Meta的宣傳策略也有關(guān)，其本意是想幫助研究人員整理信息、輔助寫作，但Meta將其模型宣傳為“可以總結(jié)學(xué)術(shù)論文，解決數(shù)學(xué)問題，生成維基文章，編寫科學(xué)代碼，為分子和蛋白質(zhì)做注解等”，過高期望帶來了反效果，科研人員本來就是挑剔的。ChatGPT盡管不能完全避免虛假信息的問題，但可以看出在微調(diào)/Prompt方面做了足夠細致的工作，一些自相矛盾的提問可以被甄別出來，讓用戶對其回答更有信心。

6. 商業(yè)策略也是重要一環(huán)

這次ChatGPT是免費不限量向公眾開放，用戶可以盡情在平臺上嘗試各種奇異瘋狂的想法，而此前GPT-3是根據(jù)使用量(token)來收費的。在使用過程中，用戶可以提供反饋，這些反饋是對OpenAI最有價值的信息。OpenAI并不急于創(chuàng)收也不缺錢，坊間傳言最新一輪估值已經(jīng)達到數(shù)百億美金，還有金主爸爸微軟。

對于AI發(fā)展來說，工程的重要性實際上大于科學(xué)，創(chuàng)建一個迭代反饋的閉環(huán)至關(guān)重要。OpenAI很注重商業(yè)應(yīng)用，GPT-3已經(jīng)擁有大量客戶。這些客戶跟OpenAI的反饋互動也是推動進步的關(guān)鍵一環(huán)。相比之下，谷歌的閉門造車就顯得不合時宜，或許是缺乏商業(yè)化的文化，或許是受限于投入產(chǎn)出比，谷歌對于大模型的應(yīng)用一直很“克制”，即便起點很高，但如果一直像Waymo做自動駕駛一樣小規(guī)模迭代，早晚會被更為開放，獲得更多數(shù)據(jù)的企業(yè)超越。

7. 后續(xù)提升點

RLHF是一種較新的方法，隨著OpenAI不斷摸索，結(jié)合ChatGPT搜集到的用戶反饋，模型還有進一步提升的空間。尤其是在道德/alignment層面，需要屏蔽掉這幾天大家試驗出來的繞過系統(tǒng)限制產(chǎn)生負面信息的方法。

當(dāng)然也別忘了，OpenAI還有WebGPT這樣的工具，可以理解為高階版網(wǎng)頁爬蟲，從互聯(lián)網(wǎng)上摘取信息來回答問題，并提供相應(yīng)出處。比如下面的問題How do neural networks work，WebGPT利用了GPT-3本身具備的語義理解能力和互聯(lián)網(wǎng)公開信息，自己結(jié)合出了一份答案，不失為一種升級的搜索能力。

在MIT Technology Review對OpenAI科學(xué)家的采訪中，他們提到了后續(xù)有可能將ChatGPT和WebGPT的能力結(jié)合起來。有網(wǎng)友挖掘出了ChatGPT內(nèi)設(shè)的提示詞，其中包含browsing:disabled，把瀏覽網(wǎng)頁能力關(guān)閉了，也就是說后續(xù)有可能加入這個能力?？梢栽O(shè)想，ChatGPT+WebGPT可以產(chǎn)生更為有意思的結(jié)果，信息可以實時更新，對于事實真假的判斷將更為準確。

與WebGPT的這種結(jié)合，對應(yīng)到上面 action-driven LLM訓(xùn)練流程圖的左半部分，即連接外部的信息源和工具庫。事實上網(wǎng)頁搜索只是一種可能，還結(jié)合利用各種工具（比如各種辦公軟件、SaaS軟件），實現(xiàn)更豐富的功能。

在產(chǎn)品層面，是不是有更好的界面和實現(xiàn)方式也值得討論。同屏對話框形式容易讓人產(chǎn)生過高的預(yù)期，因為要保障對話的流暢性。在這一點上，Github Copilot產(chǎn)品就做得很好，Copilot主打的是programming pair，以伙伴的身份提出建議。從用戶角度，這個建議好就接受，不好就不接受；即便提出了很多不被接受的建議，但在隨機時間間隔產(chǎn)生的有效建議帶來的爽感就會讓用戶上癮。如果ChatGPT后續(xù)成為寫作助手、編劇助手、工作助手等等，類似Copilot的產(chǎn)品形態(tài)會容易讓人接受。

寫在最后

很多人驚嘆于ChatGPT的能力，但其實真正驚艷的還在后面。OpenAI最厲害的不是他關(guān)于大模型的理解，而是其工程化、迭代反饋的能力，以及alignment(AI跟人類目標(biāo)的統(tǒng)一）方面的工作。很欣賞OpenAI CEO Sam Altman的一句話：“Trust the exponential. Flat looking backwards, vertical looking forwards.” 我們就處在即將起飛的這個點上。

公司新聞

專家講座 | 鳥類監(jiān)測與保護（第二輪通知）

專家講座 | 鳥類監(jiān)測與保護（第一輪通知）

【新晉會員】中科北緯成為江西林學(xué)會數(shù)字林業(yè)專業(yè)委員會會員單位

聯(lián)盟新力量：中科北緯榮耀入圈，為鳥類監(jiān)測和保護貢獻科技力量

中科北緯江西第一站，開啟深度戰(zhàn)略合作新篇章

中科北緯 | 智慧應(yīng)急解決方案

【北緯出品】坤然生態(tài)環(huán)境監(jiān)測站 | 感知生態(tài)溫度，洞悉山水脈動

中科北緯公司成功當(dāng)選中國林業(yè)工程建設(shè)協(xié)會第五屆理事會理事單位

中科北緯 | 應(yīng)急產(chǎn)品解決方案

中科北緯誠邀您參加中國森林發(fā)展（博鰲）大會

中科北緯誠邀您參加第一屆世界林木業(yè)大會

誠摯邀請 | 中科北緯邀您蒞臨2023第一屆中國測繪地理信息技術(shù)暨北斗應(yīng)用博覽會

公司智能安防AI模型庫與智能救援裝備集中亮相淮南

中科北緯誠邀您參加首屆京津冀晉生態(tài)旅游觀鳥季啟動儀式 暨“野鴨湖

喜報！我公司再獲科學(xué)技術(shù)獎和青年測繪科技創(chuàng)新人才獎

奮進生態(tài)發(fā)展新征程 賦能生物多樣大楊山

敬請關(guān)注 | 第四屆植被病蟲害遙感大會（2023）如約而至

喜報！我公司榮獲2022年度自然資源科學(xué)技術(shù)獎

以蟲治蟲防治技術(shù)——花絨寄甲

林業(yè)系統(tǒng)工程自然保護區(qū)的研究

熱解讀｜指揮防沙治沙，習(xí)近平提的這四個字意味深長！

一圖勝千言：空間分辨率如何決定遙感圖像的細節(jié)？

我在，我一直都在！

野生動物監(jiān)測體系能力提升解決方案

簽訂戰(zhàn)略合作協(xié)議 | 握手中國四維測繪

信息技術(shù)助力野生動物保護事業(yè)發(fā)展

天樞-罌粟智能識別軟件【驚喜】發(fā)布

紅外相機AI識別工具發(fā)布【免費】

Web開發(fā)與GIS技術(shù)結(jié)合的產(chǎn)物 - WebGIS

陸生野生動物監(jiān)測技術(shù)指南【試行】

紅燈即將變綠，請起步！

Arcgis空間分析中的插值方法選擇

松材線蟲病 | 事關(guān)我國9億畝松樹的安危 說說松材線蟲病的那些事兒

實地考察增了解 交流探討促合作 | 北京京能地質(zhì)工程有限公司蒞臨指導(dǎo)交流

淺談設(shè)計模式的運維優(yōu)勢（一）

鳥類信息數(shù)據(jù)庫 | 野生鳥類保護和疫病監(jiān)測的基礎(chǔ)

濕地履約 中國交出滿意答卷

地球玩自拍：一段64億公里的旅程

ChatGPT為什么這么強

張鳳榮：解析中國耕地現(xiàn)狀，落實耕地保護目標(biāo)

衛(wèi)星“瞰”濕地，顏值與實力并存

松材線蟲病災(zāi)害經(jīng)濟損失評估軟件研發(fā)

國家公園將引領(lǐng)我國自然保護地體系建設(shè)

AI+遙感，助力林業(yè)資源動態(tài)監(jiān)測

高清遙感衛(wèi)片監(jiān)測森林資源對基層林業(yè)工作將會產(chǎn)生哪些深遠影響

中國城市夜景衛(wèi)星圖，你的城市多發(fā)達？世界各國燈光地圖，你的國家多繁華！

在我的世界中，B站UP主搭建世界首個純紅石神經(jīng)網(wǎng)絡(luò)，圖靈獎得主Yann LeCun轉(zhuǎn)贊

中關(guān)村人才協(xié)會林草資源信息人才聯(lián)絡(luò)處揭牌成立

從定性到定量，遙感技術(shù)“進階式”

衛(wèi)星遙瞰，國家公園的非凡十年

衛(wèi)星影像下的洞庭湖、鄱陽湖已“瘦成閃電”！

遙感技術(shù)在洪澇災(zāi)害方面的應(yīng)用

CCTV-17農(nóng)業(yè)農(nóng)村 | [中國三農(nóng)報道]中國科學(xué)院植被病蟲害遙感監(jiān)測與預(yù)測系統(tǒng)升級版發(fā)布

第三屆植被病蟲害遙感大會||重點關(guān)注

提升自然資源調(diào)查效率，助力數(shù)字經(jīng)濟轉(zhuǎn)型發(fā)展 |遙感智能解譯技術(shù)（裝備）創(chuàng)新峰會召開

遙感樣本庫建設(shè)還沒頭緒？不妨來這看看...

中國地理信息產(chǎn)業(yè)協(xié)會時空信息智能云服務(wù)工作委員會成立!

如何實時跟蹤定位航班位置？

關(guān)于召開遙感智能解譯技術(shù)（裝備） 創(chuàng)新峰會的通知

視覺盛宴-2021年度自然資源科普微視頻大賽獲獎作品賞析

真香，當(dāng)天樞遇上云平臺！！

5天推進200公里，河南小麥收獲已達8成

淺談AI遙感解譯在農(nóng)業(yè)方面的應(yīng)用

林業(yè)植物調(diào)運檢疫可視化分析及技術(shù)實現(xiàn)

政策解讀｜《北京市園林綠化局關(guān)于提升建設(shè)項目使用林地審核審批便利化服務(wù)的通知》

AI+遙感 | 城市井蓋普查新思路

Sentinel-2衛(wèi)星鏡頭下的高速目標(biāo)---疾馳的京滬高鐵

換個角度，來看天樞能為農(nóng)業(yè)監(jiān)測做什么

天樞（Learth）第四講：AI助力大范圍候鳥監(jiān)測調(diào)查

北京市園林綠化局關(guān)于印發(fā)《建設(shè)項目使用林地行政許可事項服務(wù)程序》的通知

守正出新 砥礪奮進 | 中科北緯公司黨支部圓滿完成預(yù)備黨員轉(zhuǎn)正工作

天樞平臺-以遙感解譯助力松材線蟲監(jiān)測

一文看懂元宇宙

解讀生命的密碼——DNA

新版發(fā)布 | 天樞-遙感智能視覺平臺v2.2 震撼亮相

北京市園林綠化局行政規(guī)范性文件清理結(jié)果

基于載人航天平臺的林業(yè)遙感應(yīng)用

一文看懂深度學(xué)習(xí)（白話解釋+8個優(yōu)缺點+4個典型算法）

一文看懂圖靈測試（附圖靈本人的精彩事跡）

中科北緯誠邀您參加首屆京津冀晉生態(tài)旅游觀鳥季啟動儀式暨“野鴨湖

喜報！我公司再獲科學(xué)技術(shù)獎和青年測繪科技創(chuàng)新人才獎

奮進生態(tài)發(fā)展新征程賦能生物多樣大楊山

喜報！我公司榮獲2022年度自然資源科學(xué)技術(shù)獎

熱解讀｜指揮防沙治沙，習(xí)近平提的這四個字意味深長！

一圖勝千言：空間分辨率如何決定遙感圖像的細節(jié)？

我在，我一直都在！

紅燈即將變綠，請起步！

松材線蟲病 | 事關(guān)我國9億畝松樹的安危說說松材線蟲病的那些事兒

實地考察增了解交流探討促合作 | 北京京能地質(zhì)工程有限公司蒞臨指導(dǎo)交流

濕地履約中國交出滿意答卷

AI+遙感，助力林業(yè)資源動態(tài)監(jiān)測

中國城市夜景衛(wèi)星圖，你的城市多發(fā)達？世界各國燈光地圖，你的國家多繁華！

在我的世界中，B站UP主搭建世界首個純紅石神經(jīng)網(wǎng)絡(luò)，圖靈獎得主Yann LeCun轉(zhuǎn)贊

從定性到定量，遙感技術(shù)“進階式”

衛(wèi)星影像下的洞庭湖、鄱陽湖已“瘦成閃電”！

提升自然資源調(diào)查效率，助力數(shù)字經(jīng)濟轉(zhuǎn)型發(fā)展 |遙感智能解譯技術(shù)（裝備）創(chuàng)新峰會召開

遙感樣本庫建設(shè)還沒頭緒？不妨來這看看...

關(guān)于召開遙感智能解譯技術(shù)（裝備）創(chuàng)新峰會的通知

真香，當(dāng)天樞遇上云平臺！！

換個角度，來看天樞能為農(nóng)業(yè)監(jiān)測做什么

守正出新砥礪奮進 | 中科北緯公司黨支部圓滿完成預(yù)備黨員轉(zhuǎn)正工作

注意安全！野外工作安全指南

你的改變我能夠分辨 | 天樞平臺之變化檢測

神經(jīng)網(wǎng)絡(luò)連接遙感之眼，“天樞”數(shù)據(jù)中臺打通解譯之路