互聯網信息化咨詢/技術開發/整合營銷
請通過以下方式免費咨詢
提交
1.大語言模型將如何影響軟件的構建?
大語言模型能夠提高專業開發人員的工作效率,GitHub Copilot 已經證明了這個方向的可行性。這意味著開發人員不必擔心未來的工作前景,且軟件的生產與分發方式不會發生劇烈的變化。
然而,大語言模型的影響力不僅于此。大語言模型將成為專業程序員的工具,但過于關注狹隘的用途可能會導致我們錯失未來推動更大變化的潛力。
因為我認為在短時間內有可能所有的計算機用戶都將有能力開發小型軟件工具,并描述他們希望如何修改正在使用的軟件。換句話說,大語言模型將發展成為支持用戶編程的工具,普通人無需掌握編程的復雜性即可充分利用計算機。就目前的情況而言,這一愿景在將模糊的非正式意圖轉化為正式的可執行代碼方面遇到了瓶頸。而接下來,在大規模語言模型的助力下,瓶頸正在迅速打開。
如果這種假設成真,我們將看到人們使用軟件的方式出現一些驚人的變化:
一次性腳本:普通計算機用戶可以借助 AI,每天創建并執行幾十次腳本,以執行數據分析、視頻編輯等任務,或自動執行一些繁瑣的任務。
一次性 GUI:人們將使用 AI 創建整個 GUI 應用程序,這種應用程序只能執行特定的某個任務,僅包含他們需要的功能,不會膨脹。
構建取代購買:企業內部將開發更多軟件,以滿足他們特定的需求,而不是購買現成的 SaaS,因為根據具體情況定制軟件更便宜。
修改/擴展:消費者和企業需要擴展和修改現有軟件的能力,在 AI 的助力下,開發新功能或調整匹配用戶的工作流程將更容易。
重組:吸取各個應用程序的精華,并創建一個集百家之長的混合應用程序。
所有這些變化不僅僅是加快當前軟件的生產過程。軟件的創建時機、由誰創建以及出于什么目的,都將發生變化。
2.大規模語言模型+可延展軟件
接下來,將深入探討大語言模型可能為軟件創建和分發帶來的廣泛變化,而且還會影響到人們與軟件交互的方式。討論的問題包括:
交互模型:哪種交互模型適合哪些任務?人們什么時候需要聊天機器人、一次性腳本或自定義的一次性 GUI?
軟件定制:大規模語言模型如何實現可由用戶拆分、重組和擴展的可延展軟件?
意圖規范:最終用戶將如何與大規模語言模型交互,表達自己的意圖?
模糊翻譯器:大規模語言模型如何實現以前不可能實現的共享數據基礎?
用戶授權:我們應該如何看待大規模語言模型時代的授權和代理與授權和自動化?
3.聊天機器人應該何時使用?
在大規模語言模型時代用戶交互模型將如何進化?特別是,聊天機器人可能會接管哪些類型的任務?當我們考慮用不同的方式來武裝最終用戶時,這個問題的答案會特別重要。
我認為,雖然 ChatGPT 比 Siri 更強大,但聊天 UI 無法很好地完成許多任務,我們仍然需要圖形用戶界面。之后會討論利用大規模語言模型幫助我們構建 UI 的混合交互模型。
最終,我們將達成一種有趣的設計:開放式計算媒體,用戶可以直接學習和建立模型,大規模語言模型將作為媒體內的合作伙伴。
在深入展開討論之前,首先聲明:本文探討的很多觀點都源自個人的猜測,具有很大的不確定性。我甚至無法預測這些變化什么時候會出現。重點是,想象如何根據當前 AI 的發展狀況,推斷用戶與計算機的新型交互,以及我們如何利用這項新技術來最大限度地加強最終用戶的能力。
4.打破編程瓶頸
為什么大規模語言模型關系到普通用戶使用計算機的能力?
幾十年來,計算先驅們一直在努力實現最終用戶編程的愿景:普通人也可以充分利用計算機,而不僅僅是使用程序員給他們的預制應用程序。Alan Kay 曾在1984 年寫道:“我們希望像以前編輯文檔一樣編輯我們的工具。”
這個理念有很多表現形式。現代終端用戶也或多或少地接觸過編程系統,包括電子表格、Airtable、Glide 或 iOS 快捷方式,以及早期的 HyperCard、Smalltalk 和 Yahoo Pipes。
盡管其中一些產品取得了成功,但現在它們也面臨一個基本難題的限制:幫助人們將粗略的想法轉化為正式的可執行代碼,這一步非常難。系統設計者嘗試過超高級語言、友好的可視化編輯器和更好的語法、復雜性分層以及根據示例自動生成簡單的代碼。但事實證明,使用這些技術很難突破一定的復雜性上限。
我自己在工作中就遇到過編程瓶頸。幾年前,我開發了一個名為 Wildcard 的最終用戶編程系統,用戶可以通過電子表格界面自定義網站。例如,在下面這個簡短的演示中,你可以看到用戶按照不同的順序對 Hacker News 上的文章進行排序,然后將閱讀時間添加到頁面的文章中,這一切都是通過網頁與電子表格的同步化實現的。
如今有了大規模語言模型,這些編程瓶頸就不再是限制因素了。將自然語言規范轉化為網絡抓取代碼或者是電子表格公式正是目前大規模語言模型可以實現的代碼生成過程。我們可以想象,讓大規模語言模型幫忙抓取代碼和生成公式,這樣就無需任何人手動編寫代碼即可實現上述演示。在我做 Wildcard 的時候,這種的程序生成還只是一個幻想,而如今正在迅速變成現實。
不過,這個例子也提出了一個更深層次的問題。如果讓大規模語言模型為我們修改網站,那又何必使用 Wildcard UI 呢?難道我們不能讓 ChatGPT 重新排序網站并添加閱讀時間嗎?
我認為這個問題的答案尚不明朗。將電子表格視為網站基礎數據的另一種視圖具有很大的價值,我們可以直接查看和操作這些數據。點擊列的標題即可讓表格中的數據按順序排列感覺很好,而且比輸入“按列 X 排序”更快。允許用戶直接查看和編輯電子表格公式,可以讓他們擁有更多的控制權。
所以,用戶界面仍然很重要。我們可以想象,大規模語言模型的具體、有針對性的角色應該是幫助用戶定制和構建軟件,而不是將幾十年的交互設計拋諸腦后。