Table of Contents
作者 / 林位青 Alan Lin – 兼具視覺與程式跨領域,從介面設計到前端程式開發的 無障礙網頁設計師,同時也是一名設計系的在職研究生。關注顧客體驗,嘗試以設計方法和前端程式開發技術,探索新的機會點,提升產品及服務商業價值。非常榮幸獲選擔任此次講座的筆記手,記錄和分享難得可貴活動。
原文同步刊登於作者 Medium。
1 講座提要
在 2023年末,參與了 UserXper 悠識學院 舉辦的《2023 AI for better UX 實務研討》,並獲選擔任此次講座的筆記手一同記錄難得可貴活動。今年隨著 ChatGPT 在全球爆紅, 讓相關的 AI 人工智慧話題熱度持續發酵。身為從事 UX 相關工作的團隊夥伴們,藉此思索著如何趁勢利用 AI 技術協助 UX 工作,不僅提升工作效率並且能夠提供給使用者更好體驗。
這場講座有幸邀請六位來自各國際知名科技企業資深產品負責人與設計經理、設計主管。帶來了AI 產品開發實務經驗和設計流程的變化,以及 UI/UX 設計師在 AI 時代下,該如何調整自身定位發揮能力。整個講座進行約五小時多,共四個主題分為上下半場,每場結束有安排講者座談,與本次參與與會者們進行深度討論互動。
講座的開場 Richard 講述雖是年末該總結今年學習的時候,但是 AI 不斷發生變化更促使不斷學習。不同以往舉辦的講座,本次參與與會者資深從業者 5 年以上佔了一半以上,可望在與講者座談時有更實務經驗上的互動。
本文記錄講題「從基礎大模型看 AIGC 釋放設計創造力」,講者為林居穎 Kyle(Alibaba 通義實驗室 產品體驗設計負責人)。
2 重點整理
AIGC 的發展進程
- 1950s ~ 1990s 萌芽期:生成音樂
- 1990s ~ 2010s 積累期:生成文本
- 2010s ~ Now 發展期:生成圖像、影片、文本大規模應用
AGI HHH 提出的三原則解決 AI 亂回答的問題
- 有用的 Helpful:解決使用者問題,使其滿意。
- 誠實的 Honest:真實的內容,沒有謬誤。
- 無害的 Harmless:正向,有道德規範內的內容。
AI 訓練的核心在於如何整合人類由外而內的行為。
- 對人的認知構成:人格、特質、意圖、情緒。
- 本質人格 ⇒ 個性特質 ⇒ 目標意圖 ⇒ 情緒表徵。
AI 是怎麼生成圖像的呢?
- 生成式對抗網路(Generative Adversarial Networks, GAN)
- 擴散模型(Diffusion)
- 對比式語言 圖像預訓練(Contrastive Language-Image Pre-Training, CLIP)
如何控制好生成圖像,大概率得到預期結果?
- 善用冒號和逗號,並具體的敘述:形、色、質、構。
設計師會不會被 AI 取代?
- 講者透過悲傷的五個階段來闡述,第一張攝影照片對藝術界的衝擊影響。
- 過去的我們網路參考和設計工具產出草稿進行提案,
- 如今可以藉由 AIGC 產生過去無法想像的視覺,甲方需要五彩斑斕的黑。
後 Agent 時代
- 點:互動 API
- 線:體驗 Agent
- 面:服務 Multi-Agent
3 關於 AIGC 的發展歷程
1950s ~ 1990s 萌芽期:生成音樂
- 1950年 Alan Turing 提出“圖靈測試”,機器產生智能的想法第一次被提出
- 1957年 第一支由電腦創作的交響樂《伊利亞克組曲》發布
- 1997年 AI 深藍擊敗西洋棋世界冠軍
- 1976年 全球第一個 AI 醫療專家系統 MYCIN 問世
- 1979年 AI 首次打敗人類雙陸棋世界冠軍
1990s ~ 2010s 積累期:生成文本
- 1997年 AI 深藍擊敗西洋棋世界冠軍
- 2006年 深度學習理念正式提出
- 2007年 世界上第一部 AI 創作小說《1 TheRoad》問世
- 2012年 首個全自動同聲傳譯系統問世
2010s ~ Now 發展期:生成圖像、影片、文本大規模應用
- 2013年 微軟小冰上市
- 2018年 StyleGAN 模型上線,AI 可實現圖片生成
- 2019年 DeepMind 實現 AI 視片生成
- 2022年 ChatGPT 上線,實現大規模應用普及
關於人工智慧生成內容(Artificial Intelligence Generated Content, AIGC)發展歷程,從最早 1957年 Lejaren Hiller 和 Leonard Issacson 兩位教授,編寫了世界上第一首完全由電腦生成的音樂作品《伊利亞克組曲 The Illiac Suite》開始萌芽,接著到積累期 AI 生成文本,2007年創作第一部小說 《1 The Road》,到現在發展期 2022年 ChatGPT 上線,大規模應用。
資料來源:增長黑盒《2023中國AIGC應用研究報告》
4 解決 AI 亂回答的問題
生成式預訓練模型(Generative Pre-trained Transformer, GPT),藉由統計學背後運算邏輯來預測回答問題,有可能造成負面回應,像是亂編答案、資訊偏誤或廢話連篇不知所云的狀況,那麼要如何解決 AI 亂回答的問題呢?AI 開發團隊提出了很多方法,最核心仍根據 AGI HHH 提出的三原則,HHH 是 Anthropic 推廣的一個框架。與人類偏好保持一致,以滿足使用者和企業的需求。
- 有用的 Helpful:解決使用者問題,使其滿意。
- 誠實的 Honest:真實的內容,沒有謬誤。
- 無害的 Harmless:正向,有道德規範內的內容。
GPT 3.5
- 數據層:專業標注人員數據;真實問答用戶數據 ⇒ 自動生成答案數據;真人排序的精品數據。
- 模型層:監督微調(Supervised Fine Tuning, SFT) ⇐ 獎勵模型 (Reward Model, RM)。
- 能力:API Plugin。
GPT 4
- 多模態理解:Contrastive Language-Image Pre-Training。
- 邏輯推理:Chain of Thought 。 講者舉例此類似放聲思考法。
- GPTs:Prompt Enginneering + Assistant API。
所有的生成訓練都需要數據層和模型層,若來自公開網路資訊,可能造成胡說八道的結果,因此需要人工標註或是真實回饋意見的資料庫。
5 對人的認知構成
訓練 AI 的核心在於如何整合人類由外而內的行為,從關注智商到關注情商,讓 AI 更人性化。對人的認知構成:人格、特質、意圖、情緒。以石頭放上動動眼為例,比起沒有眼睛的石頭更多了生命感,來自於人對於生命感的腦補。
- 認識人格(由外而內):從人的末端行為,向上總結人的類型。
- 人的表達(由內而外):從人的人格類型,向下約束末端行為。
好比認識他人,一開始從對他人外在行為,逐漸進一步熟知。但是人自己的表達是由內而外,在成長背景和經驗中不斷積累形成特質和行為。對 AI 訓練是從內和外之間找到一個交集。程序化的流程:本質人格(Core Personality) ⇒ 個性特質(Personality Traits) ⇒ 目標意圖(Purpose) ⇒ 情緒表徵(Emotion Expression)。
例如十六型人格測驗(Myers-Briggs Type Indicator, MBTI)為 ESFP 的表演型人格,拆解出個性特質為外向樂群、輕鬆興奮、直率、世故等等關聯參數,針對關鍵場景做目標意圖定義,進入被誇獎情境會得到什麼樣的回覆,再引導到數位設備或是數位角色,呈現出情緒表徵,歡樂語音、激動表情、開心的文字、蹦蹦跳跳行為等等。在設計訓練算法上需要不斷與「算法訓練模型」對齊目標。
6 人工智慧 AI 是怎麼生成圖像的呢?
生成式對抗網路說明圖
生成式對抗網路(Generative Adversarial Networks, GAN)有生成器和判別器需要訓練,生成器(Generator)被訓練用來生成假資料,判別器(Discriminator)則被訓練如何辨別資料真偽。當生成器生成人像時有些生成很矬,與真實人像一同經過判別器去區分哪些是真實人像。生成器和判別器不斷迭代進化,到最後生成器能夠生成到非常真實能騙過判別器的時候,那麼演算法的訓練就完成了。讓生成器和判別器對抗產生正向的影響。
Stable Diffusion
擴散模型(Diffusion model)使用高斯雜訊對影像進行編碼。還有逆擴散的過程來重現影像。但是逆擴散的過程其實非常不穩定。而命名為 Stable Diffusion 就是意欲嘗試變穩定。
Contrastive Language-Image Pre-Training, CLIP. Screenshot from speaker’s presentation
對比式語言圖像預訓練(Contrastive Language-Image Pre-Training, CLIP)藉由圖像與使用者認知是否匹配吻合來訓練。例如判斷一隻貓在一隻狗的頭上,是否與圖像認知匹配或不匹配。
如何控制好生成圖像,大概率得到預期結果?
將句子分段逗號,”looking at me”,“laughing at me” 能讓生成圖像呈現正面
人類的產出需要經驗/技法、理解力、需求。相對 AI 的產出需要數據集、模型、指令(Prompt)。沒有足夠的數據,就像人一樣沒有經驗和技法;沒有良好的理解力,就像人一樣不能懂得將需求轉化;沒有精準的表達力,就像不會描述需求的甲方一樣。
理解 AI 「先不要」像和人對話一樣和機器對話,AI 還沒有想像中那麼聰明,AI 對於文字引申涵義或暗喻隱喻仍不足。輸入就像 google 關鍵字搜尋方式善用冒號和逗號,並「具體」的敘述。例如上圖將句子分段逗號,”looking at me”,”laughing at me” 能讓生成圖像呈現正面。
讓 AI 好理解的版本
- 形:主體是什麼?
- 色:色彩是什麼?
- 質:環境、氣氛、燈光是什麼?怎樣的知名藝術風格?
- 構:構圖是什麼?
7 如何訓練更好的模型?
- 定義標準:區別什麼是好的數據?什麼是髒的數據?
- 批量標註:人工方式找出好的和髒的數據。
- 機器學習預訓練:認識並分辨好的和髒的數據。
- 驗收效果:目標對齊則應用再大規模數據中;目標不對齊則重新進入標註流程。
- 大規模訓練:將庫中的所有數據,進行分類,將合格數據用於訓練。
8 設計師會不會被 AI 取代?
講者透過 Kubler-Ross 的悲傷的五個階段(The Five Stages of Grief)來闡述:
- 否認/隔離(Denial & Isolation):畫家們否認這不是藝術!
- 憤怒(Anger):畫家們控訴難登大雅之堂!
- 討價還價(Bargaining):越多素材有助創作效率。
- 沮喪(Depression):覺得寫實沒有前景。
- 接受(Acceptance):最後承認接受,影響藝術界而出現印象派、野獸派各多流派。
1826年 Joseph Nicéphore Niépce 拍攝名為《在萊斯格拉的窗外景色》(View from the Window at Le Gras)出現的第一張攝影照片對藝術界的衝擊影響,讓畫家們開始否認與憤怒控訴難登大雅之堂,慢慢開始討價還價與沮喪寫實沒有前景,最後承認接受,影響藝術界而出現印象派、野獸派各多流派。相對如今人們覺得 AI 做的也不怎麼樣。講者認為階段演進可能比我們想像中快,很快地在工作上,需要與 AI 協作了。
導入 AI 前後工作流程的差異
AIGC 時代的設計師該怎麼運用 AI 能力呢?過去的我們在前期靈感階段,透過 Behance、Dribbble、Pinterest 來找參考圖,再藉由 Adobe設計軟體、Sketch、Figma 等設計工具來構思創意,產出草稿進行提案。確認方向後,後期設計執行階段,更進一步透過設計工具細部完善,最終定稿。
如今我們在前期靈感階段,可以藉由 AIGC 類型網站直接生成形成草稿。最後後期設計執行階段,除了傳統工具外還可以藉由 AIGC 類型網站直接生成效果好,可直接使用的設計稿。例如甲方需要五彩斑斕的黑,如今可以藉由 AIGC 產生過去無法想像的視覺,讓人人可以釋放更多創意。
9 後 Agent 時代
- 點:互動 API
- 線:體驗 Agent
- 面:服務 Multi-Agent
Agent 可以想成是仲介般,幫你討價還價的代理人。只要給它目標,後續事情會幫你處理。這也是GPT 4 出來後的大模型發展方向。這部分講者提出的點、線、面概念,讓我聯想起顧客旅程地圖(Customer Journey Map, CJM),每個互動的接觸點連成旅程線,例如去咖啡廳買咖啡的過程,所經歷的體驗點,串成購買咖啡流程的線,而另個角度來看咖啡師製作咖啡流程也是個線。所有的流程線,整體形成面性服務。轉換成 Agent,點就是API 那些特定關鍵任務、線就是你請它倒咖啡,它會串連很多 API 來達成。面就是透過 Multi-Agent 來完善更好的服務。
人工智慧 AI 的發展
- 1.0 智能學徒:具備單一 AI 技能,使用者主動透過 AI 完成任務(文件掃描、會議記錄、翻譯、問答…)
- 2.0 智能助手:可以如同人類助手般,在單一領域完成多工複雜任務(產出會議摘要、整理文件大綱與翻譯、報告輸出…)
- 3.0 智能顧問:基於大數據計算與決策模型,協助人們進行複雜決策(基於日常數據給出大大小小的決策輔助)
Richard 在講座結尾講述 AI 是一種產品,像是汽車引擎,沒有人懂熱力物理原理但是不會畏懼,並應用來產生價值,AI+ 可以附加在很多地方,汽車引擎作為工具能應用很多地方,如汽車、卡車…。
+AI 通用型 AI 結合產業知識可以產生新的商業模式,像是郵務、外送、物流…。今天內容有 AI+與需要清理數據有關,也一部分 +AI 通用型生產力工具,促使我們去思考什麼樣的行業問題,適合 AI 去解決。
延伸閱讀:
[研討會記錄] 2023 AI for better UX 實務研討:與其否認不如擁抱 AIGC ,產生過去無法想像的視覺,五彩斑斕的黑!
[研討會記錄] 2023 AI for better UX 實務研討:別急著解決客訴問題!透過數據庫和場景還原,挖掘背後真正原因
[研討會記錄] 2023 AI for better UX 實務研討:不只因為趨勢而導入 AI,更要透過質性研究來理解使用者行為背後的價值
[研討會記錄] 2023 AI for better UX 實務研討:設計有效團隊溝通方式、量化數據分析、質性研究,對於使用者深入洞察,都是讓設計師在團隊中更有價值展現