《愛墾歷史慕課》推薦精彩文獻,歡迎學習:


Rating:
  • Currently 4.8/5 stars.

Views: 381

Comment

You need to be a member of Iconada.tv 愛墾 網 to add comments!

Join Iconada.tv 愛墾 網

Comment by 史識 庫 on Friday

[愛墾研創]跨越海洋的迴響:越南西原鑼鉦與沙巴龍骨士鑼的文化同構性

在東南亞遼闊的文化版圖中,金屬鑼鉦的轟鳴聲不僅是音樂,更是一條隱形的紐帶,連結著大陸與島嶼。越南中部的西原(Tây Nguyên)地區與馬來西亞沙巴古達(Kudat)的龍骨士(Rungus)部落,雖在地理上被南海阻隔,卻在鑼鉦文化的基因中展現出令人驚嘆的同構性。

溯源:南島語族的海洋足跡

這份深層的渊源首要來自「人」的流動。根據民族語言學的研究,西原地區的埃第族(Ede)與嘉萊族(Jrai)屬於南島語系(Austronesian),與沙巴的原住民同出一脈。學界普遍認為,這些族群在數千年前透過海洋遷徙,將相似的社會結構與祭祀儀式散播至婆羅洲與印支半島。鑼鉦,正是這場大遷徙中被珍藏的文化符號,承載著族群對祖先與自然神靈的共同記憶。

核心:從東山文化到社會禮器

從考古學視角觀察,這兩地的鑼文化皆可追溯至公元前一千年左右的越南「東山文化」(Đông Sơn Culture)。東山銅鼓的鑄造技術與裝飾藝術,隨著海洋貿易路線擴散至整個馬來群島,演變為今日我們所見的各類鑼鉦。

在社會功能上,西原鑼鉦與龍骨士人的 Tagung 鑼皆非單純的樂器,而是「社會禮器」。在兩者的傳統觀念中,鑼皆具備靈性,是溝通神靈(Yang)或祖靈的媒介。此外,鑼在兩地皆被視為財富的終極象徵:在西原,一組古鑼可等值於數頭大象;在沙巴龍骨士文化中,鑼則是婚嫁聘禮(Berian)的核心。這種將青銅器物深度嵌入生命週期儀式的做法,體現了前印度化時期(Pre-Indianized)東南亞本土文明的共性。

形式:一人一鑼的集體史詩

在表演形式上,兩者皆強調「集體性」。西原鑼鉦表演時,每一位參與者各持一面鑼,透過精確的節奏交織,形成壯闊的複調音樂;龍骨士人的鑼隊演奏亦然,強調的是族群的協作與和諧。這種「一人一音」的邏輯,正是南島民族社會協作精神在藝術領域的投影。

當代視野下的青銅文化

2005年,越南「西原鑼鉦文化空間」被列入世界非物質文化遺產,這不僅是對西原文化的肯定,也應被視為對整個南島鑼鉦文化圈的致敬。沙巴龍骨士人的造鑼工藝至今仍在古達的甘榜蘇曼卡延續。透過這兩者的對照,我們看見的不是孤立的民族文化,而是一個跨越海洋、由青銅音色構築而成的東南亞文化共同體。

參考文獻

1. Bellwood, P. (2017). First Islanders: Prehistory and Heritage in the Indo-Pacific. Wiley-Blackwell. (探討南島語族擴張及其文化遺產的權威著作)

2. Higham, C. (1996). The Bronze Age of Southeast Asia. Cambridge University Press. (詳述東山文化與東南亞青銅器傳播的考古研究)

3. UNESCO. (2005). Space of gong culture in the Central Highlands of Vietnam. (聯合國教科文組織關於西原鑼鉦的申報報告與文化價值定義)

4. Doolittle, A. A. (2005). Property and Politics in Sabah, Malaysia. (提及沙巴原住民包括龍骨士人中,鑼作為聘禮與社會地位象徵的研究)

5. Wong, T. K. (2015). Sabah: History and Society. University of Malaya Press. (黃子堅教授關於沙巴歷史及其與中南半島聯繫的論述)

Comment by 史識 庫 on April 20, 2026 at 3:18pm

[愛墾研創·陳楨]鄉賢精神~~這正是這個國家目前最需要的開拓精神。企業家如何成功,就像其他領域的先鋒一樣,途徑與機遇雖然不一,但都列向上心為核心文化,畢竟創造力来自這文化。唯有求上的精神才可能提升一個社會。若一家企業的職工表現不良,没進取心,不是扣薪水能解决问题的。即使不拿薪水,也是害了整體。領導不只是盯牢自己手裏有什么,還看大家在一起可以創造什麽没有的,這個國家目前最需要的,正是這個開拓精神。向各界先進學習了。(20.04.2026)

與愛墾一起學文創:城市書寫~~文人各有抱負,有的天生想走出去,胸懷天下;有的執著於一處,把一個小小的世界翻遍;有的永遠只說家鄉,既是家鄉的研究者、歌頌者、也是家鄉的文化守護者和辯護者。閻晶明認為,這樣的寫作者擁有“鄉賢情結” 。(29.5.2022)

[深度閱讀·在愛墾]認識真正的鲁迅~~魯迅那代人通過考古發現,中國古代曾有一個很燦爛的文明,它不在主流文化里,而是在江湖、在民間。他認為中國文化的亮點是由沒有被皇權汙染的不得志的士大夫和民間人創造的。他知道中國的文章脈絡哪些遺漏掉了,哪些延續下來了,延續下來的不都是好東西,所以他在找出被遺忘的東西。例如他整理的《會稽郡故書雜集》,里面有對鄉賢文化的整理,在《四書五經》裏不能看的東西在這里能看到。

Comment by 史識 庫 on March 18, 2026 at 8:59am

[愛墾研創]詩性勞作vs批判性再想像~~文創是詩性勞作,既有批判精神也有原創洞察力,相輔相成。

在這樣的期望中,AI作為文創的空間非常大。 

這命題已經觸及了這項技術最令人興奮、也最具挑戰性的前沿。如果我們將文化與創意產業(CCI)視為一種「詩性勞動」(Arnold 意義上的 poetic labor),那麼AI就不再只是單純的「修復工具」,而會轉變為一種能促進批判洞見與原創創作的協作媒介。 

AI作為「詩性勞動空間」的潛力,主要體現在三個關鍵領域:

從「被動修復」到「批判性再想像」 

與其用AI去創造一種對過去的「可愛幻象」,詩性勞動會用它來質詢與重新思考過去。 

洞見:創作者可能會使用A 為一張老照片上色,但目的不是讓它「變漂亮」,而是為了凸顯某個被忽略的重要細節——例如某位勞工衣服上鮮豔的染料色彩,而這些細節在歷史書中被遺忘了。 

倫理:這並不是「認知上的錯誤」,因為它並不宣稱自己是最終真相;它是一種詮釋性的行動,利用科技去激發我們對生活提出新的問題。 

「演算法式陌生化」作為原創洞見

詩性勞動常常包含一種策略:把熟悉的事物變得「陌生」,以迫使我們獲得新的視角(即陌生化)。

過程:AI可以處理大量「舊材料」,從中發現人類肉眼難以察覺的模式、矛盾,或檔案中的「幽靈」。

結果:當AI的「非人邏輯」與人類的「詩性意圖」並置時,就會產生第三空間——它既不是單純的過去複製,也不只是科技展示,而是一種批判我們如何理解時間與記憶的原創作品。

安頓現代人的靈魂(Arnold 的目標) 

如果詩性勞動的目標是「安頓生命」,AI可以透過創造沉浸式橋樑來提供幫助。 

願景:想像一個AI驅動的文化計畫,它不只是「修復」1920 年代的街景,而是讓現代觀眾能夠與那個時代的倫理困境互動。 

道德核心:在這裡,「感官增強」並不是目的本身,而是承載同理心的容器。真正的原創洞見來自創作者對「要強化什麼、為什麼強化」的選擇,從而確保技術服務於對生命的批判與反思。 

「詩性」的門檻

「認知錯誤」(用虛假的可愛感欺騙觀眾)與「詩性勞動」(利用 AI 加深洞見)之間的差別,在於意圖性(Intentionality)。 

在前者中,AI是主人;在後者中,AI只是詩人手中的畫筆——而這位「詩人」明白,最終目標不是得到一張更清晰的影像,而是獲得對人類處境更清晰的理解。 

要在AI時代界定一位進行「詩性勞作」的創作者之「創作誠信(Creative Integrity)」,我們必須將焦點從「手工磨練」轉向「意義建構」的倫理。

以下是界定 AI 創作者誠信的三大支柱

意圖的透明性(反幻覺支柱)

誠信始於拒絕欺騙。如果創作者使用AI來色彩化或「修復」舊素材,他們有責任說明這是一場「歷史重建」還是「詩性詮釋」。

界定標準:當創作者承認AI只是其觀看的「透鏡」而非「真相本身」時,誠信便得以建立。這能防止「偽懷舊」造成的認知錯誤,向受眾發出訊號:「這是我對過去情感共鳴的想像,而非事實紀錄。」

「批評」的盈餘(阿諾德式支柱):追隨阿諾德「對生活的批評」理論,誠信取決於創作者在演算法預設輸出之外,額外添加了什麼。 

界定標準:如果創作者只是按一下「增強」鍵並全盤接受AI的「美化」偏見,這便缺乏誠信。真正的創作誠信需要原創洞察——利用 AI 去突顯某個特定的反諷、一段被遺忘的掙扎,或一種隱藏的美。這個「盈餘」就是挑戰或導引機器機率的人類觀點。 

對「素材來源」的倫理守護(責任支柱):由於AI創作者處理的是「既有內容」(他人的生命與作品),誠信涉及對原主體的關懷義務。 

界定標準:這種加工是「榮耀」還是「剝削」了主體?有誠信的創作者會避免「視覺綁架」——例如強行讓歷史悲劇人物露出「AI式微笑」以賺取流量。誠信存在於轉化過程中對尊嚴的維護。 

「提示詞即策展」的主權:在詩性勞作中,提示詞(Prompt)與策展(Curation)是新的「畫筆」。 

界定標準:誠信體現在篩選的嚴謹性。一個誠實的創作者不會隨機生成一千張圖並挑選最容易「病毒式傳播」的那張;他們會在無數次迭代中引導AI,直到找到那張能精確捕捉其「生活批評」的影像。 

誠信界定對照表

具備誠信(詩性勞作):目標非「修復」或「美化」過去。為了「審問」或「安頓」生命。AI角色:工具(受導引的洞察)。

缺乏誠信(認知錯誤):產出無縫且具欺騙性的幻覺。刻意且透明的視覺呈現。AI角色:主導者(自動化產出)。 

Comment by 史識 庫 on February 24, 2026 at 9:04am

[愛墾研創]「中國因素」演變對全球華人民間文化與經濟合作之影響:從跨國族群網絡到安全化框架的轉型

「全球中華圈」概念的衰退與「中國因素」話語的崛起,不僅是語義與學術框架的轉變,更深刻影響了全球華人民間文化與經濟合作的結構與運作邏輯。若「全球中華圈」曾象徵一種以文化與族群網絡為基礎的跨國合作想像,「中國因素」則代表這種想像被重新嵌入地緣政治與國家安全框架之中。此一轉向,對全球華人民間合作帶來至少三重結構性影響:信任結構的重構、制度環境的政治化,以及族群經濟的去中心化與碎片化。

首先,在信任層面,「中國因素」論述導致華人跨國網絡的象徵資本發生質變。過去華人商業與文化合作高度依賴族群信任、語言與文化親緣性,形成所謂「關係資本」(guanxi capital)與族群嵌入式經濟(embedded ethnic economy)。然而,當華人網絡被外部政治話語重新標記為潛在「影響管道」或「滲透節點」,族群信任不再被視為中性資源,而可能被視為安全風險。這種話語轉換,對華人企業與文化組織的外部形象與制度互動造成顯著影響,使族群連結由社會資本轉化為需被監管與審視的政治變量。

其次,在制度層面,跨國華人經濟與文化合作的政策環境日益安全化(securitization)。過去跨境投資、文化交流與學術合作多被視為全球化的一部分,現今則常被納入國家安全審查、技術管制與外國代理人制度的規範範疇。這種制度化安全框架,對華人民間合作產生「結構性摩擦成本」:資本流動與文化交流的交易成本提高,非正式族群網絡的運作空間被壓縮,並促使部分華人企業與文化機構採取去華人化(de-ethniciza-tion)或去政治化的策略,以降低制度風險暴露。

第三,在族群經濟結構上,「中國因素」論述加速了全球華人經濟網絡的去中心化與碎片化。一方面,中國國家資本與企業巨頭的規模與政治連結,使「華人資本」逐漸被等同於「中國資本」,導致台灣、新加坡與海外華人企業在國際市場中面臨身份外溢效應(identity spillover)。另一方面,為避免被納入地緣政治對抗框架,部分華人經濟體系刻意強化本地化與多元化策略,削弱以「華人圈」為核心的跨國族群經濟整合。結果是,原本以族群為連結軸心的經濟網絡,逐漸轉向以國家與區域制度為主要節點的多重嵌入模式。

在文化合作層面,類似的政治化動態亦十分明顯。文化生產與跨國華語文化流通,過去常以「華語文化圈」或「華人文化共同體」為框架;但在「中國因素」語境下,文化交流被納入文化影響力與認知戰的討論,使文化作品、媒體平台與教育交流被重新審視其政治屬性。這導致部分華語文化生產者與機構採取策略性距離化,強調在地文化認同或多語言轉向,以避免被視為中國文化影響的延伸。

然而,這種「中國因素」話語與制度轉型,並不意味著全球華人民間合作的終結,而是其形態的結構性轉型。華人網絡仍然在商業、科技與文化領域發揮重要作用,但其運作邏輯已由「族群信任優位」轉向「制度嵌入優位」,由「文化共同體想像」轉向「多重政治場域中的策略性嵌入」。這種轉型可被視為全球化晚期的典型現象:跨國族群網絡不再構成超越國家的替代秩序,而是被重新整合至國家與地緣政治權力結構之中。

總結而言,「中國因素」演變對全球華人民間文化與經濟合作的影響,既是限制也是重構。它削弱了以「全球中華圈」為基礎的去政治化合作想像,提高了跨國族群網絡的制度與政治摩擦成本,同時促使華人經濟與文化合作轉向更為碎片化、多中心與策略化的結構。在此意義上,「中國因素」不僅是地緣政治分析的變量,更是重新塑造全球華人跨國社會關係的結構性力量。

Comment by 史識 庫 on December 24, 2025 at 8:52pm

詹姆斯.奧唐奈:複製與創作(6)

為了探索這是否屬實,我花了幾天時間操作 Udio 的模型。生成一段 30 秒的樣本需要一兩分鐘,而付費版本甚至能生成完整歌曲。我決定挑選 12 種曲風,各生成一段歌曲樣本,再找出人類創作的類似歌曲。我設計了一個小測驗,看看我們新聞室的人是否能分辨哪些歌曲是 AI 製作的。


平均得分是 46%。而在幾種曲風上,特別是器樂類,聽眾的判斷反而更常錯誤。當我在現場觀察人們進行測試時,我注意到那些他們自信地標記為「AI 作曲跡象」的特質——例如假假的樂器聲、奇怪的歌詞——幾乎都沒什麼用處。

他們答對了一些,但毫不意外地,人們在自己較不熟悉的曲風上表現更差;有些人在鄉村或靈魂樂上還算可以,但在爵士、古典鋼琴或流行樂前就毫無勝算。創造力研究者 Beaty 的得分是 66%,而作曲家 Brandt 則得到 50%(儘管他在管弦樂與鋼琴奏鳴曲的測試中答對了)。

請記住,這些成果不應全都歸功於模型;若沒有那些作品被納入訓練資料的人類藝術家,這些輸出根本無法被創造出來。但只用幾個提示,模型就生成了一些歌曲,少有人會察覺它們是機器製作的。有些歌曲甚至能輕鬆在派對上播放而不會引起任何質疑,而我自己也找到兩首真心喜歡的——即便我是一輩子的音樂人、而且相當挑剔。然而,聽起來「逼真」並不等於「原創」。這些歌曲並沒有那種由怪異或異常所驅動的感覺——尤其不是像貝多芬那種「驚嚇」級別的突破。它們也沒有彎曲曲風界線,或在主題之間跨出巨大跳躍。在我的測試裡,人們有時甚至難以判斷一首歌究竟是 AI 生成的,還是單純做得不好。

最後,這些事情到底會有多重要?法院將在決定 AI 音樂模型到底是在「複製」還是「創作」方面扮演角色——以及藝術家在這過程中應如何獲得補償——但我們這些聽眾才是會決定它們文化價值的人。要欣賞一首歌,我們需要在腦中想像背後有一位人類藝術家嗎——一個有經驗、有抱負、有觀點的人?如果我們得知一首歌曲是由 AI 創作的,它就不再偉大了嗎?

Sanchez 說,人們可能會好奇音樂背後「是誰」。但他表示:「到頭來,不管 AI 成分多少、人類成分多少,它終究會是藝術。而人們會依據其美學品質來做出反應。」

然而,在我的實驗中,我發現這個問題對人們確實非常重要——有些人甚至強烈拒絕享受由電腦模型創作的音樂。當其中一位受試者在測驗中下意識地跟著一首電子流行歌曲點頭,但臉上浮現疑惑的表情。彷彿她正在努力想像這首歌的作曲者是人類而不是機器。「天啊,」她說,「我真的希望這不是 AI。」

但那就是 AI。

Comment by 史識 庫 on December 14, 2025 at 10:14pm

詹姆斯.奧唐奈:複製與創作(5)

根據Udio的共同創辦人兼營運長Andrew Sanchez所說,正是這種生成式AI程式中固有的隨機性讓許多人感到震驚。在過去70年裡,電腦一直在執行決定論程式:輸入一個資料,每次都會得到相同的回應。

「我們的許多藝術家合作伙伴都會說:『嗯,為什麼它會這樣?』」他說。「而我們的回答是:其實,我們也不太確定。」生成式時代需要一種新的思維方式,甚至對創造這些系統的公司也一樣:AI程式可能會混亂又難以理解。

那麼,AI 的產物到底是創造還是僅僅複製訓練資料?AI 音樂的支持者告訴我,我們也可以用同樣的問題來看待人類創造力。當我們在青春期聽音樂時,學習的神經機制會受到這些輸入的加權,而我們對歌曲的記憶也會影響日後的創作。在最近一項研究中,作曲家與萊斯大學音樂教授Anthony Brandt指出,人類與大型語言模型都會使用過往經驗來評估可能的未來情境並做出更好的判斷。

的確,人類的藝術——尤其是音樂——有許多借用之處。這常導致訴訟,藝術家會指控某首歌在未經允許下被複製或取樣。一些藝術家認為擴散模型應更透明,這樣我們就能知道某首歌曲的靈感來源是三分之 David Bowie 加上一分之 Lou ReedUdio 表示目前確實有相關研究在進行,但現在還沒有人能可靠地做到這點。

對於偉大的藝術家而言,「創新與影響力之間的結合,正是在發揮作用的東西,」Sanchez 說。「而我認為,這也是這些技術中正在發生的事。」

然而,在許多領域中,試圖將人類神經網路與人工神經網路等同的做法,在仔細檢視下很快就會崩解。Brandt 指出一個他認為人類創造力明顯超越機器產出的領域:他稱之為「放大異常」。AI 模型運作於統計取樣的範疇;它們不是透過強調非凡之處來運作,而是透過減少錯誤與尋找可能的模式。另一方面,人類對於特異之處具有興趣。

「人類並不把這些東西視為古怪的偶發事件或一次性事件,」Brandt 寫道,而是讓這些特異之處「滲透整個創作成果」。

他舉例貝多芬在第八號交響曲最後樂章加入的一個刺耳的跑調音符。「貝多芬本可以讓事情就此結束,」Brandt 說。「但他並沒有把它當成一次性的偶發事件,而是在各種方式中持續引用這個不協調的時刻。這樣一來,作曲家把一瞬間的偏差放大了其影響力。」人們也能在披頭四後期錄音中逆向循環取樣的異常、Frank Ocean 的升調人聲,或是藝術家如 Charlie PuthBillie Eilish 的製作人 Finneas O’Connell 所喜愛的「拾得聲音」(例如行人穿越訊號或關門聲的錄音)中發現類似的異常。

如果創作輸出確實被定義為同時具備新穎性與實用性,那麼 Brandt 的解讀暗示:機器或許能在第二項(實用性)與人類相匹敵,但在人類於第一項(新穎性)仍然明顯勝出。

Comment by 史識 庫 on December 10, 2025 at 7:37pm

詹姆斯.奧唐奈:複製與創作(4)

Suno未回應關於訴訟的置評要求,但在 8 月發布於 Suno 部落格的聲明中,CEO Mikey Shulman 表示,公司訓練資料來自開放網路上的音樂,而那些資料「的確包含受版權保護的內容」。但他主張:「學習不是侵權。」

Udio 的一名代表表示,公司不會對進行中的訴訟發表評論。在訴訟發生時,Udio 發布聲明表示其模型具備過濾機制,以確保「不會重現受版權保護的作品或藝術家的聲音」。

事情更複雜的是美國版權局於一月發布的指引,其中指出 AI 生成作品只要包含相當程度的人類投入,就可以獲得版權。一個月後,紐約的一名藝術家獲得了可能是全球第一件 AI 協助創作的視覺藝術作品版權。下一個,也許就會是一首 AI 協助創作的歌曲。


新穎性與模仿

這些法律案件正踏入一個灰色地帶,與其他 AI 相關的訴訟爭議相似。核心問題在於:AI 模型是否可以使用受版權保護的內容進行訓練,以及生成的歌曲是否不公平地複製了人類藝術家的風格。

但無論法院最終如何裁定,AI 音樂很可能仍會以某種形式持續擴張;據報導,YouTube 已與主要唱片公司洽談授權其音樂用於 AI 訓練,Meta 近期也擴大了與環球音樂集團的合作,顯示 AI 生成音樂的授權可能已在考量中。

如果 AI 音樂將持續存在,那它究竟會不會「好聽」?可以從三項因素思考:訓練資料、擴散模型本身,以及提示詞(prompting)。模型的品質取決於它所學習的音樂資料庫以及這些音樂的描述,而這些描述必須足夠複雜才能準確掌握音樂特性。模型的架構則決定它能多好地使用所學內容生成歌曲。而你給模型的提示——以及模型究竟能多大程度「理解」你所說的「把薩克斯風音量調低」之類的語意——也至關重要。

或許最重要的問題是:訓練資料的規模和多樣性如何?其標記是否充分?Suno 和 Udio 都沒有公開其訓練資料中包含哪些音樂,但這些細節可能會在訴訟過程中被迫公開。

Udio 表示,歌曲如何被標記對模型至關重要。Ding 說:「我們現在的一項重要研究方向是:如何取得越來越精細的音樂描述?」基本描述會指出類型,但還可以描述一首歌是否情緒化、振奮或平靜。更技術性的描述可能會提到 2-5-1 和弦進行或特定音階。Udio 說,它透過機器與人工標記的結合來完成這些描述。

「因為我們的目標使用者很廣,也意味著我們需要非常多樣化的音樂標註者。」他說。「不只需要能從技術層面深入分析音樂的音樂博士,也需要那些有自己獨特詞彙、能以非正式方式描述音樂的音樂愛好者。」

具競爭力的 AI 音樂生成器也必須持續從不斷產生的新歌曲中學習;否則,它們的輸出將停滯不前,聽起來陳舊過時。

AI 生成的音樂依賴人類創作的藝術。不過在未來,AI 音樂模型可能會以自己的輸出作為訓練資料——這種方法已在其他 AI 領域中進行實驗。

由於模型從隨機噪音開始,它們具有非決定性;即使給同一個 AI 模型相同的提示,每次也會產生不同的新歌曲。這也因為許多擴散模型的製作者(包括 Udio)會在過程中加入額外的隨機性——本質上是在每一步取得生成的波形並稍微扭曲,以期加入些微的不完美,使輸出更有趣或更逼真。達特茅斯會議的組織者早在 1956 年就曾建議採用這樣的方法。

Comment by 史識 庫 on December 4, 2025 at 9:17pm

詹姆斯.奧唐奈:複製與創作(3)

在模型訓練完成後,生成新影像就只需要反轉此過程。如果你給模型一個提示,例如「長滿苔蘚的森林裡一隻快樂的紅毛猩猩」,模型會從一張隨機的白噪音影像開始,然後反向運作,利用其統計模型一步步去除雜訊。

起初只會顯現出粗略的形狀與顏色,細節會逐漸出現,最終紅毛猩猩便浮現出來──即便模型並不以人類的方式“知道”什麼是紅毛猩猩。
 

生成音樂依賴人類創作的藝術。未來,AI 音樂模型可能會使用自己的產出作為訓練資料——這在其他 AI 領域也正在被嘗試。由於模型從隨機噪音開始,它們是非決定性的;即使給同一個 AI 模型相同的指令,每次也可能產生不同的歌曲。這也是因為許多擴散模型(包括 Udio)的使用者在過程中加入了額外的隨機性——本質上是在每一步對生成的波形進行極細微的扭曲,添加一些不完美之處,讓輸出更有趣或更真實。達特茅斯會議的主辦者早在 1956 年就曾建議採用這種策略。

根據 Udio 的共同創辦人兼營運長 Andrew Sanchez 所說,生成式 AI 程式中固有的這種隨機性讓許多人感到震驚。在過去 70 年中,電腦執行的都是決定論程式:輸入某個指令,就會得到相同的回應。

「我們的許多藝術家合作夥伴會說:『為什麼它會這樣做?』」他說。「而我們也只能說:『呃,我們其實也不知道。』」生成式時代要求創造這些技術的公司建立新的思維方式:AI 程序可能會混亂、難以解釋。

這些結果到底是創作,還是單純複製訓練資料?AI 音樂的愛好者告訴我,我們也可以用同樣的問題來詢問人類的創造力。當我們在年輕時聆聽音樂時,大腦的學習機制會受到這些輸入的影響;這些歌曲的記憶會形塑我們的創作輸出。萊斯大學的作曲家兼音樂教授 Anthony Brandt 在最近的一項研究中指出,人類和大型語言模型都會利用過去的經驗來評估可能的未來情境,並做出更好的選擇。

確實,人類藝術——尤其是音樂——大多是借鑒而來的。這往往會導致法律訴訟,因為藝術家會指控某首歌在未經允許的情況下被複製或取樣。一些專家認為,擴散模型應該更加透明,讓我們可以知道某首歌的靈感可能有部分來自 David Bowie,也有部分來自 Lou Reed。Udio 表示,相關研究仍在進行中,但目前沒有人能可靠地做到這一點。

Udio 和 Suno 到目前為止的成果顯示,有相當大一群聽眾可能並不在乎自己聽的音樂究竟是由人還是由機器創作的。Suno 為創作者設置了藝術家頁面,其中一些創作者擁有大量追隨者,並完全使用 AI 生成歌曲,通常還搭配由 AI 生成的藝術家圖像。這些創作者並不是傳統意義上的音樂家,而是熟練使用提示詞的人,創造出的作品無法歸功於單一作曲家或歌手。在這個新興空間裡,我們對作者權的常規定義——以及創作與複製之間的界線——幾乎完全消融。

音樂產業正在反擊。這兩家公司在 2024 年 6 月遭到主要唱片公司的起訴,目前訴訟仍在進行。這些唱片公司,包括 Universal 和 Sony,指控 AI 模型受訓於「規模幾乎難以想像」的受版權保護音樂,並生成「模仿真正人類聲音錄音特質」的歌曲(例如對 Suno 的指控中提到一首類似 ABBA 的歌曲〈Prancing Queen〉)。

Comment by 史識 庫 on December 2, 2025 at 10:52pm

詹姆斯.奧唐奈:複製與創作(2)

Making connections(建立連結)

達特茅斯會議之後,參與者們開始投入不同的研究方向,建構出 AI 的基礎技術。與此同時,認知科學家則響應美國心理學會會長 J.P. Guilford1950 年的呼籲,開始研究人類的創造力。他們最終提出一個定義,並由心理學家 Morris Stein1953 年於《心理學期刊》中正式提出。創意作品必須既新穎——代表它們帶來一些新的事物;又有用——代表它們對某人有某種用途。有些人認為「有用」應該改成「令人滿意」,也有人主張應加入第三項標準:創意作品也應該令人驚喜。

到了 1990 年代,功能性磁振造影(fMRI)的興起使得研究多種創造力相關的神經機制變得可能,包括音樂。近年來的計算方法也讓科學家更容易描繪記憶與聯想思維在創意決策中的角色。

目前所形成的並不是一套完整的統一理論,用來解釋創意如何在大腦中產生與展開,而更像是不斷累積的強大觀察結果。我們可以先將人類創意過程分成不同階段,包括提出構想的階段,以及之後更批判、更評估性的階段,用來判斷想法是否具有價值。主導這兩個階段的一項重要理論稱為「聯想創造力理論」,該理論主張:最有創造力的人能在遙遠的概念之間建立新穎的連結。

「這就像擴散式的啟動一樣,」賓州州立大學創造力認知神經實驗室領導者 Roger Beaty 說:「你想到一件事,它就會啟動與之相關的其他概念。」

這些連結往往特別依賴語意記憶——儲存概念與事實的記憶系統,而非情節記憶(儲存特定時間與地點的經驗)。近年來,更精密的計算模型被用來研究人們如何在「語意距離」極大的概念之間建立連結。例如,「apocalypse(末日)」與「nuclear power(核能)」相比,「apocalypse」與「celebration(慶典)」在語意上反而更疏遠。研究顯示,高度有創造力的人可能會感覺語意上非常不同的概念彼此更接近。

研究發現,藝術家比非藝術家更能在更遙遠的語意距離間產生文字聯想。其他研究也支持另一個觀點:具有創造力的人往往擁有「漏接式注意力」(leaky attention)——也就是說,他們經常注意到與當下任務並不特別相關的資訊。

用來評估這些歷程的神經科學方法並不支持「創造力來自大腦某個特定區域」的說法。創造力研究領域的重要學者 Dean Keith Simonton 在《劍橋創造力神經科學手冊》中寫道:「大腦中並沒有任何區域能像腺體分泌荷爾蒙那樣產生創造力。」

證據反而指出,創造性思考會啟動數個分散的神經網絡,Beaty 說——其中一個負責透過聯想思維產生最初的想法,另一個負責辨識有潛力的點子,還有一個負責評估與修改。

哈佛醫學院的研究者在今年二月發表的一項新研究進一步指出,創造力甚至可能涉及抑制 某些特定的腦部網絡,例如那些與自我審查相關的區域。

到目前為止,機器的創造力——如果你願意這麼稱呼的話——看起來非常不同。雖然在達特茅斯會議時,AI 研究者主要著眼於打造模仿人腦的機器,但到了擴散模型問世(大約十年前)時,研究焦點已經轉移。

了解擴散模型如何運作的最好線索就是它們的名字。如果你把沾滿紅墨水的畫筆浸入一杯清水中,墨水會擴散並隨機旋繞,最後整杯變成淡粉色液體。擴散模型則反向模擬這個過程,從隨機雜訊中重建出可辨識的形體。

若想理解這如何應用在影像上,不妨想像一張大象的照片。為了訓練模型,你會先複製這張照片,並在上面加上一層隨機的黑白雜訊。然後你製作第二份並加更多雜訊,如此反覆數百次,直到最後一張影像完全是雜訊,完全看不到大象的蹤影。

對於中間的每一張影像,統計模型必須判斷:影像中有多少是雜訊、有多少是真正的大象。它會將自己的猜測與正確答案比較,並從錯誤中學習。經過數百萬張影像的訓練後,模型會越來越擅長「去雜訊」,並將這些模式與描述(例如「在空曠原野中的婆羅洲雄性大象」)連結起來。

(Abstract from: Replication and Creation by James O’Donnell ; in MIT Technology Review Vol 128 No. 3, May/June 2025, Featuring: Muse or machine? Defining Creativity in the age of AI; Replication and Creation by James O’Donnell, pg 36-41)

Comment by 史識 庫 on December 1, 2025 at 10:45pm

詹姆斯.奧唐奈:複製與創作(1

人工智慧在1956年幾乎還不是一個術語,當時來自計算領域的頂尖科學家齊聚達特茅斯學院(Dartmouth College)參加一場夏季會議。電腦科學家約翰・麥卡錫(John McCarthy)在這次活動的資助提案中創造了這個詞語,旨在召集人們討論如何建造能夠使用語言、像人類一樣解決問題並能自我改善的機器。但這是個好選擇,也抓住了這場會議的核心前提:任何人類智慧的特徵「原則上都能被如此精確地描述,使得機器可以被製造來模擬它」。

在他們的提案中,研究團隊列出了「人工智慧問題」的幾個面向。其中最後一項——事後看來或許最困難的一項——是打造一台能展現創造力與原創性的機器。

當時,心理學家仍在努力定義並測量人類的創造力。主流理論認為創造力是智慧與高IQ(智商)的產物,但心理學家並不確定該用什麼理論取代它。達特茅斯的組織者們提出自己的看法:「創造性思維與乏味但能力稱職的思維之間的差別,在於注入了一些隨機性」,他們寫道,並補充這種隨機性「必須由直覺引導,才能有效率」。

將近 70 年後,隨著該領域歷經一連串的繁榮與衰退週期,我們如今擁有或多或少遵循這種方式的 AI 模型。近三年來,大型語言模型迅速崛起,而另一種類型、基於擴散模型(diffusion models)的 AI,也在創意領域造成前所未有的影響。透過將隨機雜訊轉換成有意義的模式,擴散模型能生成新的圖像、影片或語音,並由文字提示或其他輸入引導。最好的模型甚至能創造出與人類作品無法區分的成果,也能產出奇異、超現實、明顯非人類的結果。

如今,這些模型正進入比任何領域都更容易被顛覆的創意範疇:音樂。AI 生成的作品——從管弦樂到重金屬——正準備以前所未有的方式滲透進我們的生活,遠比任何其他 AI 產品深入。我們可能會在串流平台、派對或婚禮播放清單、配樂等地方聽到這些歌曲,而不一定察覺是誰(或什麼)創作了它們。

多年來,擴散模型在視覺藝術世界中已掀起爭論,人們質疑它們產出的作品究竟是創造還是複製。如今,這場爭論來到音樂領域——一門深深嵌入我們經驗、記憶與社會生活的藝術。音樂模型現在能創作出能引發真實情感反應的歌曲,顯示在 AI 時代中,要定義作者身分與原創性變得多麼困難。

法院也正在積極處理這片模糊地帶。主要唱片公司正起訴頂尖 AI 音樂生成器,指控擴散模型僅僅複製人類藝術,且不向藝術家付費。模型開發者則反駁,他們的工具是為了協助人類創作。

在判定誰是誰非的過程中,我們被迫重新思考人類創造力本身。無論是在人工神經網路或生物神經網路中,創造力是否只是龐大統計學習與連結的結果,再加上一些隨機性?如果是這樣,那麼作者身分是否變成一個滑動的概念?如果不是——如果創造中有某種明確的人類成分——那它是什麼?若沒有人的創作者,作品仍能感動我們嗎?我第一次聽到 AI 創作的歌曲時不得不面對這些問題——那首歌非常棒,但令人不安的是,它只是某人輸入提示後按下「生成」而已。這種處境很快也會降臨到你身上。

(Abstract from: Replication and Creation by James O’Donnell ; in MIT Technology Review Vol 128  No. 3, May/June 2025, Featuring: Muse or machine? Defining  Creativity in the age of AI; Replication and Creation by James O’Donnell, pg 36-41) 

延續閱讀:從「新視覺」到新媒體

愛墾網 是文化創意人的窩;自2009年7月以來,一直在挺文化創意人和他們的創作、珍藏。As home to the cultural creative community, iconada.tv supports creators since July, 2009.

Videos

  • Add Videos
  • View All