Kreativitas Manusia vs. Kreativitas Buatan: Di Mana Perbedaannya Sesungguhnya Terletak (Dan Mengapa Gaya Ghibli Mengajarkan Kita Sesuatu)
Perdebatan tentang kecerdasan buatan dan hak cipta telah meningkat secara dramatis pada tahun 2024-2025. Ini bukan lagi diskusi teoretis: The New York Times menggugat OpenAI atas pelanggaran hak cipta (Desember 2023), Getty Images menggugat Stability AI, dan ribuan seniman mengajukan gugatan perwakilan kelompok. Perusahaan-perusahaan AI menjawab bahwa sistem mereka 'belajar' seperti manusia-tetapi benarkah demikian?
Kreativitas manusia selalu berkembang melalui koneksi: Shakespeare terinspirasi oleh kronik sejarah dan cerita rakyat, Van Gogh mempelajari seni lukis Jepang, The Beatles memulai dengan memainkan musik rock Amerika. Seniman selalu menafsirkan ulang karya-karya sebelumnya. Kecerdasan buatan, katakanlah perusahaan teknologi, melakukan hal yang sama. Tapi kasus 'gaya Ghibli' mengungkapkan betapa sederhananya narasi ini.
Ketik 'gaya Ghibli' pada Midjourney atau DALL-E dan Anda akan mendapatkan gambar yang sangat mirip dengan mahakarya Hayao Miyazaki: warna-warna pastel, awan yang lembut, lanskap yang bagaikan mimpi, tokoh-tokoh yang bermata besar. Secara teknis memang mengesankan. Ini juga sangat bermasalah.
Studio Ghibli membutuhkan waktu puluhan tahun untuk mengembangkan estetika yang khas itu: pilihan palet warna yang tepat, teknik animasi tradisional, dan filosofi artistik yang berakar pada budaya Jepang dan visi pribadi Miyazaki. Ketika sebuah model AI meniru 'gaya' tersebut dalam hitungan detik, apakah model tersebut benar-benar 'belajar' seperti yang dipelajari Miyazaki dari animasi Disney dan manga Jepang? Atau apakah itu hanya menggabungkan kembali pola visual yang diekstrak dari ribuan frame Ghibli tanpa izin?
Perbedaannya tidak bersifat filosofis - perbedaannya bersifat legal dan ekonomis. Menurut analisis Stanford yang dipublikasikan di arXiv (Carlini et al., 2023), model difusi seperti Stable Diffusion dapat meregenerasi gambar yang hampir sama dari set pelatihan dalam sekitar 3 persen kasus ketika diminta dengan petunjuk khusus. Ini bukanlah 'inspirasi', melainkan penyimpanan dan reproduksi.
Seniman digital asal Polandia, Greg Rutkowski, menemukan bahwa namanya muncul dalam 1,2 juta permintaan di Stable Diffusion-secara tidak sengaja menjadi salah satu 'gaya' yang paling banyak diminta tanpa pernah memberikan persetujuan atau menerima kompensasi. Seperti yang dia katakan kepada MIT Technology Review, "Saya tidak merasa tersanjung. Saya merasa seperti sesuatu yang saya bangun selama bertahun-tahun telah dicuri dari saya.
Skala pelatihan AI telah mencapai skala yang belum pernah terjadi sebelumnya. LAION-5B, salah satu set data yang paling banyak digunakan untuk model gambar, berisi 5,85 miliar pasangan gambar-teks yang dikumpulkan dari internet-termasuk karya berhak cipta. GPT-4 dilatih pada bagian internet yang sangat besar, termasuk artikel berbayar, buku, dan kode perangkat lunak berpemilik.
Tindakan hukum besar yang sedang berlangsung:
Perusahaan-perusahaan AI membela praktik ini dengan menggunakan 'penggunaan wajar' di bawah hukum AS: mereka berargumen bahwa pelatihan ini bersifat 'transformatif' dan tidak menggantikan pasar aslinya. Namun, beberapa pengadilan menentang interpretasi ini.
Hakim Katherine Forrest, dalam Getty v. Stability AI, menolak mosi untuk memberhentikan pada Januari 2024, dan mengizinkan kasus ini untuk dilanjutkan: "Pertanyaan apakah pelatihan model AI merupakan penggunaan yang wajar adalah rumit dan membutuhkan pemeriksaan menyeluruh terhadap fakta-fakta yang ada. Terjemahan: Perusahaan AI tidak bisa begitu saja menyatakan penggunaan wajar dan selesai.
Dihadapkan dengan tekanan hukum, perusahaan-perusahaan AI mulai menegosiasikan lisensi. OpenAI telah menandatangani perjanjian dengan:
Google menandatangani perjanjian serupa dengan Reddit, Stack Overflow, dan berbagai penerbit. Anthropic telah bernegosiasi dengan para penerbit untuk penggunaan buku.
Namun perjanjian ini hanya mencakup penerbit besar yang memiliki kekuatan negosiasi. Jutaan pencipta perorangan-seniman, fotografer, penulis lepas-tetap tidak mendapatkan kompensasi atas karya yang digunakan dalam pelatihan yang telah diselesaikan.
Narasi 'AI belajar seperti manusia' secara teknis menyesatkan. Mari kita lihat perbedaan mendasarnya:
Skala dan kecepatan: Seorang seniman manusia mungkin mempelajari ratusan atau ribuan karya seumur hidupnya. GPT-4 telah dilatih pada triliunan kata. Difusi yang stabil pada miliaran gambar. Skala ini tidak ada bandingannya dan melebihi definisi 'inspirasi' yang masuk akal.
Pemahaman semantik: Ketika Van Gogh mempelajari cetakan Jepang, ia tidak secara mekanis menyalin pola visual - ia memahami prinsip-prinsip estetika yang mendasarinya (penggunaan ruang negatif, komposisi asimetris, penekanan pada alam) dan menafsirkannya kembali melalui visi pasca-impresionis Eropa. Karya-karyanya adalah sintesis budaya yang sadar.
Model AI tidak 'mengerti' dalam pengertian manusia. Seperti yang dijelaskan oleh Melanie Mitchell, profesor di Santa Fe Institute, dalam bukunya "Kecerdasan Buatan: Panduan untuk Manusia yang Berpikir": "Sistem pembelajaran yang mendalam sangat baik dalam hal pengenalan pola, namun kurang dalam hal pemahaman sebab akibat, penalaran abstrak, atau model mental dunia. Stable Diffusion tidak 'memahami' apa yang membuat Ghibli berbeda-mengekstrak korelasi statistik antara jutaan piksel yang diberi label 'gaya Ghibli'.
Kesengajaan kreatif: Seniman manusia membuat pilihan kreatif yang disengaja berdasarkan visi pribadi, pesan yang ingin mereka komunikasikan, emosi yang ingin mereka bangkitkan. Miyazaki memasukkan tema-tema lingkungan, pasifisme, feminisme ke dalam filmnya - pilihan moral dan artistik yang sadar akan moral dan artistik.
AI menghasilkan berdasarkan probabilitas statistik: "diberikan prompt X dan set pelatihan Y, konfigurasi piksel mana yang paling mungkin?" Tidak ada kesengajaan, tidak ada pesan, tidak ada visi. Seperti yang ditulis Ted Chiang di The New Yorker: "ChatGPT adalah jpeg buram dari web" - kompresi lossy yang kehilangan kualitas yang membuat konten asli menjadi berharga.
Transformasi vs. rekombinasi: Pablo Picasso mempelajari topeng Afrika tetapi menciptakan Kubisme - sebuah gerakan artistik yang sama sekali baru yang menemukan kembali representasi spasial dalam lukisan. Transformasi ini radikal dan orisinal.
Model AI generatif beroperasi dengan interpolasi dalam ruang laten: mereka menggabungkan kembali elemen-elemen set pelatihan ke dalam konfigurasi baru, tetapi tetap terikat pada distribusi statistik dari data yang telah dilatih. Mereka tidak dapat menciptakan estetika yang benar-benar baru yang melanggar keteraturan statistik yang telah dipelajari. Seperti yang ditunjukkan oleh penelitian MIT (Shumailov et al., 2023), model yang dilatih berulang kali pada keluaran AI sebelumnya akan mengalami kemunduran yang semakin lama semakin parah - fenomena yang disebut 'keruntuhan model'.
Inilah paradoks utamanya: AI dapat menghasilkan output yang terlihat orisinil (tidak ada manusia yang pernah melihat gambar gaya Ghibli yang spesifik sebelumnya) tetapi secara statistik merupakan turunan (merupakan interpolasi dari pola yang sudah ada). Ini adalah bentuk orisinalitas yang dangkal tanpa inovasi yang mendasar.
Hal ini memiliki implikasi yang mendalam. Seperti yang dikatakan oleh filsuf John Searle dalam 'argumen Ruang Cina' yang terkenal: mensimulasikan proses kognitif tidak sama dengan memilikinya. AI dapat mensimulasikan kreativitas tanpa menjadi kreatif dalam pengertian manusia.
Menghadapi kontroversi tersebut, berbagai solusi sedang dikembangkan:
Alat perlindungan untuk seniman:
Register penyisih (opt-out):
Kerangka Kerja Kompensasi:
Peraturan pemerintah:
Undang-Undang AI Uni Eropa (mulai berlaku Agustus 2024) mewajibkan penyedia model AI generatif untuk mempublikasikan ringkasan terperinci dari data pelatihan berhak cipta yang digunakan. Ini adalah upaya regulasi pertama yang menerapkan transparansi.
Undang-Undang ELVIS Tennessee (Maret 2024) secara khusus melindungi artis suara dan kemiripan dari penggunaan yang tidak sah di negara bagian AS yang pertama kali menggunakan AI dengan undang-undang khusus untuk pemalsuan suara dan visual yang mendalam.
Proposal yang diajukan kepada Kongres AS mencakup permintaan untuk ikut serta secara eksplisit untuk karya berhak cipta (alih-alih tidak ikut serta) dan pembuatan registrasi publik untuk kumpulan data pelatihan.
Dua visi masa depan saling berhadapan:
Pandangan optimis (perusahaan AI): AI adalah alat yang memperkuat kreativitas manusia, seperti Photoshop atau penyintesis musik. Seniman akan menggunakan AI untuk mempercepat alur kerja, mengeksplorasi variasi, dan mengatasi hambatan kreatif. Bentuk seni hibrida akan muncul di mana manusia memandu visi dan AI melakukan bagian teknis.
Contoh konkretnya sudah ada: film 'The Frost' (2023) menggunakan AI untuk menghasilkan latar belakang dan tekstur, dengan seniman manusia yang memandu arahan seni. Musisi menggunakan Suno dan Udio untuk menghasilkan lagu latar untuk berimprovisasi. Penulis menggunakan GPT sebagai 'bebek karet' untuk mendiskusikan ide-ide naratif.
Pandangan pesimis (banyak kreator): AI akan mengkomoditaskan kreativitas, mengikis nilai ekonomi dari karya kreatif hingga hanya para elit dengan keterampilan luar biasa yang bertahan. Kreativitas 'rata-rata' akan digantikan oleh generator murah, menghancurkan kelas menengah yang kreatif - seperti halnya otomatisasi industri yang menghilangkan pengrajin pada abad ke-19.
Bukti awal mendukung kekhawatiran ini: pada platform pekerja lepas seperti Fiverr, permintaan ilustrator dan copywriter turun 21% pada tahun 2023 (data Fiverr Q4 2023), sementara penawaran 'generasi seni AI' meledak. Greg Rutkowski telah melihat komisi langsung turun 40% sejak gayanya menjadi populer di Stable Diffusion.
Kebenarannya mungkin ada di antara keduanya: beberapa bentuk karya kreatif akan diotomatisasi (ilustrasi stok umum, copy marketing dasar), sementara kreativitas yang sangat orisinil, konseptual, dan berakar pada budaya akan tetap menjadi domain manusia.
Perbedaan antara konten manusia dan AI akan menjadi semakin sulit. Saat ini, tanpa tanda air atau pengungkapan, sering kali tidak mungkin untuk membedakan teks GPT-4 dari teks manusia, atau gambar Midjourney dari foto. Ketika Sora (generator video OpenAI) menjadi publik, perbedaannya akan meluas ke video.
Hal ini menimbulkan pertanyaan yang mendalam mengenai keaslian. Jika gambar gaya Ghibli yang dihasilkan oleh AI membangkitkan emosi yang sama dengan aslinya, apakah gambar tersebut memiliki nilai yang sama? Filsuf Walter Benjamin dalam 'The Work of Art in the Age of its Technical Reproducibility' (1935) berpendapat bahwa reproduksi mekanis mengikis 'aura' dari karya asli-keunikan dan keaslian spatio-temporal.
AI Generatif mengambil argumen ini secara ekstrem: AI tidak mereproduksi karya yang sudah ada, tetapi menghasilkan variasi tanpa akhir yang mensimulasikan karya asli tanpa menjadi karya asli. Ini adalah simulakrum Baudrillardian - salinan tanpa aslinya.
Namun, ada sesuatu yang tidak dapat direduksi dari tindakan kreatif yang dilakukan secara sadar: seniman yang memilih setiap sapuan kuas karena mengetahui apa yang ingin dikomunikasikan, penulis yang menyusun setiap frasa untuk membangkitkan emosi tertentu, komposer yang membangun ketegangan dan resolusi dengan penuh kesengajaan. AI dapat mensimulasikan hasil, tetapi tidak dapat mensimulasikan prosesnya-dan mungkin di dalam proses itulah nilai otentik dari kreativitas berada.
Seperti yang ditulis oleh Studio Ghibli dalam sebuah pernyataan (November 2023): 'Jiwa film kami tidak terletak pada gaya visual yang dapat ditiru, tetapi pada keputusan kreatif yang kami buat frame demi frame untuk menyajikan cerita yang ingin kami sampaikan. Hal itu tidak bisa diotomatisasi'.
Nilai seni, pada akhirnya, berasal dari kemampuannya untuk terhubung secara mendalam dengan pengalaman manusia-untuk membuat kita merasa dimengerti, ditantang, dan diubah. Apakah hal ini dapat dicapai oleh AI masih menjadi pertanyaan terbuka. Namun, selama seni dibuat oleh manusia untuk manusia, berbicara tentang kondisi manusia, seni akan mempertahankan sesuatu yang tidak dapat ditiru oleh algoritme apa pun: keaslian pengalaman hidup yang diterjemahkan ke dalam bentuk estetika.
Sumber: