Sebuah gambar mungkin bernilai ribuan kata, tetapi berkat program kecerdasan buatan yang disebut DALL-E 2, Anda dapat memiliki gambar yang tampak profesional dengan jauh lebih sedikit.

DALL-E 2 adalah jaringan saraf baru yang membuat gambar dari frasa atau kalimat pendek yang Anda berikan. Programyang diumumkan oleh laboratorium penelitian kecerdasan buatan OpenAI pada April 2022 itu belum dirilis ke publik. Tetapi sejumlah kecil orang – termasuk saya sendiri – telah diberi akses untuk bereksperimen dengannya.

Sebagai peneliti yang mempelajari hubungan teknologi dan seni, saya tertarik untuk melihat seberapa baik program ini bekerja. Setelah berjam-jam bereksperimen, jelas bahwa DALL-E – meskipun bukan tanpa kekurangan – jauh lebih maju dari teknologi pembuatan gambar yang ada. Ini menimbulkan pertanyaan langsung tentang bagaimana teknologi ini akan mengubah cara seni dibuat dan dikonsumsi. Hal ini juga menimbulkan pertanyaan tentang apa artinya menjadi kreatif ketika DALL-E 2 tampaknya mengotomatiskan begitu banyak proses kreatif itu sendiri.

Berbagai gaya dan subjek

yang menakjubkan Peneliti OpenAI membangun DALL-E 2 dari koleksi gambar yang sangat banyak dengan teks. Mereka mengumpulkan beberapa gambar secara online dan melisensikan yang lain.

Menggunakan DALL-E 2 sangat mirip dengan mencari gambar di web: Anda mengetikkan frasa pendek ke dalam kotak teks, dan itu mengembalikan enam gambar.

Tetapi alih-alih diambil dari web, program ini menciptakan enam gambar baru, yang masing-masing mencerminkan beberapa versi dari frasa yang dimasukkan. (Sampai saat ini, program ini menghasilkan 10 gambar per prompt.) Misalnya, ketika beberapa teman dan saya memberi DALL-E 2 prompt teks "cats in devo hats", itu menghasilkan 10 gambar dengan gaya yang berbeda.

Hampir semuanya bisa masuk akal untuk foto atau gambar profesional. Sementara algoritme tidak cukup memahami "topi Devo" – helm aneh yang dikenakan oleh band New Wave Devo – tutup kepala pada gambar yang dihasilkannya mendekati.

Selama beberapa tahun terakhir, komunitas kecil seniman telah menggunakan algoritma jaringan saraf untuk menghasilkan karya seni. Banyak dari karya seni ini memiliki kualitas khas yang hampir terlihat seperti gambar nyata, tetapi dengan distorsi ruang yang aneh – semacam kubisme cyberpunk. Sistem teks-ke-gambar terbaru sering kali menghasilkan citra fantasi dan fantasi yang dapat menyenangkan tetapi jarang terlihat nyata.

DALL-E 2 menawarkan lompatan signifikan dalam kualitas dan realisme gambar. Itu juga dapat meniru gaya tertentu dengan akurasi yang luar biasa. Jika Anda menginginkan gambar yang terlihat seperti foto sebenarnya, itu akan menghasilkan enam gambar seperti aslinya. Jika Anda ingin lukisan gua prasejarah Shrek, itu akan menghasilkan enam gambar Shrek seolah-olah mereka telah digambar oleh seniman prasejarah.

Sungguh mengejutkan bahwa suatu algoritma dapat melakukan ini. Setiap set gambar membutuhkan waktu kurang dari satu menit untuk menghasilkan. Tidak semua gambar akan terlihat enak dipandang, juga tidak mencerminkan apa yang ada dalam pikiran Anda. Tetapi, bahkan dengan kebutuhan untuk menyaring banyak keluaran atau mencoba petunjuk teks yang berbeda, tidak ada cara lain yang ada untuk memompa begitu banyak hasil yang bagus dengan begitu cepat – bahkan dengan mempekerjakan seorang seniman. Dan, terkadang, hasil yang tidak terduga adalah yang terbaik.

Pada prinsipnya, siapa pun yang memiliki sumber daya dan keahlian yang cukup dapat membuat sistem seperti ini. Google Research baru-baru ini mengumumkan sistem teks-ke-gambar serupa yang mengesankan ,dan satu pengembang independen secara publik mengembangkan versi mereka sendiri yang dapat dicoba siapa saja sekarang di web, meskipun belum sebagus DALL-E atau sistem Google.

Sangat mudah untuk membayangkan alat ini mengubah cara orang membuat gambar dan berkomunikasi, baik melalui meme, kartu ucapan, iklan – dan, ya, seni.

Di mana seni dalam hal itu?

Saya memiliki momen awal saat menggunakan DALL-E 2 untuk menghasilkan berbagai jenis lukisan, dalam semua gaya yang berbeda – seperti “Odilon Redon Seattle” – ketika saya menyadari bahwa ini lebih baik daripada algoritma lukisan yang pernah saya kembangkan . Kemudian saya menyadari bahwa itu, di satu sisi, adalah pelukis yang lebih baik daripada saya.

Faktanya, tidak ada manusia yang dapat melakukan apa yang DALL-E 2 lakukan: membuat rentang gambar berkualitas tinggi dan bervariasi hanya dalam hitungan detik. Jika seseorang memberi tahu Anda bahwa seseorang membuat semua gambar ini, tentu saja Anda akan mengatakan bahwa mereka kreatif.

Tapi ini tidak membuat DALL-E 2 menjadi artis. Meskipun terkadang terasa seperti sulap, di balik kap mesinnya masih merupakan algoritme komputer, dengan kaku mengikuti instruksi dari pembuat algoritme di OpenAI.

Jika gambar-gambar ini berhasil sebagai seni, itu adalah produk dari bagaimana algoritme dirancang, gambar itu dilatih, dan – yang paling penting – bagaimana seniman menggunakannya.

Anda mungkin cenderung mengatakan ada sedikit manfaat artistik dalam gambar yang dihasilkan oleh beberapa penekanan tombol. Namun dalam pandangan saya, garis pemikiran ini menggemakan pandangan klasik bahwa fotografi tidak bisa menjadi seni karena mesin melakukan semua pekerjaan. Hari ini kepenulisan dan keahlian manusia yang terlibat dalam fotografi artistik diakui, dan para kritikus memahami bahwa fotografi terbaik melibatkan lebih dari sekadar menekan tombol.

Meski begitu, kita sering membahas karya seni seolah-olah langsung dari niat sang seniman. Artis bermaksud untuk menunjukkan sesuatu, atau mengekspresikan emosi, dan karena itu mereka membuat gambar ini. DALL-E 2 tampaknya memotong proses ini sepenuhnya: Anda memiliki ide dan mengetiknya, dan selesai.

Tetapi ketika saya melukis dengan cara kuno, saya menemukan bahwa lukisan saya berasal dari proses eksplorasi, bukan hanya dari pelaksanaan tujuan awal saya. Dan ini berlaku untuk banyak artis.

Ambil contoh Paul McCartney, yang datang dengan lagu "Get Back" selama sesi jam. Dia tidak memulai dengan sebuah rencana untuk lagu itu; dia baru saja mulai mengutak-atik dan bereksperimen dan band mengembangkannya dari sana.

Picasso menggambarkan prosesnya dengan cara yang sama: “Saya tidak tahu sebelumnya apa yang akan saya taruh di kanvas selain saya memutuskan sebelumnya warna apa yang akan saya gunakan … Setiap kali saya mencoba melukis gambar, saya memiliki sensasi melompat-lompat. ke luar angkasa.”

Dalam penjelajahan saya sendiri dengan DALL-E 2, satu ide akan mengarah ke ide lain yang mengarah ke ide lain, dan akhirnya saya menemukan diri saya di medan baru yang ajaib dan tak terduga, sangat jauh dari tempat saya memulai.

Dorongan sebagai seni

Saya berpendapat bahwa seni, dalam menggunakan sistem seperti DALL-E 2, tidak hanya berasal dari prompt teks akhir, tetapi dalam keseluruhan proses kreatif yang mengarah ke prompt itu. Seniman yang berbeda akan mengikuti proses yang berbeda dan berakhir dengan hasil yang berbeda yang mencerminkan pendekatan, keterampilan, dan obsesi mereka sendiri.

Saya mulai melihat eksperimen saya sebagai satu set seri, masing-masing menyelam secara konsisten ke dalam satu tema, bukan satu set gambar aneh yang independen.

Ide untuk gambar dan rangkaian ini datang dari mana-mana, sering dihubungkan oleh serangkaian batu loncatan. Pada satu titik, saat membuat gambar berdasarkan karya seniman kontemporer, saya ingin menghasilkan gambar seni instalasi spesifik lokasi dengan gaya seniman kontemporer Jepang Yayoi Kusama. Setelah mencoba beberapa lokasi yang tidak memuaskan, saya mendapat ide untuk menempatkannya di La Mezquita, bekas masjid dan gereja di Córdoba, Spanyol. Saya mengirim gambar itu ke seorang rekan arsitek, Manuel Ladron de Guevara, yang berasal dari Córdoba, dan kami mulai membahas ide arsitektur lainnya bersama-sama.

Ini menjadi serangkaian bangunan baru imajiner dalam gaya arsitek yang berbeda.

Jadi saya mulai mempertimbangkan apa yang saya lakukan dengan DALL-E 2 baik sebagai bentuk eksplorasi maupun bentuk seni, bahkan jika itu sering kali merupakan seni amatir seperti gambar yang saya buat di iPad.

Memang beberapa seniman, seperti Ryan Murdoch, telah menganjurkan pembuatan gambar berbasis cepat untuk diakui sebagai seni. Dia menunjuk seniman AI berpengalaman Helena Sarin sebagai contoh.

“Ketika saya melihat sebagian besar barang dari Midjourney” – sistem teks-ke-gambar populer lainnya – “banyak yang akan menarik atau menyenangkan,” kata Murdoch kepada saya dalam sebuah wawancara. “Tetapi dengan pekerjaan [Sarin], ada garis tembus. Sangat mudah untuk melihat bahwa dia telah menaruh banyak pemikiran ke dalamnya, dan telah bekerja di bidang itu, karena outputnya lebih menarik secara visual dan menarik, dan mengikuti gayanya secara berkelanjutan.”

Bekerja dengan DALL-E 2, atau sistem teks-ke-gambar baru, berarti mempelajari kebiasaannya dan mengembangkan strategi untuk menghindari perangkap umum. Penting juga untuk mengetahui tentang potensi bahayanya, seperti ketergantungannya pada stereotip, dan potensi penggunaan disinformasi. Dengan menggunakan DALL-E 2, Anda juga akan menemukan korelasi yang mengejutkan, seperti cara segala sesuatu menjadi kuno saat Anda menggunakan gaya pelukis, pembuat film, atau fotografer tua.

Ketika saya memiliki sesuatu yang sangat spesifik yang ingin saya buat, DALL-E 2 sering tidak dapat melakukannya. Hasilnya akan membutuhkan banyak pengeditan manual yang sulit sesudahnya. Saat tujuan saya tidak jelas, prosesnya paling menyenangkan, menawarkan kejutan yang mengarah pada ide-ide baru yang dengan sendirinya mengarah pada lebih banyak ide dan seterusnya.

Membuat realitas baru

Sistem teks-ke-gambar ini juga dapat membantu pengguna membayangkan kemungkinan baru.

Artis-aktivis Danielle Baskin mengatakan kepada saya bahwa dia selalu bekerja "untuk menunjukkan realitas alternatif dengan contoh 'nyata': baik dengan mengatur skenario di dunia fisik atau melakukan pekerjaan yang teliti di Photoshop." DALL-E 2, bagaimanapun, “adalah jalan pintas yang menakjubkan karena sangat bagus dalam hal realisme. Dan itulah kunci untuk membantu orang lain mewujudkan masa depan yang memungkinkan – entah itu satir, mimpi, atau keindahan.”

Dia telah menggunakannya untuk membayangkan sistem transportasi alternatif dan pipa ledeng yang mengangkut mie alih-alih air, yang keduanya mencerminkan kepekaan seniman-provokatornya.

Demikian pula, rendering arsitektural seniman Mario Klingemann dengan tenda-tenda tunawisma dapat dianggap sebagai jawaban atas rendering arsitektur rumah impian saya yang mewah.

Masih terlalu dini untuk menilai pentingnya bentuk seni ini. Saya terus memikirkan sebuah ungkapan dari buku yang sangat bagus “Seni dalam Budaya Setelahnya” – “Estetika AI yang dominan adalah kebaruan.”

Tentunya ini akan benar, sampai batas tertentu, untuk setiap teknologi baru yang digunakan untuk seni. Film pertama oleh Lumière bersaudara pada tahun 1890-an adalah hal baru, bukan mahakarya sinematik; itu membuat orang takjub melihat gambar bergerak sama sekali.

Perangkat lunak seni AI berkembang begitu cepat sehingga selalu ada kebaruan teknis dan artistik. Sepertinya, setiap tahun, ada kesempatan untuk mengeksplorasi teknologi baru yang menarik – masing-masing lebih kuat dari sebelumnya, dan masing-masing tampaknya siap mengubah seni dan masyarakat.

 

Sumber : The Conversation

Info https://pmb.stekom.ac.id

Kerjasama/Penerimaan Mahasiswa Baru,

WA 24 jam : 081 -777-5758 (081 jujuju maju mapan )

IG : @ universitassetekom

TikTok : @ universitasstekom

FP : https : //www.facebook.com/stekom.ac.id/

TWITTER : https://twitter.com/unistekom

YOUTUBE : https://www.youtube.com/ UniversitasSTEKOM

 Copyright stekom.ac.id 2018 All Right Reserved