ঢাকা শুক্রবার, ০৪ জুলাই ২০২৫

কৃত্রিম বুদ্ধিমত্তার চিত্রকর্ম

কৃত্রিম বুদ্ধিমত্তার চিত্রকর্ম

সোহেল সরকার

প্রকাশ: ০২ ডিসেম্বর ২০২২ | ১২:০০ | আপডেট: ০২ ডিসেম্বর ২০২২ | ২৩:০১

বিশ্বব্যাপী কৃত্রিম বুদ্ধিমত্তা নিয়ে রীতিমতো আলোড়ন চলছে। সব খাতেই তাকে ব্যবহার করা হচ্ছে। চলছে দুর্দান্ত সব গবেষণা। ফেসবুক, টুইটার, ইউটিউবের মতো সামাজিক যোগাযোগমাধ্যমে কৃত্রিম বুদ্ধিমত্তা ব্যবহারের বিষয়গুলো অনেক সোজাসাপ্টা। রোবট, স্বয়ংক্রিয় গাড়ি, ভার্চুয়াল অ্যাসিস্ট্যান্ট- সবকিছুই এর অংশ। এখন তা প্রবেশ করতে যাচ্ছে পেশাদার চিত্রকর্মে। যুক্তরাষ্ট্রভিত্তিক গবেষণা প্রতিষ্ঠান ওপেন এআই সামনে নিয়ে এলো এক নতুন সিস্টেম 'ডাল-ই ২', যা প্রাকৃতিক বা মানুষের ভাষার বর্ণনা থেকে বাস্তবসম্মত ছবি ও চিত্রকর্ম তৈরি করতে পারে।

ইলন মাস্কের প্রতিষ্ঠিত রিসার্চ কোম্পানি ওপেন এআই ২০২১ সালের জানুয়ারিতে মেশিন লার্নিং 'ডাল-ই' সিস্টেম প্রকাশ্যে আনে। এক বছর পর তারা আগের সিস্টেমের চেয়ে চার গুণ বেশি শক্তিশালী 'ডাল-ই ২' নিয়ে এসেছে। এটি আরও সূক্ষ্ণ, বাস্তবসম্মত ও নির্ভুলভাবে ছবি তৈরি করে। ২৮ সেপ্টেম্বর এটিকে সবার জন্য উন্মুক্ত করে দেওয়া হলে কেনার পাশাপাশি বিনামূল্যেও অনেক ছবি তৈরি করতে পারছেন সবাই। উন্মুক্ত করার মাত্র দুই মাসের মধ্যে এ সিস্টেম রয়েছে আলোচনার শীর্ষে।

ওপেন এআই তাদের ওয়েবসাইটে জানিয়েছে, এ সিস্টেম চিত্রকর্ম ও মানুষের ভাষার মধ্যে সম্পর্ক তৈরি করতে পারে। এটি 'ডিফিউশন' নামক একটি প্রক্রিয়া ব্যবহার করে, যা এলোমেলো বিন্দুগুলোর একটি প্যাটার্ন দিয়ে শুরু হয় এবং যখন এটি সেই চিত্রের নির্দিষ্ট দিকগুলোকে চিনতে পারে, তখন ধীরে ধীরে সেই প্যাটার্নটিকে একটি চিত্রকর্মে পরিণত করে। এ সিস্টেম যেমন চিত্রকর্ম নির্মাণ করতে পারে, তেমনি মূল ছবি থেকে অনুপ্রাণিত হয়ে ছায়া, প্রতিফলনসহ এর বিভিন্ন বৈচিত্র্য আনতে পারে। মূল ক্যানভাসে যা আছে তার বিস্তৃত এক চিত্রও সে গড়তে পারে।

পিকচার রোবট ওয়াল-ই ও শিল্পী সালভাদর ডালির নামে এর নামকরণ করা হয়। ডাল-ই হলো এক ধরনের নিউরাল নেটওয়ার্ক একটি কম্পিউটিং সিস্টেম, যা একটি জৈবিক মস্তিস্কে সংযুক্ত নিউরনের ওপর শিথিলভাবে তৈরি করা হয়েছে। ওপেন এআই জানিয়েছে, বস্তুর মধ্যে সম্পর্ক বোঝার জন্য নিউরাল নেটওয়ার্ককে ইমেজ ও ভাষা বর্ণনা সম্পর্কে প্রশিক্ষণ দেওয়া হয়েছে। গভীর শিক্ষার মাধ্যমে এটি শুধু কোয়ালা বিয়ার এবং মোটরসাইকেলের মতো পৃথক বস্তুই বোঝে না; বরং বস্তুর মধ্যকার সম্পর্কও বুঝতে পারে। আপনি যখন ডাল-ইকে একটি মোটরসাইকেল চালানো কোয়ালা ভালুকের একটি চিত্রের জন্য বলবেন, তখন এটি জানে যে কীভাবে এটি বা এর পারিপার্শ্বিকতা তৈরি করতে হয়, অন্য বস্তুগুলো কীভাবে এ কাজের সঙ্গে সম্পর্কযুক্ত।

'জেনারেটিভ এআই'র যুগে পা রাখতে হইচই পড়ে গেছে প্রযুক্তি বিনিয়োগকারীদের মধ্যে। ইমেজ জেনারেটর সফটওয়্যারগুলোর দক্ষতা ছবি তৈরির মধ্যে সীমাবদ্ধ নেই; এখন ছবির পাশাপাশি তৈরি করা যাচ্ছে চমৎকার সব ভিডিও। নিত্যনতুন সৃজনশীলতা নিয়ে রীতিমতো চমক দিয়েই চলেছে এআই সফটওয়্যারগুলো।

১৯৯০ সাল থেকে কৃত্রিম বুদ্ধিমত্তা নিয়ে গবেষণার তোড়জোড় শুরু। ১৯৯৭ সালে দাবা খেলায় বিশ্বচ্যাম্পিয়নকে হারিয়ে দিয়ে আইবিএমের ডিপ ব্লু সুপারকম্পিউটার একসময় খুব হইচই ফেলে দিয়েছিল। সম্প্রতি মৌলিক কিছু, বিশেষ করে সৃজনশীল কিছু তৈরি করে এআইয়ের দক্ষতা যেন নতুন মাত্রা পেয়েছে। এআই ইমেজ জেনারেটরগুলো কোনো লেখার বর্ণনার ওপর ভিত্তি করে সহজেই ছবি বানিয়ে দিতে পারে। শুধু তা-ই নয়, এআই স্পিচ-জেনারেশনেও (কথোপকথন তৈরি) এসেছে অভূতপূর্ব অগ্রগতি। জিপিটি-থ্রি নামক ল্যাঙ্গুয়েজ মডেল সাবলীলতার অনেক শীর্ষে পৌঁছে গেছে।

শুধু ডাল-ই ২ না, এ তালিকায় আরও আছে মিডজার্নি, নাইটক্যাফে এআই, স্টেবল ডিফিউশন ইত্যাদি নানা সফটওয়্যার, যা সেকেন্ডের মধ্যেই চাহিদা অনুযায়ী, যে কোনো থিমের ছবি তৈরি করতে পারে। এতে মানুষের সৃজনশীলতা কমে যাবে বলে মনে করছেন অনেকে। এসব নেতিবাচক ধারণাকে ভিত্তিহীন মনে করছেন কেউ কেউ।

মানুষের কর্মসংস্থানকেও অনিশ্চয়তায় ফেলছে কৃত্রিম বুদ্ধিমত্তা। ধারণা করা হয়, এটি আরও উন্নত হলে এবং এর ব্যবহারের ব্যাপক প্রসার হলে অধিকাংশ মানুষের কাজ নিয়ে নেবে বিজ্ঞানের এ আবিস্কারটি। কৃত্রিম বুদ্ধিমত্তাসম্পন্ন যন্ত্র চারপাশের পরিবেশ থেকে স্বয়ংক্রিয়ভাবে শিখতে পারে। ফলে অনেক সময় এ যন্ত্রগুলো আগ্রাসী হয়ে উঠতে পারে। বিখ্যাত পদার্থবিজ্ঞানী স্টিফেন হকিং কৃত্রিম বুদ্ধিমত্তা নিয়ে বহুদিন আগেই সতর্কবার্তা দিয়ে গেছেন।

এআইকে সৃজনশীলতার কৃতিত্ব দেওয়া যায় কিনা- বিষয়টি বেশ বিতর্কিত। অক্সফোর্ড বিশ্ববিদ্যালয়ের গণিতবিদ মার্কুস ডু সটি মনে করেন, 'ডাল-ইসহ অন্যান্য ইমেজ জেনারেটর সম্ভবত এক প্রকার সম্মিলিত সৃজনশীলতার কাছাকাছি আসতে পারে। কারণ, লাখ লাখ ডাটাসেটের ধরন অনুসরণ করে নতুন ছবি তৈরি করতেই এ টুলগুলোর অ্যালগরিদম বানানো।' তবে লন্ডনভিত্তিক কনসেপচুয়াল ডিজিটাল আর্টিস্ট অ্যানা রিডালার বলেন, 'এআই কনসেপ্ট বা ধারণা ব্যবহার করতে পারে না। সময়, স্মৃতি, চিন্তা, আবেগ- এসব কিছুর মিশ্রণ মানুষের অনন্য দক্ষতা, যা এআইয়ের কাজ থেকে তাদের কাজকে আলাদা করে; নিছক দেখতে সুন্দর এমন কিছু নয়, মানুষের এসব বৈশিষ্ট্যই সত্যিকারের চিত্রশিল্প তৈরি করে।'

আরও পড়ুন

×