![অডিও থেকে হুবহু কণ্ঠস্বর নকল করে এআই মডেল ‘ভয়েস ইঞ্জিন’](uploads/2024/03/31/1711860450.a.jpg)
যুক্তরাষ্ট্রের কৃত্রিম বুদ্ধিমত্তা (এআই) নির্ভর প্রযুক্তি নির্মাতা প্রতিষ্ঠান ওপেনএআই হুবহু কণ্ঠস্বর নকল করতে পারে- এমন একটি এআই মডেল তৈরি করেছে। এই এআই মডেলের নাম ‘ভয়েস ইঞ্জিন’। মাত্র ১৫ সেকেন্ডের অডিও নমুনা বিশ্লেষণ করে যেকোনো ব্যক্তির কণ্ঠস্বর অনুকরণ করতে পারে এই এআই টুল, যা শুনতে মানুষের আবেগপূর্ণ ও সত্যিকারের কণ্ঠস্বরের মতো মনে হয়। গত শুক্রবার প্রতিষ্ঠানটির এক ব্লগ পোস্টে এমনটাই দাবি করা হয়েছে।
ওপেনএআই ২০২২ সালের শেষদিকে ভয়েস ইঞ্জিন তৈরি করে। এই মডেল প্রতিষ্ঠানটির টেক্সট-টু-স্পিচ এপিআইয়ের ওপর ভিত্তি করে তৈরি করা হয়েছে। বর্তমানে এই টেক্সট-টু-স্পিচ এপিআইয়ের সম্প্রসারণ করেছে। এই ভয়েস ইঞ্জিনের টেক্সট-টু-স্পিচ এপিআইয়ের মাধ্যমে চ্যাটজিপিটি প্ল্যাটফর্মে ভয়েস ও রিড অ্যালাউড ফিচারে ব্যবহার করা হয়েছে।
প্রতিষ্ঠানটি জানিয়েছে, কৃত্রিম কণ্ঠস্বরের অপব্যবহারের সম্ভাবনার কারণে এটির ব্যাপকভাবে ব্যবহারের জন্য সতর্কতামূলক পদক্ষেপ গ্রহণ করছে। এর অংশ হিসেবে প্রতিষ্ঠানটি প্রযুক্তিসংশ্লিষ্টদের সঙ্গে এ বিষয়ে একটি সংলাপ শুরু করার আশা করছে। যেখানে এই মডেলের মাধ্যমে কৃত্রিম কণ্ঠস্বরকে যেন খারাপ কাজে ব্যবহার না করা হয় এবং নতুন এই প্রযুক্তি সমাজের সঙ্গে খাপ খাওয়ানো যায়, সে বিষয়ে আলোচনা করা হবে। এখান থেকে প্রাপ্ত তথ্য, পরামর্শ এবং এই প্রযুক্তির ছোট আকারের পরীক্ষার ফলাফলের ওপর ভিত্তি করে এটি ব্যাপকভাবে চালু করা উচিত কি না বা কীভাবে করা উচিত, সে সম্পর্কে সিদ্ধান্ত নেবে। ওপেনএআই বলেছে, এই মডেল পড়ার সহায়তা, ভাষা অনুবাদ ও হঠাৎ কথা বলার সক্ষমতা ক্ষতিগ্রস্ত বা হারিয়ে ফেলেছেন এমন ব্যক্তিদের সহায়তায় ব্যবহার উপযোগী হবে। প্রতিষ্ঠানটি ব্রাউন বিশ্ববিদ্যালয়ে পরীক্ষামূলক প্রোগ্রামে স্কুল প্রকল্পের জন্য রেকর্ড করা অডিও থেকে ভয়েস ইঞ্জিন ক্লোন তৈরি করে, বাকপ্রতিবন্ধকতার সমস্যায় আক্রান্ত রোগীকে সাহায্য করেছে।
জাহ্নবী