021-22222711 info@pdnco.ir

انقلاب تکنولوژی جدید سامسونگ با به سخن آوردن تصاویر

این تحقیق مفاهیم ضمنی تکان‌دهنده‌ای دارد. به کمک این ابزار، تنها یک عکس از یک فرد (که امروزه به آسانی برای بیشتر افراد قابل دستیابی هستند) برای خلق ویدئویی از وی در حال حرف زدن نیازی خواهد بود.

شرکت پایانه های داده ای نوین - خدمات انفورماتیک، سخت افزار و نرم افزار | انقلاب تکنولوژی جدید سامسونگ با به سخن آوردن تصاویر

 پیشرفت روز افزون تکنولوژی تشخیص واقعیت از رویا را بسیار مشکل کرده است.به طوری که مرز باریکی بین واقعیت و رویا بسایر مشکل شده است.فناوری سامسونگ در حال تحقیق بر روی شبکه‌ی عصبی است که به کمک آن می‌توان یک تصویر ساکن را به یک ویدئوی قانع کننده‌ی نزدیک به واقعیت تبدیل کرد.

 در گزارش بدست آمده از وبسایت Motherboard شبکه همگشتی عمیق بر روی ویدئو های زیادی که سر افراد را نشان می‌دهدکه فراهمسازی امکان شناسایی برخی ویژگی‌های چهره و استفاده از آن برای پویانمایی یک تصویر را در معرض نمایش می‌گذارد.این تکنولوژی که در مرکز هوش مصنوعی سامسونگ در مسکو مورد بررسی قرار گرفته است در مقاله‌ای با عنوان یادگیری مخالف چند تصویره مدل های عصبی واقع گرایانه سر در حال حرف زدن مورد بررسی قرار گرفته است.
در ابتدا شاید تصاویر ارائه شده در این پروژه با ویدئو‌های جعلی مشابه عالی نباشد ولی خلق آن نیازمند تعداد زیادی تصویر از شخصی است که تصمیم دارید پویانمایی کنید.
مزیت مهم این پروژه سامسونگ در تبدیل یک تصویر ساکن به ویدئو است که با افزایش تعداد تصویر از سوژه مورد نظر باور پذیری آن بیشتر می‌شود.


 


شما می‌توانید برخی از نتایج این تحقیق را در ویدئوی زیر ببینید. این هوش مصنوعی، با استفاده از تنها یک تصویر ساکن از فیدور داستایوفسکی، سالوادور دالی، آلبرت انیشتین، مریلین مونرو و حتی مونا لیزا، قادر به خلق ویدئوهایی از آنها خواهد بود که در حال حرف زدن هستند و – در برخی از لحظات – به اندازه کافی برای اینکه یک فیلم واقعی باشند واقعگرایانه هستند.

البته ویدئوهای ساخته شده از تصاویر بهقدر کافی خوب نیستند تا یک کارشناس یا فردی که ا دقت آن ها را مورد بررسی قرار دهد فریب دهند ولی نتایج قبلی در تحقیقات مربوط به تصویربرداری تولید شده بر مبنای AI به ما نشان داد، مشکلات وسیع در این حوزه ظرف چند سال قابل بهبود است.
به کمک ابزار ارائه شده در این پروژه می‌توان یک عکس از یک فرد که به آسانی قابل دستیابی است برای خلق ویدئو از صحبت کردن او استفاده کرد.همچنین با استفاده از تکه های کوتاه از یک متریال صوتی نمونه صدای متقاعد کننده ولی جعلی از یک فرد تولید کرد و ابزار دیگری که امکان ایجاد هر جور حرفی با صدای فرد مورد نظر را امکان پذیر می‌کند مکمل این پروژه هستند. و با ابزارهایی مانند GAN، محصول شرکت Nvidia، حتی می‌توان یک مجموعه جعلی ولی ظاهرا واقعی برای چنان ویدئویی خلق کند. 
با کشف عرصه‌های تازه فناوری پردازش تصاویر و هوش مصنوعی انتظار می‌رود ابزارهایی برای تشخیص کلیپ واقعی از جعلی نیز پا به عرصه بگذارند و موجب شگفتی گردند.

 

منبع:ایتنا

 



مطالب مرتبط