انویدیا بهتازگی مدل هوش مصنوعی جدیدی به نام Fugatto را معرفی کرده است که میتواند دستورات متنی کاربران را به صدا تبدیل یا با استفاده از این دستورها، فایلهای صوتی را ویرایش کند.
انویدیا پادشاه مطلق بازار تراشههای هوش مصنوعی است، اما این شرکت در زمینه ساخت مدلهای نرمافزاری هوش مصنوعی نیز ازجمله پیشگامان محسوب میشود. جدیدترین مدل هوش مصنوعی معرفی شده توسط انویدیا که این شرکت آن را «چاقوی سوئیسی برای صدا» توصیف میکند، میتواند ابزاری بسیار کاربردی برای تولیدکنندگان محتواهای ویدیویی باشد.
به گفته انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا بهاختصار Fugatto میتواند دستوراتش را بهصورت متنی از کاربران دریافت کرده و منطبق با این دستورات، فایلهای صوتی بسازد. کاربران همچنین میتوانند از Fugatto برای ویرایش فایلهای صوتی ازپیشساخته شده نیز استفاده کنند.
این مدل هوش مصنوعی توسط تیمی از متخصصان این حوزه در سراسر جهان ساخته شده. همچنین انویدیا میگوید که این موضوع باعث قویتر شدن قابلیتهای چندزبانی و چندلهجهای Fugatto شده است.
«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراینباره میگوید قصد آنها ساخت مدلی بوده که صدا را مانند انسانها درک و تولید کند. انویدیا برخی از سناریوهای احتمالی برای استفاده از این مدل در دنیای واقعی را فهرست کرده که Fugatto میتواند برای آنها کاربردی باشد.
برای مثال، تولیدکنندگان موسیقی میتوانند از این مدل هوش مصنوعی برای تولید نمونههای اولیه یک آهنگ استفاده کرده و سپس بهراحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و توسعهدهندگان بازیهای ویدیویی نیز میتوانند نهایت استفاده را از قابلیتهای مدل Fugatto ببرند. البته Fugatto هنوز بهصورت عمومی در دسترس کاربران قرار ندارد، و انویدیا نیز نگفته که چه زمانی دسترسی عمومی به آن فراهم میشود.
شرکتهای متا و گوگل نیز پیشازاین مدلهای هوش مصنوعی مشابهی را معرفی کرده بودند که میتوانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران میتوانند از طریق وبسایت AI Test Kitchen به آن دسترسی داشته باشند.