Professional Documents
Culture Documents
Weekly Digest 3
Weekly Digest 3
17 მარტი, 2024
N3
ამ ეტაპზე, Figure 01-ს ორ ფეხზე სიარული, ხელების გამოყენებით საგნების დაჭერა და გადაადგილება, და უფრო მეტიც
ადამიანებთან რეალურ დროში საუბარი შეუძლია. მისი სიჩქარე ადამიანის მიერ იმავე დავალების შესრულების სიჩქარის 16,7%-ს
შეადგენს.
AI რობოტების გამოშვება 2024 წელს იგეგმება. მართალია, ჯერ AI ისე დახვეწილი არ არის, რომ ადამიანის ინტელექტის
შესაძლებლობებს შეესაბამებოსდეს, თუმცა ეს მოდელი მნიშვნელოვანი ცვლილებების პირველი ეტაპია. ნახეთ მეტი
Invideo AI ტექსტური აღწერის მიხედვით ვიდეოს გენერირებისთვის განკუთვნილი მოდელია, რომლითაც შესაძლებელია
ნებისმიერი იდეის საფუძველზე ვიდეოს გენერირება. მოდელს აქვს უფასო და ფასიანი ვერსიები. Invideo AI-ში
შესაძლებელია პერსონაჟების, ხმის და ტექსტის, მუსიკის, სტილის და დეტალების შერჩევა. ნახეთ მეტი
AI ვიდეო გენერატორის მოდელები იყენებენ ორ ძირითად ინსტრუმენტს: კონვოლუციურ ნეირონულ ქსელებს (CNN) და
რეკურენტულ ნეირონულ ქსელებს (RNN). CNN-ებს აქვთ სურათებისა და ვიდეოების კარგი “ცოდნა” - მათ შეუძლიათ
ობიექტების, მახასიათებლების და სტილის ამოცნობა. RNN-ებს კი შეუძლიათ მოვლენების თანმიმდევრობის გაგება
დაახლოებით ისე, როგორც ჩვენ ვაკავშირებთ ამბებს და ეპიზოდებს მოთხრობის კითხვისას.
დავუშვათ, მომხმარებელს უნდა ვიდეო შემდეგი აღწერით „ფუმფულა კატა მისდევს თაგვს სამზარეულოში“. RNN
ნაწილებად შლის წინადადებაში აღწერილ მოქმედებებს და იგებს მათ თანმიმდევრობას. პარალელურად კი CNN
იყენებს კატების, თაგვებისა და სამზარეულოს შესახებ მის ვიზუალურ ცოდნას და ქმნის სურათებს, რეალურად კი
ვიდეოს კადრებს. შემდეგ მოდელი თანმიმდევრულად ალაგებს ამ კადრებს RNN-ების მიერ გაანილზებული
მოქმედებების თანმიმდევრობის მიხედვით. შედეგად კი მომხმარებელი იღებს ვიდეოს, რაც სხვა არაფერია, თუ არა
ბევრი დაგენერირებული კადრის ანუ სურათის უწყვეტი ერთობლიობა.
დაგეგმილი ღონისძიებები