Компанія Nvidia у понеділок представила новий набір світових моделей штучного інтелекту, бібліотек та інфраструктури для розробників робототехніки, серед яких особливо виділяється Cosmos Reason — мовна модель з 7 мільярдами параметрів, що забезпечує «логічне» бачення для фізичних AI-додатків та роботів.
До вже існуючих моделей Cosmos приєднуються Cosmos Transfer-2, що прискорює генерацію синтетичних даних із 3D-сцен або просторових контрольних сигналів, а також зосереджена версія Cosmos Transfer, оптимізована для швидкості.
Під час оголошення на конференції SIGGRAPH, Nvidia зазначила, що ці моделі призначені для створення синтетичних наборів даних тексту, зображень і відео для навчання роботів і агентів штучного інтелекту.
Cosmos Reason, за словами представників Nvidia, дозволяє роботам і агентам AI «міркувати» завдяки розумінню пам’яті та фізики, що дозволяє використовувати його як модель планування для передбачення наступних дій тілесного агента. Компанія стверджує, що його можна застосовувати для кураторства даних, планування роботи роботів і аналітики відео.
Крім того, було представлені нові бібліотеки нейронної реконструкції, зокрема одна з технологій рендеринга, яка дозволяє розробникам моделювати реальний світ у 3D, використовуючи дані з сенсорів. Цей рендеринговий функціонал також буде інтегрований в популярну платформу для розробників CARLA. Також представлено оновлення програмного комплексу Omniverse для розробників.
Було анонсовано нові сервери для робототехнічних робочих процесів. Сервер Nvidia RTX Pro Blackwell пропонує єдину архітектуру для завдань, пов’язаних з розробкою роботів, тоді як Nvidia DGX Cloud є платформою управління на базі хмари.
Ці оголошення сталися на фоні подальшого розвитку компанії Nvidia в галузі робототехніки, оскільки вона шукає нові можливості застосування своїх графічних процесорів для штучного інтелекту, окрім AI-центрів даних.