Black Forest Labs і NVIDIA презентували вдосконалений AI-модель для генерації зображень

0

Зображення зеленої енергетичної установки в Україні на фоні мальовничого пейзажу.

Black Forest Labs, один з провідних світових центрів дослідження штучного інтелекту, спільно з NVIDIA представили нову модель FLUX.1 Kontext для генерації зображень, яка спрощує процес створення та редагування візуального контенту. Модель об’єднує можливості генерації і редагування зображень з використанням природної мови.

Сучасні AI-художники часто використовують комбіновані моделі та ControlNets для керування виходами генераторів зображень. У FLUX.1 Kontext ці процеси зведені до єдиної моделі, яка може працювати як з текстовими, так і з візуальними підказками, пропонуючи інтуїтивний підхід до редагування. Завдяки цьому користувачі можуть легко керувати еволюцією зображень, починаючи з референтного зображення, і корегуючи їх за допомогою простих текстових інструкцій.

NVIDIA співпрацювала з Black Forest Labs для оптимізації моделі FLUX.1 Kontext під архітектуру їхніх RTX-відеокарт, використовуючи TensorRT для більш швидкої обробки з меншими вимогами до відеопам’яті (VRAM). Це поліпшення дозволяє творцям і розробникам швидше і простіше редагувати зображення на їхніх комп’ютерах з RTX.

FLUX.1 Kontext має відкриту архітектуру для генеративного редагування, яка, зокрема, включає функціональність ControlNet для структурованого візуального підказування. Окрім цього, модель охоплює можливості збереження консистенції стилю та локальних налаштувань зображень.

Оптимізації TensorRT дозволяють зменшити розмір моделі шляхом квантизації з 24GB до 12GB для FP8 і 7GB для FP4, що робить її більш доступною для користувачів з обмеженими ресурсами.

FLUX.1 Kontext [dev] доступна через платформи Hugging Face та ComfyUI, а також буде інтегрована в мікросервіси NVIDIA NIM в серпні. Цей крок робить її більш доступною для AI-ентузіастів, які можуть завантажити варіанти Torch і використовувати їх для тестування.

Ілюстрація до новини про науковий прорив у галузі штучного інтелекту.

Наразі NVIDIA також працює над зразковим кодом для легкої інтеграції TensorRT в робочі процеси. У липні очікується запуск сховища DemoDiffusion.

Окрім відповідних новинок у сфері AI-моделей, NVIDIA повідомила про інші ініціативи та продукти. Google, наприклад, анонсувала нову мультимодальну мовну модель Gemma 3n, оптимізовану для роботи на NVIDIA GeForce RTX GPUs та платформі Jetson для прикладних та роботизованих систем.

Ілюстрація основних моментів статті 'article 002'.

Нагадаємо, що NVIDIA спільно з партнерами проводить івенти для розробників і акції, спрямовані на інтеграцію AI у різні галузі.

Зображення учасників конференції, присвяченої модернізації транспортної інфраструктури в Україні.

Ця низка заходів і новинок підкреслює розвиток технологічних ініціатив, які стають доступнішими завдяки співпраці між провідними технологічними компаніями, такими як NVIDIA і Black Forest Labs.

Ілюстрація з новини про останні досягнення в медицині.

Зображення демонструє ключовий момент з останніх подій, про які йдеться у статті 'article 002'.

Фотографія з конференції, присвяченої обговоренню змін клімату.

Фотографія ілюструє незабутні моменти з культурного фестивалю у Львові.

Leave a Reply

Your email address will not be published. Required fields are marked *