Black Forest Labs і NVIDIA презентували вдосконалений AI-модель для генерації зображень
Black Forest Labs, один з провідних світових центрів дослідження штучного інтелекту, спільно з NVIDIA представили нову модель FLUX.1 Kontext для генерації зображень, яка спрощує процес створення та редагування візуального контенту. Модель об’єднує можливості генерації і редагування зображень з використанням природної мови.
Сучасні AI-художники часто використовують комбіновані моделі та ControlNets для керування виходами генераторів зображень. У FLUX.1 Kontext ці процеси зведені до єдиної моделі, яка може працювати як з текстовими, так і з візуальними підказками, пропонуючи інтуїтивний підхід до редагування. Завдяки цьому користувачі можуть легко керувати еволюцією зображень, починаючи з референтного зображення, і корегуючи їх за допомогою простих текстових інструкцій.
NVIDIA співпрацювала з Black Forest Labs для оптимізації моделі FLUX.1 Kontext під архітектуру їхніх RTX-відеокарт, використовуючи TensorRT для більш швидкої обробки з меншими вимогами до відеопам’яті (VRAM). Це поліпшення дозволяє творцям і розробникам швидше і простіше редагувати зображення на їхніх комп’ютерах з RTX.
FLUX.1 Kontext має відкриту архітектуру для генеративного редагування, яка, зокрема, включає функціональність ControlNet для структурованого візуального підказування. Окрім цього, модель охоплює можливості збереження консистенції стилю та локальних налаштувань зображень.
Оптимізації TensorRT дозволяють зменшити розмір моделі шляхом квантизації з 24GB до 12GB для FP8 і 7GB для FP4, що робить її більш доступною для користувачів з обмеженими ресурсами.
FLUX.1 Kontext [dev] доступна через платформи Hugging Face та ComfyUI, а також буде інтегрована в мікросервіси NVIDIA NIM в серпні. Цей крок робить її більш доступною для AI-ентузіастів, які можуть завантажити варіанти Torch і використовувати їх для тестування.
Наразі NVIDIA також працює над зразковим кодом для легкої інтеграції TensorRT в робочі процеси. У липні очікується запуск сховища DemoDiffusion.
Окрім відповідних новинок у сфері AI-моделей, NVIDIA повідомила про інші ініціативи та продукти. Google, наприклад, анонсувала нову мультимодальну мовну модель Gemma 3n, оптимізовану для роботи на NVIDIA GeForce RTX GPUs та платформі Jetson для прикладних та роботизованих систем.
Нагадаємо, що NVIDIA спільно з партнерами проводить івенти для розробників і акції, спрямовані на інтеграцію AI у різні галузі.
Ця низка заходів і новинок підкреслює розвиток технологічних ініціатив, які стають доступнішими завдяки співпраці між провідними технологічними компаніями, такими як NVIDIA і Black Forest Labs.