FLUX - это тупик
Углубимся в историю, друзья. Давным давно, когда тренировали модель SD 1.1, датасет заложенный в основе содержал 2 миллиарда (КАРЛ!) + 170 миллионов картинок с текстовыми описаниями. Словарь Даля содержит около 200 тыс. слов. для ориентировочного сопоставления. Картинки, предназначавшиеся для 1.1 были низкого разрешения, но некоторые были даже 1024x1024 (видимо подвергшиеся даунскейлу в последствии). LAION не собирал изображения вручную. Вместо этого они использовали автоматизированные методы для индексации и фильтрации общедоступных изображений из интернета. Для того чтобы пофиксить абсолютно мусорный датасет и обеспечить приличные картинки, была использована как пример система оценок работ на artstation. Датасет автоматически "индексировал" картинки с высокими оценками. Но этого было недостаточно, и как вы помните, SD всегда отставал от конкурентов по эстетике. Позже азиатские художники прознали о сотрудничестве арт-ресурсов с AI-компаниями и просто пнули автаматов. К создателям таких сервисов начались юридические претензии и возможности по сбору датасетов сильно подсократились и осложнились. Кризис визуального датасета дошел до позорного случая со статьей и тупого мычания от Эмада Мостака, когда он в очередной раз строил оправдания в твиттерах. Это было первое препятствие, второе препятствие заключается в том, что для современных моделей нельзя замутить датасет на 2 миллиарда картинок. Потому что картинки нужны не в разрешении 256x256, а выше чем 1024x1024. Это препятствие срезает возможности так как лишает чуваков в невозможность поменять их возможности. Комьюнити в этом случае бесполезно, Illuminati Diffusion не будет. То есть, в высоком разрешении собирать больше 700 млн скриншотов и этюдов-футажей. Того разнообразия моделей, которое вы видели на SD 1.5 уже давно нет и не предвидится.
ИСТОЧНИК: https://t.me/turbinskiy_art
Углубимся в историю, друзья. Давным давно, когда тренировали модель SD 1.1, датасет заложенный в основе содержал 2 миллиарда (КАРЛ!) + 170 миллионов картинок с текстовыми описаниями. Словарь Даля содержит около 200 тыс. слов. для ориентировочного сопоставления. Картинки, предназначавшиеся для 1.1 были низкого разрешения, но некоторые были даже 1024x1024 (видимо подвергшиеся даунскейлу в последствии). LAION не собирал изображения вручную. Вместо этого они использовали автоматизированные методы для индексации и фильтрации общедоступных изображений из интернета. Для того чтобы пофиксить абсолютно мусорный датасет и обеспечить приличные картинки, была использована как пример система оценок работ на artstation. Датасет автоматически "индексировал" картинки с высокими оценками. Но этого было недостаточно, и как вы помните, SD всегда отставал от конкурентов по эстетике. Позже азиатские художники прознали о сотрудничестве арт-ресурсов с AI-компаниями и просто пнули автаматов. К создателям таких сервисов начались юридические претензии и возможности по сбору датасетов сильно подсократились и осложнились. Кризис визуального датасета дошел до позорного случая со статьей и тупого мычания от Эмада Мостака, когда он в очередной раз строил оправдания в твиттерах. Это было первое препятствие, второе препятствие заключается в том, что для современных моделей нельзя замутить датасет на 2 миллиарда картинок. Потому что картинки нужны не в разрешении 256x256, а выше чем 1024x1024. Это препятствие срезает возможности так как лишает чуваков в невозможность поменять их возможности. Комьюнити в этом случае бесполезно, Illuminati Diffusion не будет. То есть, в высоком разрешении собирать больше 700 млн скриншотов и этюдов-футажей. Того разнообразия моделей, которое вы видели на SD 1.5 уже давно нет и не предвидится.
ИСТОЧНИК: https://t.me/turbinskiy_art