Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1324284 >полный развал контекста На рекламно-агитационном материале нет ни одного поворота лица. Так что фотореалистичного character consistency можно не ждать. Инпейнт шляпы - вообще шляпа. А стилизации прикольные, видно что местами поумнее контекста.
>>1324373 Это мистер кококомпозиция, он на своей волне. У него композиция означает что-то свое, только ему известное. Он еще с сд2.1 называл хорошей композицей мыльный клосап бабы с шарп фокусом на трех разных расстояниях. Одному богу известно, что он тут под композицией имеет в виду.
>>1324415 > грейн - фу бяка, не реалистично > расплывшийся шакал, артефакт артефактом прогоняет - вооо, риализм По какому принципу ты определяешь реализм? Что у тебя вышло, то и реализм?
>>1324516 > На СДХЛ прогресс остановился напомнило шизика, который год носился с кривой базовой сдхл и рассказывал, как прогресс 1.5 остановился, а когда только начали появляться более-менее вменяемые тюны сдхл и все начали на них переходить, он внезапно решил, что сдхл - деград. что же будет еще через год, когда тюны флюкса/квена наконец допилят до юзабельных?
>>1324640 Это значит, что любое частное лицо и компания может спокойно делать деньги без отчехления или какого-либо упоминания авторов модели. Тебе дали опенсурсный инструмент, делай с ним что хочешь - те, кто тебе его дал ничего не будут спрашивать в замен.
Фактическим этим мувом они убили Black Forest Labs с их Флюхой. Им теперь остается либо сделать новую коммерчески залоченную модель лучше чем qwen, либо уйти в закат.
>>1324529 >в отсутствие правильной светотени или это у тебя руки кривые? Ван не умеет в тени, это не новость
>>1324568 >что же будет еще через год, когда тюны флюкса/квена наконец допилят до юзабельных? Лол, я на 1.5 генерил реалистичные фото, особенно с контролнетами, а теперь мне нужно год ждать тюнов, что бы запилить что-то отдаленно похожее на реальное фото
>>1324855 юзай на 1 шаг какой-нибудь маня-мешной моделью, потом в добивку на остальные 9 свою реалистик, всерху и сниху сразу появится место и нормальная поза, не будет ни обрезанной головы, ни обрезанных ног.
>>1324818 >вижу только пластиковое квеноговно уровня прошлогоднего флукса Ты уверен? Зацени текстуры которые есть в модели Wan2.2. Зацензурил так как всё равно в центре только провал, хотя очень реалистичный. The image is a photograph depicting a close-up of a woman's genital area, focusing on her vulva. She has light skin with a visible tan line and some body hair on her pubic region. Her labia minora and majora are clearly visible. A yellow and blue syringe, which appears to be partially filled, is being held by someone with their hand slightly out of frame, and the needle is inserted into her vagina. The angle of the photo is slightly from above, capturing her pelvis and upper thighs in detail. The lighting highlights the texture of her skin and the contours of her body. There is no other visible content or context outside of this intimate and explicit scene. The overall tone of the photograph is clinical yet personal due to the close-up nature and the insertion of medical equipment.
>>1324867 > столько мыла сверху Побочный эффект от самопальной CA. Каналы расходятся. То, что было одним пикселем на краях растягивается на ~3 по разным каналам, по другому и быть не может.
Ньюфажный вопрос. Есть уникальный персонаж и некоторое количество изображений с ним (~15, можно получить еще но будут похожи на те что уже есть) как сделать лору с ним? От количества настроек onetrainer я охуел. Попробовал shakkerai, получилось не очень, видимо недообучилось (10 repeat, 9 epoch) И почему в гайдах пишут что надо 50 картинок в охуительном качестве иначе будет говно, но всяким ботам в телеге и прочим сайтам которые лепят твое ебло на супермена хватает полторы фотки в шакальном качестве?
И как генерить глаза хотя бы как на 4 пике в оп посте? В большинстве случаев получается как будто наложили кучу всратых фильтров, примерно как тут >>1324733>>1324700
>>1324596 не оч понятно, хорошо это или нет. Если подавал карту глубины, то всё пошло по пизде, а если просто картинку как пример и хотел вариации, то тож немного по пизде из-за перспективы
Qwen-Image-Edit — новый инструмент для умного редактирования картинок от Qwen
Теперь можно не только генерировать изображения, но и редактировать их по команде: менять объекты, стиль, фон или даже текст прямо на картинке.
Что умеет: - ✨ Редактировать смысл и детали — можно, например, повернуть объект, сменить цвет или стиль, не трогая остальное. - 🔤 Менять текст на картинках — добавлять, убирать или редактировать надписи на китайском и английском, при этом сохраняются шрифт и стиль. - 🏆 Лучшие результаты на тестах — модель показывает топ-уровень среди открытых решений.
Как работает: Система сочетает понимание картинки (VL-модель) и точное управление структурой (VAE-кодировщик). Поэтому картинка сохраняет и смысл, и детали после правок.
Как попробовать: Достаточно открыть Qwen Chat и выбрать режим Image Editing.
>>1325313 >Qwen-Image-Edit охуенно. попробовал уже бесплатно на huggingface spaces, промпту следует сразу, не ломается через раз как контекст. всратую фотку с нулевых годов сильно улучшил. правда немного замыливает, настроек мало на HF. осталось дождаться ггуфов и воркфлоу, для полного контроля.
>>1325559 Ебало вот этого представили? Нет, раз такие требования предъявляют в треде, где месяц назад всё было засрано пластиковой анимереалистик 1вуман или просто шизой, то мы растём чересчур быстро. Это хрома. >>1324415 Как так охуенно сгенерить? Сохрани воркфлоу в webp.
>>1325568 > месяц назад всё было засрано пластиковой анимереалистик А теперь будешь засирать реализмом уровня 1.5 с контролёром и апскейлом голой моделью без денойза в экстрас автоматика?
>>1325583 > у тебя бомжа на калькулятора запускается и коупить не нужно Но ведь для 1.5 генерации и апскейла суперскейлом (или че там тогда модно было?) достаточно иметь деревянные счеты. Ты в логику совсем не умеешь или ты решил обсуждение качества перевести в бомжесрач, потому что по существу сказать нечего?
>>1325600 > Как раз не 1.5, а хрома так там качество >>1325578 > уровня 1.5 с контролёром и апскейлом голой моделью без денойза в экстрас автоматика тебе так сильно сраку разрывает от дмд, что ты готов любое говно ложкой жрать, лишь бы для его запуска нужна была карта дороже 15к рублей?
>>1325608 Ну вот об этом и говорю. Настолько копиума бахнул, что уже и хрома у него кал, и ван, и квен. Не легче ли признать, что просто ведро не тянет и оправдываешься? Ору блять, секта ебаная.
>>1325611 > копиума бахнул Не проецируй, лучше присмотрись к анатомии на объекте твоего восторга >>1325487 и осознай, что у тебя нулевые навыки понимания того, что пишет между строк твой собеседник (в большинстве случаев между строк ничего нет, даже если тебе очень сильно кажется, что есть).
>>1325624 Так сгенерируй лучше. Ну или газуй нахуй с треда реальные фотки смотреть, лол. Пока я вижу лишь свинью, которая специально выискивает недостатки. При этом сама свинка ничего не постит и продолжает безпруфно хрюкать, мол, прогресс никуда не двигается и мой 1.5 кал сделает также если не лучше.
>>1325634 кроме того, что чел стоит на своих 15см ногах, у бабы одна ягодицах в 2 раза больше другой, губы - свежезамороженное филе курицы, глаза - масляные пятна, кожа - засохший пва, ухо - прифотошопленный пельмень, волосы - кожаные ремни, ну и не стоит забывать про гигантскую бородавку на пальце под кольцом тоже мимо, не бомж
>>1325639 > Так сгенерируй лучше не могу( я вообще на пальцах считаю, т.к. бомж. а почему бы тебе не сгенерировать что-то лучше того кала на своей буратиновой карточке, вместо бескартиночных нахрюков?
>>1325646 Из объективных косяков - текстуры, да. И то корень этой проблемы в агрессивном апскейле NMKD-Siax. Остальное что ты перечисли - хуита из пальца высосанная. Мужик сидит, жопа в порядке.
>>1325313 Потестил в Комфи, ну такое себе. По инструкциям конечно годно, на голову выше контекста. Но мылище. С лайтнингоим от простого квена плохо работает, очень мылит. Без него надо 50 шагов ебашить. Смысл вообще такого.
>>1325487 Кто бы мог подумать, что такой толстенный вброс вызовет больше бурлений, особенно со стороны защитников, чем we-are-doomed, который хотя бы удачно зашакален был. Куда же мы скатились?
>>1325687 Нихуя не понял в какую сторону ты написал. Я, например, сгенерил, что-то похожее получил. Одна из лучших генераций за многие треды тут. Ну, так и очевидно почему, чел кинул же ссылку на чужую генерацию. Причем тут слово вброс?
>>1325611 никакой объём vram не сможет компенсировать твоё рукожопие, если ты даже натвис+дмд не смог осилить. твой удел - вбивать запросы в гугл и листать готовые результаты
>>1325845 Второе это без лор нароллилось? Как оно вообще работает на видеокартах, что по скоростям? Я со своими нищими 16гб даже пытаться не хочу, нунчаку до сих пор пилят под комфи.
ai-toolkit обновился с поддержкой ван 2.2, каких-то преимуществ в точности обучения, в сравнении с musubi-tuner не заметил. обидное. лоры обученные на ван 2.1 кажутся точнее в передаче черт
>>1325611 > что уже и хрома у него кал, и ван, и квен вообще-то нет. использую и хрому и квен, ван не пробовал, но ничего против не имею. кал - это тот кривой высер, от которого ты обмалафьился и кинулся защищать, попутно хрюкая что-то про секты и паля во все стороны
Еще одна неделя, еще одна модель
Аноним# OP19/08/25 Втр 20:29:44№1326141135
Ебет Flux Kontext во все щели, черный лес лабораторатории могут уже закрываться, после уходя с SD они макс смогли нам дать только одну модель, да и хуй с ними
>>1326141 Я полтора часа пердолился и не смог сделать как у китайцев на пиках. Оно мылит дико, реализма ноль. Ну собственно как у Контекста было. Про кручение предметов тоже не понял, тянку с другого угла чтоб получить надо выебнуться знатно, а не просто как они типа 3 слова пишут.
>>1326232 да не, просто у меня тут разрешение меньше, делался даунскейл nearest exact, хотя оригинал по всей видимости тоже был сделан на базовом qwen image.
Почему-то на Qwen Image могу генерить 1328x1328, но на Qwen Edit не тянет с 1.76 мегапикселя. Придется ждать нунчаку
В принципе у Qwen почти нет лимитов по разрешению, вплоть до 4k, поэтому это не совсем то, что можно считать ограничением модели.
>>1326238 Поздравляю! Тред ещё далек от завершения, но вы уже уверенный претендент на первое место в конкурсе на самую омерзительную генерацию! Так держать!
>>1326141 > QuantStack Опаньки, а у них и дистиллированный гуф есть там. >>1326232 > не осилили так же как чёрнолабые А это вообще возможно перевести в латент и обратно без потерь? Масштабирование тут не причем. Единственный вариант вырезать редактированный кусок и вставлять в оригинал, ящитаю.
>>1326269 > неактуал после релиза лоры Я её попробовал, а с ней NAG у меня не работает. А сейчас проверил, он вообще перестал работать с qwen, может после больших апдейтов в комфи, а может из-за изменений параметров запуска. И вообще, че-то она мне не очень зашла. 1 - дистил, 10 шагов. 2 - обычный с 8step лорой, 8 шагов (хуй знает, кто на пике). 3 - обычный с 4step-bf16 лорой (ну нахуй).
>>1326299 >Новое конфи меню говно полное, какой-то имбецил его дизайнил, нихуя не удобно, ищу способы вернуть Да ладно меню, что за хуйня теперь с линейкой открытых форкфлоу? Или ниже (в две строки) или выше (в две строки) или спрятано в меню, но не там, где ожидаемо(раньше). А где ожидаемо и было раньше, там теперь всегда постое место. Почему UI-дезигнеры такие дегенераты?
>>1326502 Там это простое место сверху очень любят использовать под себя разные плагины которые мониторингом занимаются. Например графики загрузки-температуры GPU выводить. Видимо под них прогнулись. Раньше открытые workflow с ними за него боролись до полной неюзабельности.
>>1326269 Не читал ваш дискас, но видео - тупейшая хуйня. Я гонял контекст для смены стиля, такие смещения это дело сида. Норма - сгенерить много и выбрать лучшее.
Привет, двач, вопрос по ComfyUI. При установке кастом нод через менеджер (и через гит клон в папку кастом нод) выходит такая ошибка (на скринах ComfyUI-VideoHelperSuite и ComfyUI-GGUF). Что пытался: 1. установка зависимостей в .venv через смд 2. Переустановка комфи Ничего из этого не помогло, куда копать? Или подскажи тематический тред, не нашел.
Ггуфо-квантодебилы, скажите, все ебанутые? Ну, писало loaded partially, не помещалось полностью, видимо. Скачал ггуф, начало писать loaded completely. А хули толку? Точность ниже, генерит на СОРОК БЛЯДЬ ПРОЦЕНТОВ дольше. Нахуй всрались эти ггуфы?
>>1326818 >генерит на СОРОК БЛЯДЬ ПРОЦЕНТОВ дольше. Нахуй всрались эти ггуфы? Братан, у меня тоже самое. Может не настолько медленно, но на 10-15% гуфы медленнее. Я уже давно об этом писал, как только флюкс появился. Кучу скринов и тестов предоставил в тред по запросам, но мне никто не поверил в итоге. Ну и хуй с ним как бы.
>>1325845 Тоже этим впечатлился. Офигительно следует промпту, просто написанному на русском, причем практически как попало, без особой оптимизации. FLUX нервно курит в сторонке по этому моменту.
Тыкал пока чисто на пробу, скачал чего поменьше чисто на посмотреть - и даже убитый квант q3km выдает что-то интересное. Качество конечно - убогое мыло, но и то... Если использовать этот квант для создания сцены, а потом по ней проехаться чем-то вроде sdxl, как рефайнером - можно, IMHO, решить основную проблему старых моделей - композиция и основа сцены. Т.к. так детально как qwen, даже через control net под чистым sdxl сцену не сделать. Зато старые модели огромную кучу стилей налорили - выбирай-нехочу. :)
>>1326835 Да верю, например я, верю. У меня то же самое. Просто gguf нужен тем, у кого с vram СОВСЕМ плохо - для самых низких квантов. Ну, или у кого multigpu сетап. Там вроде как через один плагин можно offload делать в vram другой карты а не в обычную ram - но только для gguf.
>>1326835 > но мне никто не поверил в итоге А кто должен был поверить, что у тебя на 10-15% гуфы медленнее? И почему тебе так важно, чтобы люди верили, что у тебя на 10-15% гуфы медленнее? Что произойдет, если кто-нибудь перестанет верить, что у тебя гуфы на 10-15% медленнее?
>>1324255 (OP) Аноны, подскажите лору для Пони, которая делает вот это вот "типичное" китайское овальное лицо. Я пытался искать, но как-то не очень получилось, в лучшем случае в компклекте ещё всякая китайская атрибутика подтягивается, а мне нужно только лицо.
>>1326936 Тебе бы самому погуглить что это такое. Зловещая долина это отсутствие асимметрии в лице, это понятие и мем которые описывают искусственно созданное лицо, причем это всегда относится к таким объектам, которые созданы с помощью формы, штамповки, каких-то точных инструментов. Например штампованное лицо куклы. Античные статуи и написанные портреты этим эффектом не страдают, потому что созданы не точным инструментом, а рукой человека. Нейрослоп тебе при всём желании точную симметрию в лице не сделает, а неестественность, которую ты ошибочно называешь долиной, это либо артефакты т.е. модель создает что-то страшное и несуразное в деталях, либо такая была база обучения и модели, например там было много 3д говна, а модель делает именно то, что от неё хотят.
>>1326141 для тех, кто будет ставить ггуф Qwen Edit, не забудьте поставить вот эту хуйню в папку с текст энкодерами, иначе у вас будет неполноценный Qwen Edit
Еще если вам не нужен негативный промпт на Qwen Edit, то можно не пропускать картинку через второй энкодер на квен эдит и поставить вместо него пустой обычный.
Потестил этот ваш квен, до гопоты ему далеко, промты простые ещё делает, с более сложными уже не справляется. Стили не понимает, известных персонажей знает плохо, детализация бедная, мылит картинку постоянно.
>>1327094 > я хз вообще про него Добавили вместе с поддержкой какой-то модели. Что оно там или в квене должно делать - хуй его знает, но на старых делает примерно то же, что RescaleCFG и DynamicThresholding. 1 - cfg 1, 2 - cfg 3, 3 - cfg 3 + CFGNorm. > остался от ворклоу без лоры на 4 шагов Он сам по себе немного vram поджирает, как и остальные рескейлы, так что лучше не подключать без необходимости.
На 16гб как квен работает? Они с едитом одинаково быстрые? Впадлу почти 30гб говна выкачивать для теста. Но если он почти как kontext, то почему бы не перейти, один хуй на контексте всего 1 интересная лора была.
>>1327190 >На 16гб как квен работает? У меня на 12GB нормально работает в fp8. Скорость примерно как у FLUX. Только на 1920x1080 в oom не валится, а спокойно генерит, примерно 18-20s. на итерацию. Edit еще не пробовал - пока докачивается.
>>1327393 Просто много пластиковых деталей было типо штукатурки и сильного глянца, но получилось немного пофиксить >>1327056 >Прогони через другую модель на реализм. Я так понимаю ван лучший вариант для реализма? Не нюхал его ещё.
>>1327513 >>1327531 Я пытаюсь получить объект в воде, но неронка рисует острова с водоёмами в тёпных странах, деревья, в сторону отдыха итд. Я же вообще не просил ничего такого делать. А свои объекты в воде вообще не получаю.
>>1327540 > неронка рисует острова с водоёмами в тёпных странах, деревья simple background > А свои объекты в воде вообще не получаю А твоя модель вообще может нарисовать этот таинственный объект, если в промпте только он?
Да по мне так файнтюны XL и последующий апскейл очень сильно приблизились к реализму в плане неточных штук (не анатомия, не лица, не надписи и точные фигуры), точнее к художественной фотографии.
Эти генерашки — Pony Realism
тебе точно к ним понадобится какой-нибудь detail enhancer, для апскейла рефайнер лица, может ещё какие-то лоры. Уж точно будет гораааздо реалистичнее чем у тебя.
крупные окурки отдельно по маске перегенерить, потому что они требуют гораздо большего вливания шума.
К слову о квене. Подскажите где взять порезанный вариант, чтобы бомжу с 12ГБ вОЗУ погенерить локально?
Пайплайн для Комфи с Цивитаи сгодится для старта?
Адов ли пиздец будет, если я возьму-таки большую модель и буду её из оперативы гонять? Ориентировочное время для хорошего качества картинки? Минуты? Часы?
>>1327701 > если бы ты сказал - я сделал это в квене - никто бы и не хрюкнул Ты и без этого хрюкнул. А ебальник там дефолтный поневский, чего там путать?
Я вижу, что квен сильно лучше соблюдает запрос и детализацию, а это у меня в приоритете. Реализм/стилизацию потом и обмазать можно. А часто и не нужно, важен замысел. Потому и загорелся.
>>1326807 ну вот смотри, я сгенерил поверх твоей картинки с разным денойзом варианты. А потом тупо стёркой скомбинировал. Нужен, конечно, Face detailer, потому что лица попортило. Ну и с окурками ещё погенерировать.
Но суть ты понял. Годную картинку без ручной коррекции и артдирекшена не получить.
Долго тыкал генерацию изображений на lmarena, чтобы потестить nano-banana и в итоге qwen image edit меня приятно удивил. Лучшее из опенсорса на данный момент, flux опенсорсный однозначно хуже, да даже те модели что только по апи хуже.
>>1327889 Во-первых, оригинал тут >>1327511 поэтому вполне себе даже невероятно что персонаж перенесся без проеба Во-вторых, горизонт не проебан, что для нейронки вообще считается невозможным В-третьих, ноги за партой не переебались почти никак, хотя на SDXL под партой уже не было вообще ног.
Даже не пытайтесь высирать "тесты" или "сравнения" хромы. Один неправильный параметр, не то слово в промпте, не та лора, неправильное cfg и получается хуита. Это говорит только о криворукости пользователя. Лучше показывайте что лучшее получалось и на каких настройках.
>>1328257 Ни разу еще норм не получилось. Хотя установил эти ваши бинго-бонги. Тут действительно, как ты пишешь, чуть что и ппц. Вот пытался играть с шагами и цфг.
>>1326247 >Единственный вариант вырезать редактированный кусок и вставлять в оригинал, ящитаю. Нечто подобное кто-то сделал в своем воркфлоу на реддите.
Подозреваю что можно сделать еще круче, добавив Stitch ноду, чтобы вообще кроме зоны инпейнта не использовать декодированный выход vae.
>>1328370 > подобное кто-то сделал Не, ну это понятно, что кто-то сделал. Я о том, что на данный момент нет такого вае, который мог бы без потерь туда-сюда гонять изображение в латент и обратно, и хуй его знает, будет ли в обозримом будущем. Поэтому единственный вариант изменить только необходимую область - старый добрый инпейнт прямиком из 2к22 даже на этих эдит моделях. Кстати, что там по инпейнт контролнету к квену? В последних коммитах комфи говорится что-то про это.
>>1328442 > если инпейнт и так можно делать Хз. Я пытался инпейнтить на обычной qwen-image модели >>1326184 - это боль, а загружать вторую 14Гб модель только, чтобы исправить мелкий текст на заднем плане - пиздец, особенно если потом обратно на основную нужно переключаться. 2.27Гб контролнет - норм, осталось дождаться чего-то типа union.
Потестил Квен. Как я не пытался, залить улицу с высоким уровнем, как и залить машины вместе с капотом, несмотря на разные ухищрения так и не получилось. Я даже вовсе исключал улицу, просто писал и «река и море из которых торчат здания» Адин хуй. Надоело, взял замалевал грубо и через эдит попросил поправить. Тоже не топит нормально машины, высовывая их заново как и людей из сока. пик1 — максимум чего добился, пик2 — максимум, поверх моей мазни пик3 — мазня.
Imagen с этим базово получше справился, там поток машины и людей несёт хоть как-то. Но проблемы схожие.
>>1328442 Посмотрел. Гораздо лучше, чем без него, но проеб по тону есть. Чтоб прямо что-то сильно изменить - не оче пожалуй, возможно для фикса мелких деталей пригодится.
>>1328654 Его я первым делом затестил, он очень пердолит изображения. На старых шакалистых фото он хорошо дорисовал, на свежих генерациях он добавил оч много артефактов и сделал кожу более мыльной.
>>1328493 Бля, надо было силу уменьшать. Снизил до 0.5 силу лоры и патча - уже лучше, есть с чем работать. >>1328921 Это для union на всякий случай, он не всегда сам нормально определяет, что от него надо.
>>1329020 В том, что ты в любой дырке затычка. Тред не читаешь, сразу отвечаешь, и всегда уверен, что разбираешься в любом вопросе лучше других, даже если не знаешь, в чем вопрос.
>>1326807 избавляюсь потихоньку от пластика по совету анонов прогнал через ван смотрится лучше и по этому поводу вопрос правильно ли юзаю воркфлоу немного изменил t2v и подал просто картинку в семплер
>>1329144 candid photo of a skinny young woman in a sweater over her gigantic breasts and short skirt sitting on a blanket in a park, her legs are spread apart exposing red panties, she is tilting her head slightly and her short blond hair is partially covering her eyes, in the background are two dogs, a larger dog is laying on the grass while a smaller dog is on top and behind the first one with his front paws resting on the back of a larger dog and his hind legs on the ground, and the woman is wearing stockings, in the background there is a sign with dog in a crossed out circle and the text 'No humping', and there is a marching band in the background in scottish kilts walking far in the distance, and a ballerina cat dancing on the side of the image
>>1329132 Да в целом тюнов и надстроек. Ради того что квен существенно лучше слушается команд и меньше уродует пальцы, можно и подождать, пока он там сгенерит.
Уже даже не выглядит полностью бесполезным для моих задач.
>>1329174 > можно и подождать, пока он там сгенерит Хз, че там ждать. У меня он быстрее хромы генерирует. 63 сек на генерацию вместе с энкодом при загружеенной модели и 29 сек на проход ХЛ. Помню по 10 минут ждал только апскейлы на 1.5, которые потом еще минут 20 инпейнтить нужно было.
Короче, пока вывод по хроме - годноту можно генерить только долго. Ну либо накинуть две лоры и генерить за 20-30 секунд, но это даёт сильный киношный стиль, не всем может нравиться. Промпт и настройки артисана из галереи хромы пока лучшие. Но это не всё, лодстон не прекращает готовить, 50 версия считается фейлом, пытается исправить. Флеш - ебанная параша, может только для аниме годится, хуй знает. Алсо, нахуя вы дрочите зацензуренный косой Qwen своей соевой хуйней? Фото лоры там уже есть не хуже флаксовских (только вы их нихуя не юзаете), но в остальном разве не проще включить ImageFX и генерить в десятки раз лучше и быстрей? Он даже сиськи и жопы селеб может генерить, просто писать промпт нужно уметь. Наличие видеокарты не обязывает вас дрочить только на косую-кривую локальную хуиту, которой можно пользоваться только для нсфв (поэтому хрома>ван>ластифай=нубай>>>квен, голый флакс, хайдрим, ауры-хуяуры) и контролнетов.
>>1329219 Ебанутый что ли? Ван на любом ведре запускается. Даже на 16гб огрызках можно генерить 720p больше чем на 5 секунд. Про картинки я уже вообще молчу. Он тоже неплох, но для каждого нсфв сценария нужна лора.
>>1329274 Фига ты чё хранишь! Вторую вроде бы я генерил по промпту третьей, это не точно, но генерил сто пудов.. Оригиналы утеряны. Спасибо за ностальгическую слезу. Как же здорово было.
Да хули этой пробляди надо? Ошибку выдаёт, значит какая-то залупа не стыкуется с другой залупой. ЧЯДНТ? Ошибка встаёт на ноде с промптом. Вроде всё как говорили. Подскажи, анон!
Сап. Наверное платина. Я, например, нагенеренные картинки через локальную модель могу использовать в (не)коммерческих проектах? Допустим, если я нагенерю спрайты для игры я могу их использовать? Я видел в стиме всякую порнуху с нейроартами, но я так и не понял, что и с какой лицой они юзали.
Блоки лоры я заблочил как на скрине, но это не точно. Еблет сохранился.
Промпт на missionary pose. photograph of a nude woman with light skin and small breasts, lying on a white bed with her legs spread, being penetrated by a man with a circumcised, erect penis, a beige pillow with a floral pattern in the background, missionary
>>1329336 Да ты офигел, это всё мои девочки. Пикрел моя любимая. Делал тупо одну за другой на шизопромпте каком-то, у них даже нет меты и воркфлоу, зачем-то не сохранил. >>1329359 Это натвиз 1 с лора на ретро, я её тут форсировал в то время, но уже забыл какая, натвис с выходом флюкса не юзал. Там где-то даже промпт есть в одном из тредов с этими картинками скидывал. >>1329327 >>1329369 Никто не забыт, ничто не забыто.
Блядь, какую я только херню не генерировал, какие метаморфозы не наблюдал. Таков путь! А начался мой путь с FaceFusion, потом Fooocus, затем комфи с sdxl, эти ебучие лоры, потом Flux Kontext, WAN, сегодня qwen image edit, как мне это всё настоебенило, сколько у меня это времени отняло, но это пиздец как интересно! Но год назад я даже не представлял, что я этим буду заниматься.
>>1329511 А прикинь, 5 лет назад этого ничего не существовало даже, в сети ещё можно было подрочить на картинки из гугла, будучи уверенным что это реальные письки и сиськи.
>>1329515 > будучи уверенным что это реальные письки и сиськи. Нет, ты тупой если так думал. 5 лет назад все сайты были уже голыми фейками знаменитостей завалены. И 15 лет назад тоже.
>>1329214 >Алсо, нахуя вы дрочите зацензуренный косой Qwen своей соевой хуйней? Потому что этот еблан так тред троллит, как до этого троллил стоковым калом от ваньки.
>>1329573 Хуйню несешь. Тупой это кто 5 и 15 лет назад искал, находил, не отличал от фотографий и использовал фейки голых знаменитостей, над которыми работали не мастера фотожопа, а васяны с пейнтом. Эти твои кореша это просто протолюди какие-то, на уровне кольчатых червей.
>>1329622 Нормальных лор нет. На пластик пох, поровые шизы нинужны. Кому нужно, пусть хоть полторахой обмазывает для реализма. Модель может примерно 60% от величия божественного DALL-E 3, с которым за 4 года ничего так и не сравнилось в следовании промпту и универсальности. Это реально шаг вперед к ОУПЕНДОЛИ, о котором так долго мечтало человечество, все, что было до этого - говно, флюкс был судорогой мертвого тела, ван - прыжком на месте. Собственно все что нужно знать. Могут не качать, если лень.
>>1329557 Соглашусь. Я заебался уже уже запоминать какой лоре что писать в промпте, эти уебаны ещё придумывают тупорылые слова типа XXX7&&_1SH_SEXY, сука!
>>1329648 > Поделись мудростью, а? Какой мудростью? Если ты про qwen - то ждать полноценных nsfw тюнов, которые смогут хуман ленгвижем засунут голову шрека в задницу белоснежки, например.
>>1329646 Кстати, к безусловным минусам квена можно отнести то, что он не знает концепцию кала и плохо разбирается в анатомии свиней. Лучше, чем флюкс, но все равно неприемлемо плохо.
В целом, после ебучего kontext это свежайший глоток воды. Разъёб полный. Как же я ебался с ним! А это хочешь так поверни, хочешь - сяк! Ууух, бля! Значит, ждём-с.
>>1329573 Не, я же профи был в этом смысле. Я искал оригинал сразу и находился конечно. А щас не поймёшь нейрослоп это или оригинал иногда, если нюдсы непопулярных селибрити искать, ибо оно в единственном варианте. С фейками было всё понятно всегда был оригинал. >>1329523 У меня чёт не встаёт на нейрослоп, даже если не придраться. Именно ииз-за того что я знаю что это нагенерено. Из-за этого когда смотрю на реальные фото, я уже сомневаюсь и заранее скептически настраиваюсь и тоже не встаёт.
>>1329725 когда ты сделаешь первый миллион долларов за счет своего продукта с использованием ИИ, ты наймешь работнечков и будешь им недоплачивать, потом кто-то из них тебя сдаст и к тебе прибегут юристы Black Forest Labs.
А с китайцами такого не будет, они сами своровали все для своей модели и им похуй если ты будешь делать серьезные деньги на их труде.
>>1329635 >Нормальных лор нет >полторахой >божественного DALL-E 3 >ОУПЕНДОЛИ >флюкс был судорогой мертвого тела >ван - прыжком на месте Есть босс-вертолет, а это босс-говноед. И таких "боссов" по несколько раз на уровень. >Собственно все что нужно знать
Квена топ, следование промпту - мое почтение, но видно что она концептуально достаточно ограниченная. Думаю, когда лор завезут будет топ. >>1328490 Скинешь промпт?
>>1329697 Ван буквально лолей генерит отлично, что в видео, что в фото. Первым делом протестил это конечно, и успешно. Главное лоры типо Instagirl не ставить очевидно.
А какой семплер с шедулером использовать под qwen image edit? У меня что-то какая то залупа получается. Как будто перекаченный тысячу раз сжатый jpeg. Или модель q4 маловата?
>>1329842 Giant man wearing dark green business suit with big tomato instead his head standing waist deep in the tomato juice river, surrounded by high buildings. He is on the back plane and 100 meters tall. Space between buildings is narrow. All space below is totally filled with tomato juice and the level of liquid is up to giant`s knees and 2nd floors of buildings.
Giant hangs his tomato-head and bends down, he is holding his stomach and bending over in pain, he open his mouth and vomits with a thick waterfall of tomato paste and juice down. Flood with waves carries cars and people towards camera. Cars and people floating in the river of tomato liquid.
only tops of streetlights seen over the surface of red river.
>>1329922 >Giant man wearing dark green business suit with big tomato instead his head standing waist deep in the tomato juice river, surrounded by high buildings. He is on the back plane and 100 meters tall. Space between buildings is narrow. All space below is totally filled with tomato juice and the level of liquid is up to giant`s knees and 2nd floors of buildings. > >Giant hangs his tomato-head and bends down, he is holding his stomach and bending over in pain, he open his mouth and vomits with a thick waterfall of tomato paste and juice down. Flood with waves carries cars and people towards camera. Cars and people floating in the river of tomato liquid. > >only tops of streetlights seen over the surface of red river. > >surreal photo, daylight, high resolution,
>>1330018 > Неплохо жи сделано Ну кроме >>1329949 я и сам своего рода мимокрокодил, а беседа это вечная - кто-то видит косяки в чем-то одном, но упорно отказывается видеть в другом, а кто-то наоборот, обращает внимание на второе, и игнорирует первое
Короче, у квена рил нет некоторых концепций в репертуаре и приходится выкручиваться. Но как я погляжу, источник проблем в том, что он понимает промпт как то по-своему. Местами слишком буквально, местами - гораздо абстрактнее, чем другие модели. А еще некоторые понятия у него "слипаются". Короче приноровиться надо.
>>1330014 У всех баб в каждом прыще по лампочке? Совсем ебанулись поровые дебилы, их надо изолировать уже. Эта хуйня похожа на икру мойвы, а они думают что РИОЛИЗМ ору блядь.
В чем феномен, что шизы пересели на квен? Их так резиновая кожа привлекает? Во флакс как бы тоже хуевые текстуры были, но на нем они не генерили и предпочитали делать кал на аниме-реалистиках.
А лел, Комфи есть нативно под линь, тогда даже сношаться с шиндой не буду, выну запасной SSD из NASа и накачу туды рач. Надеюсь я не делаю ошибку и устанавливать шиндовз не придётся.
>>1329936 Ну я раз в год тестирую нейронки. Не Girl solo же мне тестировать? Щупаю, что могут со структурой, с сюжетом, с расположением деталей, с полупрозрачностями, с регулярными паттернами, с пальцами, держащими что-то или переплетёнными.
>>1330103 >что он там на 3 гига то качает, ля? питорч так и весит, а ошибка у тебя скорей из-за конфликтов каких-то пакетов. У меня так было в како-то аудионейронке, при установке старой версии градио, отказывалось качаться пара библиотек и торчаудио с кудахуйитой, ошибка типа твоей. Пришлось чекать совместимость всех библиотек и модулей, а в итоге я хуй забил от пердолинга.
>>1330146 Новость не про это, а про то, что можно использовать специальную лору на Qwen Edit вместо лоры на обычный Qwen Image. Ты обычный шиз или понимаешь что такое лора-ускорялка?
Это не img2img, в этом прикол что модель заново с муля пересоздала кардинку по референсу, а не просто насрала шумом и потом прошлась в целом по картинке, примеры отсюда: >>1330138 >>1330131 >>1329947 >>1329912
>>1330153 нихуя себе, на 5%! Попробовал я так сгенерить. Без лоры, то бишь. Хуярила 7 минут, а результат такой же. А с лорой я за 40 секунд получаю тоже самое. Не знаю, как будто бы предвзятое отношение просто. Порой, невозможно отличить результат. Единственное, что я заметил однажды, что на SDXL 8step lora и с LCM, там реально проёбывается промпт. Тупо одинаковую хуйню генерит. А тут хз, может, алгоритм другой.
>>1330153 Качество съедает даунскейл и vae. Плюс еще от самой картинки зависит, заметил что если при использовании сгенеренных на ИИ картинок, результат меньше проебывается. Слева 8 шагов 1 CFG с лорой, справа 25 шагов 3 CFG без лоры (да, вообще полный проеб, но это из-за того что в оригинале нужно использовать 40 шагов, а это дохуя как долго).
>>1330156 bf16 это тоже способ квантизации, типа тех же ггуфов (но в реальности не совсем типа). В принципе bf16 совсем ни сильно отличается от оригинала (fp32).
Вот квен. Послпе апскейла оба. Первый пик без лоры, второй с лорой на 4 шага. Второй по-моему выглядит как пик сдхл. Уныловато, хотя видно что контраст подкрутили.
Честно, не понимаю, в чем весь сыр-бор с 8\4 шаговыми лорами. Как по мне их качества вполне достаточно для решения рядовых задач и проверки промпта на работоспособность.
Да и не увидел тут аргументов, что от 20+ шагов без лоры все настолько меняется, что стоит ею пренебрегать.
>>1330179 Двачую. Я конечно, не эксперт, для меня разницы между lightning и без неё - никакой. Почему б не ускорить тогда генерацию? Сука, ну 7 минут, блядь, и 40 секунд!
>>1330162 >разница большая, по крайней мере в весе лор слева пик на fp32 лоре, справа bf16 версии.
Разница в том, что в fp32 (оригинальное значение полной лоры) цифровые значения записываются в 32 битах, к примеру вот так 3241.2343758806304932 А в bf16 значения записываются в 16 битах, к примеру вот так: 3241.234375 Точность понижается, но не в серьезных значениях. На fp8 правда уже заметно, поэтому он реже встречается.
>>1330182 > Может , с сидом не повезло? Nope. На следующем сиде такая же хуйня. Скорее всего это просто переименованная копия v1 из основной репы, чтобы не искать, как с вае. Но в основной репе она уже v1.1
>>1330185 Спасибо, что объяснил. Что-то я на подкорке такое понимал уже, но не до конца. Вот здесь даже больше разницы, чем в споре между lightning и без. Размер имеет значение! Или точность, кек.
Всё равно не пойму. Даже без лор qwen меняет еблеты. Плюс kontext был один большой - он редачил только то, что просили, а qwen, видимо, ебошит всё изображение. Либо я им просто не научился пользоваться.
Кстати вопросики: 1.Насколько сильно возрастает скорость генерации на квене с 24ГБ карточкой в сравнении с 16 гиговой? 2.Можно ли использовать ControlNet с квеной (вроде принципиальных проблем быть не должно, но мало ли) и пробовал ли кто? 3.Жив ли еще такой контрол как Sketch? Не пользовался контролками еще со времен выхода сдохли.
Это я еблет. Похоже, есть как бы два режима. Я могу написать remove t-shirt, и оно должно сработать только на майке. А если писать a nude skinny girl in full growth, то он всё перехуяривает.
>>1330193 >1.Насколько сильно возрастает скорость генерации на квене с 24ГБ карточкой в сравнении с 16 гиговой? В оригинале все так же не будет влезать, по идее должно меньше офлоадится, на RTX 4090 слышал про 5 секунд с 4-х шаговой лорой.
>2.Можно ли использовать ControlNet с квеной (вроде принципиальных проблем быть не должно, но мало ли) и пробовал ли кто? см >>1328442 и >>1329753
>3.Жив ли еще такой контрол как Sketch? Не пользовался контролками еще со времен выхода сдохли. Ни нужон как-бу же, хватает canny.
>>1330195 >>1330197 Да, по сравнению с Flux Kontext, чаще проебывается в редактировании вещей, которые не нужно трогать. Тебе может для такого нужна clothes removal лора на Kontext, если ты найдешь именно ту версию - ее поудаляли нахуй отовсюду. Но я думаю скоро натренят первые лоры на Qwen Edit и нечто подобное будет и на нем.
Еще попробуй тупо написать >she is wearing a red dress как тут
>>1330201 На Flux у меня есть эта лора. И она отлично работает. А тут пока проблемки. Слишком много qwen берет на себя, лол. Но у тебя результаты ахуительнейшие. У меня есть ощущение, что я где-то проебался. Потому что мои результаты ужасны, все как на подбор. Может что-то не то скачал или выставил не так. Причем, иногда срабатывает просто великолепно, а иногда полное очко.
>>1330206 >Причем все файлы у меня закинуты куда надо. В том числе и mmproj-BF16.gguf Обнови кастомные годы и ещё не переименовывай mmproj файл, оставь его с полным названием и скачай ггуф текстового энкодера и загружай через эту ноду https://github.com/city96/ComfyUI-GGUF
>>1330217 Вот, ноды обновил, вроде пошло, блеать. А ведь обновлял! Я ещё чекнул видео, где мужичок говорит, что надо иногда заходить просто в кастомные ноды и галкой всё выделять и нажимать Try Update. Завелась, зараза. Спасибо за помощь, бро!
Обновилась Chrome HD на HF, но различия минимальны. Тест на основе аж 5 картинок на старой v10HD и на новой 1-HD. Хваленный radiance кто-то пробовал? Как rl расшифровывается и почему она так ебёт?
>>1330442 > не может Когда как. Обычно нормально с этим. Если ему пытаться впарить концепт, который он категорически не хочет исполнять - то косяки начинают идти во всём остальном тоже. Вот он наотрез отказывается сунуть юбку собаке в зубы с закрытой пастью и в итоге всё остальное по пизде тоже отправляется.
Есть чувак в твиттере, Kinaco, делает типа фотореалистичные азиаток.
А я люблю азиаток пиздец, но чёт ни в одной модели/лоре не смог добиться такого - либо азиатки теряют свою узкоглазости и кривозубость, либо теряется домашнее качество съёмки.
>>1330475 че такой буйный, пошутить что-ли нельзя. А ты не думал, что он может наебывать. шучу епта, не кипятись Он может просто тупо делать фотку, а потом её прогонять через лоу деноиз и вуаля! Типа АИ. сказал же шучу, не ори
просто такая тема, что некоторые и тут тоже, выдавая что "блять я невьебенный" тупо через контронет прогоняют и типа сами запромтили. И вф конечно же никогда нет.
>>1330487 ты сам то видел что выложит ты и чел выше? там азиатки, а у тебя дженерик сд-пони-флюксо фейсы. Ты азиаток видел вообще? Криозубых, проскомордых и т.д.?..криовоногих...или только в аниме?
>>1330464 >я люблю азиаток пиздец, но чёт ни в одной модели/лоре не смог добиться такого Если не врёшь, то у тебя должна быть коллекция промптов на твои попытки/поиски. Давай сюда промпты, а двачеры будут пробовать. Или мы должны их за тебя придумать потому что ты наврал?
>>1330519 >>1330487 Чмоня, что ты несёшь? У тебя типичный сд кал, который за версту видно. Тут именно такие как ты в петушином углу криворучек. >>1330464 Тут на первой тоже хуита. На третьей уже неплохо, если оценивать именно текстуру, это всегда самое сложное.
>>1330616 > чтоб сохранить лицо В каком смысле? Если тебе нужно с определенным лицом сгенерировать - то подключай FaceID, тренируй лору или ебашь контекст (говорят работает, не пробовал).
Как в Qwen Edit добиться фотореалистичности? Пробовал с лорой и без, пробовал в 50 шагов. Какое-то всё зашакаленое. Вот несколько разных настроек. Именно когда лицо подсовываешь и пишешь сделай фото с этим лицом.
>>1330652 candid photo, 1girl, oriental, korean, telling a joke, full body shot, bra, hairy pussy, excessive pubic hair, standing in a bathroom, bathtub in the background . uneven lighting, soft glare, highly detailed
>>1330645 В таком положении кто угодно может, ты попробуй нормальные пальцы сходу получить в сцене, где они не в фокусе и еще под ебанутым углом, как у той бабы с головой в стиралке и видом сверху-сбоку.
8 месяцев провел в криокапсуле, есть несколько вопросов. Лапша все еще наименее уебищная гуйня? Какая актуальная модель для генерации всратых сисек? Все так же сорта СДоХЛи? Флюкс расцензурили? ДМД-дауны соснули?
Слуушайте, а я чё, в могзи ебусь? А как ваном фотки генерировать? Я чё-то пытался заебенить, убирая WANVideo ноды, подставляя latentimage, но это хуйня какая-то, конечно же.
>>1330678 - Лапша норм - Flux, SDXL, WAN, Chroma, бери какую хошь - РАсцензурили - На полшишки
>>1330681 Заебок, спасибо, но есть последний, сука, вопрос. > - Flux, WAN, Chroma, бери какую хошь Как у этого дерьма с inpaint/outpaint? Есть какие-то BrushNet'ы или че? Гуглить прям щас не имею возможности, сорян.
>>1330716 Не, там получается 4 шага только благодаря тому, что я въебал не только lightning лору, но и fastwan лору, а также AccVid и CausVid, которые являются предшественниками lightning лоры, но помогает в купе с ним не проебывать картинку на 4 шагах.
Вообще lightning оно на 4 шага только для видео, в теории 4 шага на txt2img не должно работать, но как видишь можно сделать через этот костыль из 4 лор. Также не забудь что весы разные для highnoise и lownoise моделей.
>>1330673 >>4 Это Флюкс Кри. Хорошая фотореалистичная модель (после Ван, конечно - он на остальных пикчах). Промпт с и2т: The image is a photograph taken in an urban setting, likely in a crowded market or shopping area. The central figure is an Asian woman with dark hair tied back in a low ponytail, wearing a white lace bralette that reveals her medium-sized breasts and is accented by thin white straps. She has light to medium skin tone and is wearing a white face mask. The woman stands slightly to the left of center in the frame, facing forward with her body turned slightly to the right.
>>1330720 >Также не забудь что весы разные для highnoise и lownoise моделей. забей, это у меня оказывается на txt2video они разные, почему-то на txt2img идут и с одинаковыми весами лоры.