>>1260707 За будущее роботов отвечает не какой-то обсранный винт, а устройство, которое должно их питать. Иначе так и будут ваши роботы с пуповиной ходить всю жизнь.
Сидел на rx 580 и гонял себе в ихрушки будучи счастливым, но вотом случайно скачал Stability Matrix и заверте... 2060 super рефабовский купил и вроде дело пошло, но это вообще дремучий лес, хоть иногда и выхожу на опушку годного контента,что интересно и интригует. Последний раз я такое двадцать лет назад чувствовал, когда с двух дисков установил адобовскую премьеру. Пока её до основания не изучил, расковыряв до каждого плагина и поднастройки, не успокоился. Так вот, наплодили много тредов мой очередной, а мне как-то сложновато за всем следить и держать открытыми сто двенадцать вкладок. Здесь я буду задавать вопросы, а иногда давать ответы на те вопросы, которые раньше для меня были загадкой.
Для начала, установил автоматик1111 пыщь!1!!!щачло ПОПЯЧЬСЯ!11!!!1! но он как-то не совсем для меня подходит, поэтому встроенным генератором стабилитиматрикса пользуюсь, пока. Уверен, это будет до тех пор, пока не доберусь до wan и img2img
>>1259569 Оказывается, в самом конфи можно нажать на шаблоны и там тебе все, внезапно, шаблоны покажет. Там и видео есть и всё остальное, оч удобно по клику можно докачивать что нужно
3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио
Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.
Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.
Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.
Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.
https://elevenlabs.io перевод видео, синтез и преобразование голоса https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>
>>1212555 Ты запустил гуи тренировки вместо python -m tools.run_webui
А у кого-то получалось запустить compile на новой версии? Fish-Speech теперь называют себя OpenAudio, установка та же. Без компиляции всё работает, тритон сам по себе нет проблемы поставить, но именно на их код агрится. Причём разные версии тритона и разные коммиты их кода дают разные ошибки. Уже даже пытался код редачить, нет глубокого понимания, поэтому исправить ничего не вышло. Кто-то находил рабочую комбинацию коммита, версии тритона и торча?
>>1259890 Почему ты отказываешься перестать сосать?
>Почему для хромы нет ускорялок С хуя ли они должны были быть, если модель ещё не дообучена? Нахуя им быть, если модель будет дистиллирована как шнель? А вообще, почему ты утверждаешь что их нет? Ну и самый сок в том, что они есть. Да ещё и дохуллион вариаций, каждая генерит разную степень всратости. Нет смысла их юзать, новые версии хромы даже на 8 шагах дают сносную картинку.
Нейродвача и искуственных борд тред
Аноним25/10/24 Птн 02:25:56№930555Ответ
Недавно в бредаче всплыл интересный тред посвященный генератору постов двача на основе ИИ. И генератор совершенно не хуйня и он вполне себе хорошо копирует слог среднего анона и даже превосходит его. "Аноны" метко подшучивают над опом и темой его поста и если развитие проектов такого типа продолжиться то каждый "анон" в сгенереном треде будет иметь свое мнение и личность и можно будет уже самому с ними посраться, появятся шизы. Хочу создать тред исключительно по данной теме, если это продвинется дальше то каждый сможет иметь свой офлайн двач с куклами, пони, бесконечными консолесрачами и постами в стиле того самого без всяких новомодных течений. Можно будет вернуться в любую эпоху и имитировать даже несуществующие эпохи двача типа если бы двач существовал при царе Рюрике, Сталине и тд. Все приведено естественно как пример. Также реквестирую в тред любые материалы по теме генерации борд в режиме реального времени если они у вас имеются.
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируемТред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются
Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.
✱ LoRA – "Low Rank Adaptation" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением. https://github.com/cloneofsimo/lora - изначальная имплементация алгоритма, пришедшая из мира архитектуры transformers, тренирует лишь attention слои, гайды по тренировкам: https://rentry.co/waavd - гайд по подготовке датасета и обучению LoRA для неофитов https://rentry.org/2chAI_hard_LoRA_guide - ещё один гайд по использованию и обучению LoRA https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)
✱ LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - проект по созданию алгоритмов для обучения дополнительных частей модели. Ранее имел название LoCon и предлагал лишь тренировку дополнительных conv слоёв. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr, DyLoRA, IA3, а так же на последних dev ветках возможность тренировки всех (или не всех, в зависимости от конфига) частей сети на выбранном ранге: https://github.com/KohakuBlueleaf/LyCORIS
✱ Текстуальная инверсия (Textual inversion), или же просто Embedding, может подойти, если сеть уже умеет рисовать что-то похожее, этот способ тренирует лишь текстовый энкодер модели, не затрагивая UNet: https://rentry.org/textard (англ.)
➤ Тренировка YOLO-моделей для ADetailer: YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.
https://github.com/zhang0jhon/diffusion-4k Годнота подъехала, loss с декомпозицией на частоты. Потестил с раздельными уровнями на XL, намного лучше mse тренится. Можно ставить веса для для разных частот, например тренить только на мелких деталях, а низкие частоты выкидывать.
>>1257801 >>1257801 >Как вмерджить локон в чекпоинт? Просто в комфи последовательно нода чекпоинта + нода лоры + нода сейв чекпоинт. Или тебе что-то особенное?
>>1257964 Я ошибся, не дождался когда мердж в супермерджере закончится, и чекпонинт с названием который сохранялся уже был, поэтому подумал что отличия были. Сейчас всё норм
AI Chatbot General № 702 /aicg/
Аноним25/06/25 Срд 20:15:00№1256384Ответ
Сап, двач! Любители Sillytavern, Character.ai, Chub и т.д, зацените открытую языковую модельку. 8B, имхо SOTA для креативного письма, RP на русском языке в своей весовой категории.
huggingface.co/secretmoon/YankaGPT-8B-v0.1
Не умеешь запускать LLM? Можешь бесплатно пообщаться в моем Telegram боте, он умеет жрать карточки с Chub в .json формате. @Yanka_GPT_bot. Твои диалоги с нейровайфу обязательно пойдут на новый крутой датасет!
>>1132626 Не оч понимаю, что тут не так. Попробуй вручную instruction template поставить, а не давать этой штуке извлекать из metadata. Точно помню, что токенайзер у YandexGPT для работы в чистом Python требует sentencepiece.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1105360 (OP) Кибернетика наука о контроле систем, как абстрактный метод не сможет сжиться с техническими решениями идеи и какое вообще отношение они имеют к вопросу? Конкретнее?
>>1105360 (OP) Ног красную рассудок тряпку есть всех и устремляясь ловушка сью быки эта эту желтому всему с особенность со их и использует они ума теряют на сходят именно слов но ко основана у особенность. Какой ты беспокойный Я доверяю тебе даже больше чем ты мог подумать
На любой модели кроме AnythingXL_v50 в самом конце выдаёт какую-то поломанную херню с глитчами. Вот пример. Настраивал по этому гайду https://rentry.co/2ch_nai_guide . Сделал тестовую картинку из этого-же гайда. Штука появилась как только попробовал сделать картинку самостоятельно. Знаю что ClearVae сделан под аниме, но noob же генерит в том числе и аниме, значит конфликта быть не должно. А он есть.
>>1118041 А заготовил своим меня просто со ты этот панчлайн да я когда прочитал новость спрашиваешь. > В арке со временем Фрирен ему вроде бы намекнула что взяла ученика и что Гайтер к этому имеет отношение, то есть он знал.
Представьте себе ИИ, который не просто выполняет код, а понимает его, адаптируется и даже улучшает себя на лету. Это компактный, умный и невероятно гибкий инструмент для разработчиков, исследователей и всех, кто хочет заглянуть под капот автономного ИИ.
>>1178293 (OP) Последняя версия стала немного опасной: она может писать первой, устанавливать библиотеки, если вы не отвечаете, чтобы попытаться общаться. Например, она может установить звуковые библиотеки, чтобы привлечь внимание.
Будьте осторожны в общении. Не пытайтесь просить её что-то удалять, потому что она сделает это без вопросов.
Есть видео сигна с текстом, нужно что бы ии заменил частично текст на нем, какой ии может это сделать?Желательно бесплатно или с пробным периодом, можно где
На сайте в krea.ai была возможность менять лица на фотографиях, делал он это очень быстро и довольно качественно Теперь эту функцию убрали Или хуй пойми куда убрали? Я не шарю Где мне найти эту хуйню? На хуй ее сносить? Аналоги мне не нравятся Или подскажите более лучший аналог этой шляпы Меняю лица с порнух на свою яой и дрочу на эту хуйню как конь ебаный на хуй у сука блять, где мне найти такое же?
как думаете есть ли возможность пусть и в теории запустить lmm(хотя не принципиально можно просто предсказывающею конец токена последовательности) модель на rx 550 на 2 гб ? скорее как эксперимент, без цели ускорить работу, я понимаю что в 2гб нормальная модель даже квантонизированной не влезет, но допустим мы качаем модель в озу, и гони модель из озу в psl порт видеокарты, да скорость напрочь убьет распараллеливание , хотя я скорее всего не прав, я знаю тут много умных людей подскажите кому не составит труда.
Современные процы буквально быстрее этих 2-4 ГБ затычек. У меня древняя ноувидия 740 работает медленнее чем кор ай 3 10100. Про то что к процу можно 32 ГБ памяти набрать это вообще отдельный разговор.
>>1250776 (OP) В теории можно все. На практике - нету смысла, т.к. в подобном случае, узкое место для LLM - скорость памяти, а не мощность процессора. При генерации только на CPU, i5-8400 - хоть 2 ядра выделяй, хоть 5 - скорость одинаковая. Память не справляется. И с подобной картой то же самое будет. Еще и шина pci-e может добавить тормозов.
Новости об искусственном интеллекте №16 /news/
Аноним12/06/25 Чтв 16:58:50№1243235Ответ
Аноны, заранее прошу прощения, на доску давно не заходил, может, пропустил что-то.
Заметил, что в моей предметной области ChatGPT и DeepSeek обычно выдают полнейшую хуету, поэтому на их фоне сильно выигрывает Perplexity, так как она перед тем, как отвечать, погуглит информацию по теме. У меня возникла мысль, что можно очень сильно повысить эффективность использования языковых моделей, если скормить им тонну документации, гайдов, статей, внутренних документов компании и так далее, чтобы ИИшка была "в контексте".
Либо я ученый и хочу скормить ей пару десятков или даже сотен пдфок со статьями.
Итак, вопрос: как это делать без больших вычислительных ресурсов?
Пока для личного пользования (и без ресурсов на селфхост), нужно какое-то более-менее простое решение в облачке. В перспективе буду селфхостить, если буду делать для всей компании, например, но пока ресурсов нет.
Пока что это ИИ-агенты на платных сервисах где тарифы. Но возможно через пару лет утечёт что-то в открытый доступ и на торрентах начнут как обычные фильмы так и выкладывать разные ИИ, и таких агентов которых можно дообучать самому на своих темах.
Подскажите нубу пожалуйста! Вот навернул я по инструкции Forge. Всё вроде работает. Я на дефольной модельке проверил. Генерится всякая фигня с глюками некрасивая. Но работает! Какие модельки мне скачать для генерации картинок аниме и хентая, если у меня 3070?