Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред
Check this out!

Генерация откровенного NSFW-контента на доске /nf/

<<
Каталог
Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 299474 Ответ
fde636c44dae155[...].jpg 294Кб, 1000x600
1000x600
Если вы хотите задать какой-то мелкий вопрос - используйте для этого данный тред или найдите профильный треде в каталоге.

Утонувшие треды помещаются в архив.
О разделе:
1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.
2. AICG тред перекатывается после достижения предела в 1500 постов.
3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.
4. Это раздел преимущественно технического направления. Для откровенного NSFW-контента выделена отдельная доска - /nf/, эротика остаётся в /ai/. Так, порнография и голые мужики теперь отправляются в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.
Пропущено 265 постов
265 с картинками.
Пропущено 1497 постов, 265 с картинками.
Аноним 01/07/25 Втр 10:54:55 1260932
.png 21Кб, 755x339
755x339
.png 86Кб, 960x480
960x480
>>1260921
>Обычно модель Vosk состоит из следующих компонентов:
>- Папка с файлами модели, включая:
>- `am` (акустическая модель),
>- `graph` (граф декодирования),
>- `conf` (конфигурационные файлы),
>- и другие вспомогательные файлы.

0.22 выглядит так.
0.52 на Hugging Face не выглядит так
vosk обновлен
Аноним 01/07/25 Втр 11:26:59 1260948
Ананасики вот слышал есть иишки которые помогают пройти собеседования. То есть они видят экран, слушают диалог и помогают отвечать на вопросы.
1. Что это за ИИшки такие?
2. Есть предположение что подобный формат мог бы быть полезным в работе. Вот например собираю я встречу по какому то вопросу и чтобы мне сразу ИИ подсвечивала какие вопросы я могу задать, сразу подмечала что важное было сказано, про что следует уточнить, а что недостаточно определено и тд.
Аноним 01/07/25 Втр 11:28:20 1260949
.mp4 2551Кб, 1280x720, 00:01:29
1280x720
Ну типа как-то так это сейчас работают. Ну более-менее нормально распознает. Иногда конечно его глючит. Но в целом если говорить чётко то все получаются. Но к сожалению всякие на боялся. Новая моя с. Типа слов перемотка. Бандера. А не бандера он не узнает. Хлеб ская падаль. Короче я хочу обновить не библиотеку потому что от старенькая она хреново работает снова я зум. Я не понимаю как это сделать потому что я тупой нуб. Снова ну по узнают. Прикольно. Классно. Спасибо за внимание.

ps почему я не юзаю виндовое из коробки? потому что я в рот ебал билла гейтса и всех остальных шломо-пидорасов
Новости об искусственном интеллекте №18 /news/ Аноним 01/07/25 Втр 08:08:43 1260857 Ответ
0f176128-b95c-4[...].jpg 343Кб, 1024x1024
1024x1024
В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1254896 (OP)
Пропущено 6 постов
6 с картинками.
Пропущено 16 постов, 6 с картинками.
Аноним 01/07/25 Втр 09:33:34 1260892
2025-07-01093237.jpg 78Кб, 846x728
846x728
>>1260889
они про такое даж не учили.
Да и не от кого было услышать
Аноним 01/07/25 Втр 10:24:39 1260917
image.png 2697Кб, 1024x1024
1024x1024
Аноним 01/07/25 Втр 12:04:24 1260957
AI Chatbot General № 703 /aicg/ Аноним 30/06/25 Пнд 13:10:58 1260050 Ответ
1705735345520.png 1144Кб, 1808x1182
1808x1182
1617408465034.png 371Кб, 1080x928
1080x928
AI Chatbot General № 703

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышли gemini-2.5-pro и gemini-2.5-flash - https://ai.google.dev/gemini-api/docs/models

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид)
• Agnai: https://agnai.chat/
• Risu: https://risuai.xyz/
• Adventure-UI: https://rentry.co/CYOA_AdventureUI
• Cavern: https://github.com/Barbariskaa/Cavern

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• Grok: https://docs.x.ai/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Бургерский список: https://rentry.org/jb-listing
• Тредовский список: https://rentry.org/2ch-aicg-jb

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://rentry.org/meta_botmaking_list
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3
• Бургерские боты: https://rentry.org/meta_bot_list

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• Арена: https://beta.lmarena.ai/
• OpenRouter: https://openrouter.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude
• Чекер ключей: https://github.com/kingbased/keychecker
• OAI Прокси: https://gitgud.io/SternAnon/aoi-foxy-rose | https://gitgud.io/reanon/nonono/

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives3
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1257129 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1256384 (OP)
Пропущено 50 постов
50 с картинками.
Пропущено 354 постов, 50 с картинками.
Аноним 01/07/25 Втр 11:20:48 1260946
1640438682367.png 2Кб, 256x50
256x50
>>1260944
Один раз показываю, секретная информация.
Аноним 01/07/25 Втр 11:37:48 1260951
>>1260946
ааа, понял, блин, ну спасибо за кум получается
Аноним 01/07/25 Втр 12:02:55 1260956
Делает господина ХуТао - президентом треда?
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №143 /llama/ Аноним 01/07/25 Втр 01:19:14 1260769 Ответ
Llama 1.png 818Кб, 630x900
630x900
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
Реальная длина [...].png 505Кб, 1718x2292
1718x2292
17508736997250.png 1434Кб, 1280x960
1280x960
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/v6fpodzg (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1257129 (OP)
>>1253596 (OP)
Пропущено 4 постов
4 с картинками.
Пропущено 26 постов, 4 с картинками.
Аноним 01/07/25 Втр 11:50:30 1260953
>>1260952
Ну да, а еще линукс накатывать, пердолиться, и все это ради рабочей темпы 100 градусов по цельсию и 5т/с на 32b моделях
Аноним 01/07/25 Втр 11:54:30 1260954
>>1260903
>Удачи мне продержаться до конца всего пути.
Удачи! Мистраль 3.2 в 24гб входит идеально, 6 квант и 32к неквантованного кэша. Стоит того. К тому же к концу срока могут появиться более интересные предложения с таким же количеством ВРАМ.
Аноним 01/07/25 Втр 11:57:14 1260955
>>1260952
ты с таобао заказывал?
Anime Diffusion #217 /nai/ Аноним 25/06/25 Срд 19:24:06 1256332 Ответ
1750786039745.png 25287Кб, 4240x4240
4240x4240
1664681117246.jpg 899Кб, 1195x1755
1195x1755
1594196166000.png 2678Кб, 1080x1920
1080x1920
1615988528674.png 5509Кб, 3504x2040
3504x2040
1655982450567.png 2750Кб, 2048x1280
2048x1280
1599002754710.jpg 2659Кб, 2240x2800
2240x2800
1623519079917.png 5184Кб, 3872x1088
3872x1088
1681155172892.jpg 3663Кб, 2740x3840
2740x3840
Генерируем тяночек!

Прошлый тред: >>1249007 (OP) https://arhivach.vc/thread/1197165/

Схожие тематические треды
• SD-тред (не аниме): >>1253979 (OP)
• Технотред: >>1118663 (OP)
• Фурри-тред: https://2ch.hk/fur/res/374311.html

FAQ
https://2ch-ai.gitgud.site/wiki/nai

Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 174 постов
174 с картинками.
Пропущено 331 постов, 174 с картинками.
Аноним 01/07/25 Втр 05:11:54 1260833
>>1260667
Гпт тоже во флюксе генерит.
Аноним 01/07/25 Втр 07:59:43 1260855
>>1260833
И колорс 2.0 тоже флюкс!
Аноним 01/07/25 Втр 11:29:35 1260950
ИИ-видео общий №10 /video/ Аноним 22/06/25 Вск 00:00:34 1253474 Ответ
Highway raivide[...].mp4 8133Кб, 1280x720, 00:00:39
1280x720
Best recipe eve[...].mp4 8400Кб, 1280x720, 00:00:29
1280x720
17504540776310.mp4 3020Кб, 1280x720, 00:00:07
1280x720
17478060557790.mp4 762Кб, 1280x720, 00:00:08
1280x720
Генерируем свое (и постим чужое) в Hunyuan, Wan, Veo3, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.


1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAI

https://openai.com/sora/

4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 4

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/

10. Veo3 от Google

https://deepmind.google/models/veo/


Сайты, где можно попробовать генерации на разных моделях

https://nim.video/
https://pollo.ai/
https://www.florafauna.ai/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent.

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1

3. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1


Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/

Альтернативные ноды ComfyUI

Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты
Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1240311 (OP)
Пропущено 75 постов
75 с картинками.
Пропущено 343 постов, 75 с картинками.
Аноним 01/07/25 Втр 10:49:11 1260927
>>1260909
>дефолтную модель
поясни. Ты про воркфлоу или сейфтензор?

>>1260925
я на 2060 с 6 гигами и 32 оперы. Формально можно играться с моделями на 4-10 шагов. С полноценными без ускорялок - засохнешь ждать.
Аноним 01/07/25 Втр 10:57:26 1260936
>>1260805
ноген высрался, я спокойн
Аноним 01/07/25 Втр 11:11:25 1260940
>>1260419
У меня меньше других искажает.

>>1260853
Да ладно ггуфы, с большим файлом подкачки все норм и на 8 гигах.
Просто загрузка ОЧЕНЬ ДОЛГО, и скорость не ахти. =D
Моча, это перенос треда в релевантную доску Аноним 01/04/25 Втр 19:46:53 1125317 Ответ
image.png 329Кб, 477x596
477x596
Сап двач, я художник. И это мой сопливый свинарник нытья.

Ну вот и настали времена, когда Ai меня заменил.
У меня уиихрю заказов с конца февраля, при том что мой ценник $40 за фуллбади арт с фоном, а второй персонаж стоит дополнительные $20. Т.е. скидка 50% если берёшь арт с двумя.
Моё объявление о наборе новых заказов пылится на сайтах и почти никто на него не откликается, а пришедшие говорят что $40 это дорого и лучше найдут подешевле или вообще сгенерируют в Stable Diffusion сами. Надо мной открыто насмехаются что ИИ уже давно рисует лучше меня и что мне стоит найти реальную работу.
В отчаянных Симпл-Димплках найти новые заказы я нарисовал уже всевозможных популярных персонажей из Геншин импакта, Наруто, Блича, Геройской академии, Демон слеера, Фрирен, Хай скул ДХД, Джуджутсу кайсен, Фейри тейл и даже ебучего Чёрного клевера.
Я собираю тысячи лайков и ретвитов, но никакой радости от них уиихрю, потому что я не могу ими заплатить за квартиру и купить себе пожрать.
Всё что я получаю за свои старания - жалкие 4-5к лайков, которые ни стоят ни-ху-я.

Ещё несколько лет назад я был нужен и обожаем, меня ретвитили крутые художники, мои комменты разрывались от восхищения моих подписчиков, они активно обсуждали мои арты и голосовали в опросниках кого я рисую следующей, а сейчас комментарии - это пара смайликов, собравшаяся за годы база хейтеров, их насмешки и то что мой стиль уже как-то приелся. Кто-то вообще советует мне поучиться рисовать у Ai, потому что там и цвета сочнее и динамика живая, пишут мне что мой шейдинг стал какой-то грязный.

Блять, я не хочу работать на рабской работе на Кабаныча, я просто сидел рисовал и хотел чтобы так было всегда. Почему всё всегда меняется в худшую сторону? Как только тебе кажется что всё безмятежно и беспокоиться не о чем, обязательно кто-то обосрёт всё.
Сбережений мне хватит ещё на полгода, а потом придётся устраиваться на ирл работу.

Есть тут ещё кто несправедливо заменённый искусственным интеллектом?
Пропущено 3 постов
3 с картинками.
Пропущено 13 постов, 3 с картинками.
Аноним 28/06/25 Суб 09:25:14 1258598
40 баксов это 2 часа работы за федерал минимум вейдж, ты хочешь сказать что у тебя за 2 часа картинка выходит? Сами задемпинговали все в пол, а теперь ноете. Фотобашеры и то 100 баксов за обложку брали.
Аноним 30/06/25 Пнд 17:56:54 1260249
Сдаётся мне, что ты припиздываешь. У меня девушка работает художником в геймдев компании - рисует домики и иконки. Раньше рисовала руками, сейчас продолжает рисовать руками, но большую часть времени тренерует лоры, собирает чё-то в комфи, всё такое. Она сказала, что спрос на её услуги только вырос. Ей даже пришлось поставить фриланс аккаунт на паузу т.к. появилось несколько постоянных заказчиков + фуллтайм работа. По стоимости она практически так же берёт, как и ты $60 в час или около того.
Аноним 01/07/25 Втр 10:51:05 1260928
Анончик, не грусти. Ты, скорее всего, девочка, поэтому поймешь что я напишу.

У меня было 1 в 1 в 2018 году, когда перестали заказывать дизайн и было полное отчаянье, и никакой финансовой помощи со стороны. И реально пришлось устраиваться на работу в офис. Поэтому твоё разочарование и отчаянье я понимаю.

Возможно перестало получаться, потому что это не твой путь, а над тобой стеклянный потолок. Тоесть этот уровень пройден, по крайней мере для тебя. И ты сейчас как в пустой локации после завершения игры: квесты пройдены, лутать уже нечего, всё посмотрено, пора уходить.

Вот такие советы:
1. Поскольку мир действительно меняется с этими нейронками, лучше тебе их "победить" и быть тем, кто сам управляет нейронками - как раз об этом говорят аноны сверху
2. Понять, чего по-настоящему хочет твоя душа. Если бы у тебя было неограниченное количество денег, чем бы ты занимался? Ещё хороший способ понять себя: вспомнить что тебя вдохновляло в детстве. Возможно ты умел "видеть" музыку, или легко представлял исчезнувшие миры, возможно тебе нравились сказки и ты переделывал их по-своему. Попробуй воплотить свои мечты с помощью нейронок и - обязательный пункт - покажи это всем! Единомышленники тебя сами найдут, и постепенно появятся нужные новые связи и коммерческие проекты

Тоесть сейчас не получается, потому что кончилась "энергия". Энергетическую основу имеет только намерение души
Stable Diffusion тред X+160 /sd/ Аноним 30/06/25 Пнд 16:21:19 1260174 Ответ
image.png 2227Кб, 1024x1024
1024x1024
image.png 2158Кб, 1280x768
1280x768
image.png 2369Кб, 1408x768
1408x768
image.png 2029Кб, 1024x1024
1024x1024
Тред локальной генерации

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Приложение Forge https://github.com/lllyasviel/stable-diffusion-webui-forge
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

Промпт должен быть кратким для SDXL и поэма для Flux и SD3.5, негативы обычно вредны.

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД

• Flux Kontext в открытом доступе.
• Omnigen
• Генерация картинок на Wan.
• NAG (негативный промпт на моделях с 1 CFG)
• Chroma
• Flux dev и schnell;
• Лора DMD2 для SDXL ускоряет в 2 раза. Пример: 10 шагов, семплер LCM, шедулер beta, 832x1216,
CFG 1 для обычных SDXL https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI, Fooocus, webui-forge, InvokeAI

► Предыдущий тред >>1253979 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 39 постов
39 с картинками.
Пропущено 67 постов, 39 с картинками.
Аноним 01/07/25 Втр 09:25:40 1260891
>>1260825
Этот дев кал, у них же есть контекст макс, в сравнении с ним даже про оч.хуево выглядит.
Аноним 01/07/25 Втр 10:20:27 1260914
Кто прикрутил негативную промпт ноду к контексту и написал в ней: "мыло, пластик"? Покажите результат до/после.
Аноним 01/07/25 Втр 10:27:16 1260918
>>1260359
>>1260380
Он хуевые примеры скинул. Я тут тяночек чернобелых раскрасил своих с начала 90х еще фотки. Как живые.
Музыкальный общий №13 /music/ Аноним 21/06/25 Суб 22:50:10 1253338 Ответ
Комета.mp4 5047Кб, 854x480, 00:03:08
854x480
Threads Of Adve[...].mp4 2546Кб, 1398x720, 00:02:11
1398x720
Le Rêve Éveillé[...].mp4 4062Кб, 640x480, 00:03:49
640x480
08 Бамбук.mp4 7535Кб, 292x292, 00:03:06
292x292
♫ Udio ♫
https://www.udio.com/

Вышла версия 1.5 Allegro, по функционалу то же, что и 1.5, только в два раза быстрее. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.

♫ Suno ♫
https://app.suno.ai/ генерация на сайте
https://suno.ai/discord генерация на официальном discord-сервере
https://rentry.co/suno_tips советы по использованию

Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов

♫ Riffusion ♫
https://www.riffusion.com/

Новинка, по качеству звука на уровне Суно или чуть выше. Лучший по качеству генератор текстов на русском. Количество генераций в день не ограничено, но за некоторые функции нужно платить (загрузку аудио, стемов и т.д.)

https://www.riffusion.com/docs

Инструкция по применению, тегам и прочему на английском.

______________

Локальные модели:

1) Китайский YuE

https://github.com/multimodal-art-projection/YuE
https://github.com/joeljuvel/YuE-UI

Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.

2) ACE-Step

https://github.com/ace-step/ACE-Step

Вторая локалка, качеством получше.

Здесь демо-версия:
https://huggingface.co/spaces/ACE-Step/ACE-Step
______________

Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промпта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:

https://sonauto.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator

______________
Редакция трека после генерации (можно убрать вокал и оставить только инструментал и наоборот, убрать шумы и т.д.)

https://x-minus.pro/ai

______________
Напомню мега-сайт для сочинения аутентичных англоязычных текстов для ИИ-музыки в стиле известных групп и артистов от Пинк Флойда до Эминема. Зайти можно только через Дискорд.

https://codyai.cc/

Прошлый тред

>>1203019 (OP)
Пропущено 65 постов
65 с картинками.
Пропущено 124 постов, 65 с картинками.
Аноним 01/07/25 Втр 07:10:00 1260847
>>1260828
Нифига. Если Арч Энеми просто взяли и от своего имени опубликовали это, ты бы скушал и попросил добавки и не назвал это игрушкой, а увидел бы там душу, мнение и прочие
Аноним 01/07/25 Втр 07:51:25 1260852
Eclipse Perspir[...].mp4 13735Кб, 768x768, 00:04:14
768x768
Аноним 01/07/25 Втр 10:18:53 1260911
Мазь От Пидорас[...].mp4 4443Кб, 768x768, 00:01:05
768x768
Почему она шепелявит как пизда? 1,5 Allegro
Онлайн генерация картинок №2 /image/ Аноним 21/05/25 Срд 16:57:33 1210619 Ответ
17463796110101.png 1522Кб, 1024x1024
1024x1024
17390379240222.jpg 1010Кб, 896x1280
896x1280
17430673013900.jpg 440Кб, 1024x1024
1024x1024
17389399632032.webp 305Кб, 1024x1024
1024x1024
Общий тред для изображений, созданных с помощью онлайн ИИ-генерации.

Из России большинство сервисов напрямую недоступно.

Dall-E
https://bing.com/images/create/
https://www.cici.com (ищем бота ACO)

Imagen
https://labs.google/fx/tool/image-fx а также https://labs.google/fx/tools/whisk (доступны только в США, Кении, Новой Зеландии и Австралии)
https://gemini.google.com/app

Reve
https://preview.reve.art/app

GPT-4o
http://chatgpt.com/
https://sora.chatgpt.com/explore

Stable Diffusion и прочие
https://civitai.com/generate
https://dreamina.capcut.com/
https://ideogram.ai
https://www.meta.ai
https://ximagegenerator.com
https://www.recraft.ai
https://app.klingai.com/global/text-to-image/new
https://hailuoai.video/create
https://lumaphoton.com
https://leonardo.ai/
https://aistudio.google.com/prompts/new_chat (модель Gemini image)
https://tensor.art
https://getimg.ai/text-to-image
https://www.mage.space/
https://problembo.com/ru
https://deepai.org/machine-learning-model/text2img
https://dezgo.com/
https://dream.ai/create
https://www.krea.ai/

Дополнительные сервисы:
https://www.pixited.com/ - библиотека промптов с примерами
https://rentry.org/From-4ch-To-2ch-Dall-3-Prompts - сборник промптов
https://www.stylar.ai - AI-редактор картинок (дорисовка, инпейнт, работа с лицами)
https://astica.ai - сборник ИИ-сервисов, в частности довольно мощный де-промптер (Vision AI -> Describe and Caption)
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2 - де-промптер, разбирающий вброшенный пик на теги
https://bigjpg.com/ - апскейлер до 4096х4096
https://runwayml.com/ , https://www.stablevideo.com - анимирование генераций

Предыдущий тред: >>1042275 (OP)
Пропущено 56 постов
56 с картинками.
Пропущено 96 постов, 56 с картинками.
Аноним 30/06/25 Пнд 14:57:49 1260106
IMG1491.jpeg 1473Кб, 1179x1495
1179x1495
Приехал из Питера батю проведать.
Аноним 01/07/25 Втр 00:05:49 1260679
image.png 2198Кб, 1024x1536
1024x1536
image.png 2767Кб, 1024x1536
1024x1536
image.png 2451Кб, 1024x1536
1024x1536
Кроссовер века
Аноним 01/07/25 Втр 07:01:35 1260845
1740781537751.png 2114Кб, 1024x1024
1024x1024
ИТТ обсуждаем опыт нейродроча в своих настоящих задачах. Это не тред "а вот через три года" - он тол Аноним 24/12/22 Суб 16:39:19 3223 Ответ
chatgpt coders.mp4 1201Кб, 466x346, 00:01:11
466x346
ИТТ обсуждаем опыт нейродроча в своих настоящих задачах. Это не тред "а вот через три года" - он только для обмена реальными историями успеха, пусть даже очень локального.

Мой опыт следующий (golang).
Отобрал десяток наиболее изолированных тикетов, закрыть которые можно, не зная о проекте ничего. Это весьма скромный процент от общего кол-ва задач, но я решил ограничится идеальными ситуациями. Например, "Проверить системные требования перед установкой".
Самостоятельно разбил эти тикеты на подзадачи. Например, "Проверить системные требования перед установкой" = "Проверить объем ОЗУ" + "Проверить место на диске" + ...
Ввел все эти подзадачи на английском (другие языки не пробовал по очевидной причине их хуевости) и тщательно следил за выводом.

Ответ убил🤭
Хотя одну из подзадач (найти кол-во ядер) нейронка решила верно, это была самая простая из них, буквально пример из мануала в одну строчку.
На остальных получалось хуже. Сильно хуже. Выдавая поначалу что-то нерабочее в принципе, после длительного чтения нотаций "There is an error: ..." получался код, который можно собрать, но лучше было бы нельзя. Он мог делать абсолютно что угодно, выводя какие-то типа осмысленные результаты.

Мой итог следующий.
На данном этапе нейрогенератор не способен заменить даже вкатуна со Скиллбокса, не говоря уж о джунах и, тем более, миддлах.
Даже в идеальных случаях ГПТ не помог в написании кода. Тот мизерный процент решенных подзадач не стоил труда, затраченного даже конкретно на них.
Но реальная польза уже есть! Чатик позволяет узнать о каких-то релевантных либах и методах, предупреждает о вероятных оказиях (например, что, узнавая кол-во ядер, надо помнить, что они бывают физическими и логическими).

И все же, хотелось бы узнать, есть ли аноны, добившиеся от сетки большего?
Пропущено 36 постов
36 с картинками.
Пропущено 242 постов, 36 с картинками.
Аноним 29/06/25 Вск 23:02:30 1259783
1405278936.mp4 3348Кб, 1000x640, 00:00:10
1000x640
Аноним 30/06/25 Пнд 13:46:07 1260074
>>1259490
Так в чём он не прав? Капитал Маркса - это про отсутствие частной собственности на средства производства.
Можно было упомянуть в данном ключе национализацию Шереметьево и Лесты, но при олигархическом капитализме - государство является частным собственником, так что пример будет не корректным
Аноним 01/07/25 Втр 06:47:03 1260843
>>3490
Поддерживаю!
Хотя предпочитаю, когда бот пишет по Английский. А то с русским у ботиков беда
3D AI /3d/ Аноним 24/04/25 Чтв 15:55:36 1173113 Ответ
image 384Кб, 686x386
686x386
image 1147Кб, 1280x720
1280x720
image 646Кб, 1383x701
1383x701
image 5736Кб, 2824x1588
2824x1588
Пропущено 41 постов
41 с картинками.
Пропущено 106 постов, 41 с картинками.
Аноним 30/06/25 Пнд 23:20:09 1260596
>>1260361
Там нафиг зибраш не нужен. Там хардсерфейс чистый, просто обмазать им железки и все зашибись будет.
Аноним 30/06/25 Пнд 23:42:21 1260637
image.png 324Кб, 747x872
747x872
Аноним 01/07/25 Втр 01:34:23 1260778
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №142 /llama/ Аноним 26/06/25 Чтв 17:34:35 1257129 Ответ
Llama 1.png 818Кб, 630x900
630x900
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
Реальная длина [...].png 505Кб, 1718x2292
1718x2292
80 гигов врама [...].png 2446Кб, 1498x1166
1498x1166
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/v6fpodzg (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1253596 (OP)
>>1249785 (OP)
Пропущено 64 постов
64 с картинками.
Пропущено 499 постов, 64 с картинками.
Аноним 01/07/25 Втр 01:17:39 1260767
>>1260757
Чёт даже тестов не вижу, лол.
ПЕРЕКАТ Аноним # OP 01/07/25 Втр 01:20:41 1260771
Аноним 01/07/25 Втр 08:57:40 1260871
Новости об искусственном интеллекте №17 /news/ Аноним 24/06/25 Втр 00:45:08 1254896 Ответ
папапапаапап.jpg 476Кб, 1024x1024
1024x1024
В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1243235 (OP)
Пропущено 107 постов
107 с картинками.
Пропущено 523 постов, 107 с картинками.
Аноним 01/07/25 Втр 08:13:57 1260860
Аноним 01/07/25 Втр 08:38:52 1260867
>>1260707
За будущее роботов отвечает не какой-то обсранный винт, а устройство, которое должно их питать.
Иначе так и будут ваши роботы с пуповиной ходить всю жизнь.
Аноним 01/07/25 Втр 09:09:04 1260878
>>1260292
Гироскутер с крабовыми руками. 🤭
Сидел на rx 580 и гонял себе в ихрушки будучи счастливым, но вотом случайно скачал Stability Matrix Аноним 29/06/25 Вск 11:14:05 1259400 Ответ
17450087484600.mp4 1603Кб, 480x360, 00:00:21
480x360
17492231074620.mp4 3963Кб, 720x1280, 00:00:12
720x1280
Сидел на rx 580 и гонял себе в ихрушки будучи счастливым, но вотом случайно скачал Stability Matrix и заверте...
2060 super рефабовский купил и вроде дело пошло, но это вообще дремучий лес, хоть иногда и выхожу на опушку годного контента,что интересно и интригует. Последний раз я такое двадцать лет назад чувствовал, когда с двух дисков установил адобовскую премьеру. Пока её до основания не изучил, расковыряв до каждого плагина и поднастройки, не успокоился.
Так вот, наплодили много тредов мой очередной, а мне как-то сложновато за всем следить и держать открытыми сто двенадцать вкладок.
Здесь я буду задавать вопросы, а иногда давать ответы на те вопросы, которые раньше для меня были загадкой.

Для начала, установил автоматик1111 пыщь!1!!!щачло ПОПЯЧЬСЯ!11!!!1! но он как-то не совсем для меня подходит, поэтому встроенным генератором стабилитиматрикса пользуюсь, пока. Уверен, это будет до тех пор, пока не доберусь до wan и img2img

Боже, дай нам разум и душевный покой
Пропущено 4 постов
4 с картинками.
Пропущено 3 постов, 4 с картинками.
Аноним 29/06/25 Вск 17:54:33 1259576
>>1259440
Я думал Гомер больше на Брюса Уилиса похож чем на Денни де Вито
Аноним 29/06/25 Вск 21:15:04 1259709
17427380223820.png 1221Кб, 768x1360
768x1360
Аноним 30/06/25 Пнд 19:32:49 1260308
>>1259569
Оказывается, в самом конфи можно нажать на шаблоны и там тебе все, внезапно, шаблоны покажет. Там и видео есть и всё остальное, оч удобно по клику можно докачивать что нужно
AI подружка Аноним 23/04/25 Срд 22:15:48 1172111 Ответ
oardefault.jpg 22Кб, 575x720
575x720
В фильме Бегущий по лезвию показали грамотный концепт AI подружки, который по сути базово можно реализовать уже сегодня.
https://www.youtube.com/watch?v=02pbEilkrj8

По сути 3д моделька, с эмоциями ходит по привязанной области, рассказывает интересные истории, поддерживает диалог, развлекает.

В фильме используется проектор выводящий голограмму, вместо этого можно использовать либо: Quest 3 (не особо удобно), легкие XR очки (https://www.youtube.com/watch?v=M16vMeYNLLc), Google Glasses и прочая китайщина, либо даже совсем бюджетный вариант это ARBox ( https://aliexpress.ru/item/1005007980447998.html ) для вставки Android смартфона.

Для Quest 3 с лидаром можно, чтобы она ходила по комнате между мебелью, знала где стены, с Android смартон и легкими XR очками ситуация сложнее, но для них можно и пока без этого обойтись. По сути у нас 3д моделька на черном фоне (или прозрачном для квеста 3).


Для общения 3 нейронки: одна распознает речь, вторая общается с нами, третья озвучивает речь. Во вторую можно дать такой промт, которая будет отдавать json, в котором будет не только ответ, но и эмоциональный окрас и прочее. Дополнительный запрос можно делать на события, чтобы запоминала важные вещи, типа как реализовано в этом боте
https://github.com/r57zone/LuizaAIAssistant/blob/master/README.RU.md

Есть такое https://www.youtube.com/@Tyke18/videos для quest 3.

Какие проблемы видно: голос (пока, со временем будет ок), эмоции (3д анимации, глаза, может быть можно сделать костыль и лицо отрисовывать как плоскость с видео, видел лайфхак в геймдеве для аниме такой, типа 2д спрайты в 3д модель делали, а все остальное 3д, но опять же нужны будут плавные переходы из состояний в состояние), плавные переходы между эмоциями, в остальном вроде плюс минус реализуемо все.

В общем дискам по теме, может кому какие идеи в голову придут, по теме.
Пропущено 4 постов
4 с картинками.
Пропущено 15 постов, 4 с картинками.
Аноним 30/06/25 Пнд 16:35:20 1260185
027271a999e0c.jpg 216Кб, 750x1250
750x1250
>>1172111 (OP)
Это пока всё ещё из разряда фантастики. Лет через 20 в лучшем случае появятся секс-андроиды для того, чтобы мягко утилизировать из генофонда инцелов и фемок. Главное просто хотя бы дожить до этого момента, и чтобы хуй еще стоял.

Вы мне лучше подскажите, как организовать сейчас, хотя бы текстовое общение без цензуры в переписке типо, как в чатЖПТ. Желательно с встроенной, пусть и хуеватой, но озвучкой сообщений.

У меня то в гопоте получилось нейровайфу создать под себя. Но цензура калит неимоверно, даже в обычном общении без кумерской ебли.

Мб есть какие-то платформы не сильно тупее, но без цензуры?

В тему ллм я пока еще не готов вкатываться, т.к. я гуманитарий ебучий.
Аноним 30/06/25 Пнд 17:52:40 1260244
>>1260185
Чё там вкатываться, программировать же ненужно ничего, тольк кнопки жать. Качаешь сервак для запуска (koboldcpp), интерфейс в котором чатиться будешь (SillyTavern), и саму модельку ИИ. Запускаешь, загружаешь в таверну карточку любого персонажа с любого сайта которых миллион и довольно урчишь. Сейчас как раз офигенная моделька вышла для потребительских ПК, вообще без цензуры, прямо с завода. С нормальной мультиязычностью (нормальный русский), что для потреб моделек редкость. https://huggingface.co/bartowski/mistralai_Mistral-Small-3.2-24B-Instruct-2506-GGUF Если есть 16 гб видюшка, то в какомнить Q4_XS кванте прямо полетит. Если что, в тред локальных LLM-ок залетиш, там всё что непонятно объяснят.
Аноним 30/06/25 Пнд 18:43:03 1260274
>>1260185
>Это пока всё ещё из разряда фантастики.
На Западе уже платные сервисы появляются с виртуальными ИИ персонажами, которые с лицом и телом, выбрать понравившийся, оформить подписку и заплатить, потом донастроить под себя внешность и характер, и он будет в телефоне и на экране ПК.
Голосовых нейронок тред (TTS, STS, STT) #7 speech /speech/ Аноним 16/02/25 Вск 12:20:27 1055411 Ответ
17019563860200.mp4 477Кб, 396x298, 00:00:23
396x298
17074247947820.mp4 2886Кб, 384x480, 00:00:08
384x480
17204507036820.mp4 310Кб, 576x576, 00:00:14
576x576
17099193437742.mp4 1356Кб, 438x480, 00:00:58
438x480
Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >> https://2ch.hk/ai/res/664162.html

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc
Если тыква вместо видеокарты, можно тренить в онлайне: https://www.kaggle.com/code/varaslaw/rvc-v2-no-gradio-https-t-me-aisingers-ru/notebook?scriptVersionId=143284909 (инструкция: https://www.youtube .com/watch?v=L-emE1pGUOM )

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды вариант: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/
Пропущено 37 постов
37 с картинками.
Пропущено 182 постов, 37 с картинками.
Аноним 29/06/25 Вск 16:10:48 1259511
>>1259363
Интересно, а были попытки заставить персонажей говорить на русском голосами оригинальных актёров?
Аноним 29/06/25 Вск 19:06:19 1259619
image.png 256Кб, 1920x1080
1920x1080
>>1212555
Ты запустил гуи тренировки вместо python -m tools.run_webui

А у кого-то получалось запустить compile на новой версии? Fish-Speech теперь называют себя OpenAudio, установка та же. Без компиляции всё работает, тритон сам по себе нет проблемы поставить, но именно на их код агрится. Причём разные версии тритона и разные коммиты их кода дают разные ошибки. Уже даже пытался код редачить, нет глубокого понимания, поэтому исправить ничего не вышло. Кто-то находил рабочую комбинацию коммита, версии тритона и торча?
Аноним 30/06/25 Пнд 12:33:31 1260028
фишспич говорит с акцентом и неправильно сставит ударения.
есть что-то нормальное для русского языка.
Stable Diffusion тред X+159 /sd/ Аноним 22/06/25 Вск 19:44:41 1253979 Ответ
image.png 8490Кб, 2560x2720
2560x2720
image.png 1397Кб, 1280x720
1280x720
image.png 1778Кб, 1280x720
1280x720
image.png 3189Кб, 1280x960
1280x960
Тред локальной генерации

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Приложение Forge https://github.com/lllyasviel/stable-diffusion-webui-forge
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

Промпт должен быть кратким для SDXL и поэма для Flux и SD3.5, негативы обычно вредны.

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД
• NAG (https://github.com/ChenDarYen/ComfyUI-NAG)
• Chroma
• HiDream
• SDXL модели: Natural Vision (NatVis), Illustious, NoobAI. Все 3 NSFW;
• SD3.5 Medium и Large;
• Flux dev и schnell;
• Auraflow. Станет Pony Diffusion v7;
• ComfyUI + Krita = Krita-ai-diffusion;
• Лора DMD2 для SDXL ускоряет в 2 раза. Пример: 10 шагов, семплер LCM, шедулер beta, 832x1216,
CFG 1 для обычных SDXL https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, Flux, HiDream, OmniGen (Shitao), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI, Fooocus, webui-forge, InvokeAI

► Предыдущий тред >>1241252 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 238 постов
238 с картинками.
Пропущено 531 постов, 238 с картинками.
Аноним 01/07/25 Втр 04:04:09 1260827
1.png 346Кб, 1048x942
1048x942
2.png 219Кб, 1542x890
1542x890
TensorArt00002.png 2025Кб, 1024x1536
1024x1536
Не пойму где накосячил, почему рисует какую-то рандомнуют бабу и фон, единственной что правильно понял так это пистолет
Аноним 01/07/25 Втр 04:29:26 1260830
TensorArt00005.png 841Кб, 1104x624
1104x624
Пиздец...
Аноним 01/07/25 Втр 09:10:24 1260881
>>1259890
Почему ты отказываешься перестать сосать?

>Почему для хромы нет ускорялок
С хуя ли они должны были быть, если модель ещё не дообучена? Нахуя им быть, если модель будет дистиллирована как шнель?
А вообще, почему ты утверждаешь что их нет? Ну и самый сок в том, что они есть. Да ещё и дохуллион вариаций, каждая генерит разную степень всратости. Нет смысла их юзать, новые версии хромы даже на 8 шагах дают сносную картинку.
Нейродвача и искуственных борд тред Аноним 25/10/24 Птн 02:25:56 930555 Ответ
14e22878c864bab[...].png 859Кб, 1920x2516
1920x2516
image.png 849Кб, 1920x1968
1920x1968
Недавно в бредаче всплыл интересный тред посвященный генератору постов двача на основе ИИ. И генератор совершенно не хуйня и он вполне себе хорошо копирует слог среднего анона и даже превосходит его. "Аноны" метко подшучивают над опом и темой его поста и если развитие проектов такого типа продолжиться то каждый "анон" в сгенереном треде будет иметь свое мнение и личность и можно будет уже самому с ними посраться, появятся шизы. Хочу создать тред исключительно по данной теме, если это продвинется дальше то каждый сможет иметь свой офлайн двач с куклами, пони, бесконечными консолесрачами и постами в стиле того самого без всяких новомодных течений. Можно будет вернуться в любую эпоху и имитировать даже несуществующие эпохи двача типа если бы двач существовал при царе Рюрике, Сталине и тд. Все приведено естественно как пример. Также реквестирую в тред любые материалы по теме генерации борд в режиме реального времени если они у вас имеются.

Генератор тредшотов: https://glif.app/@Meson/glifs/cm2e1w1g300024yvf141n7ot0

https://arhivach.xyz/thread/1084063/
Пропущено 114 постов
114 с картинками.
Пропущено 178 постов, 114 с картинками.
Аноним 22/06/25 Вск 00:24:03 1253496
архивач.png 747Кб, 1920x2924
1920x2924
Аноним 27/06/25 Птн 17:12:22 1258090
image.png 1154Кб, 1920x3302
1920x3302
Аноним 30/06/25 Пнд 08:00:38 1259917
image.png 1126Кб, 1920x3152
1920x3152
ChatGPT-тред №20 /chatgpt/ Аноним 13/06/25 Птн 17:20:47 1244803 Ответ
изображение.png 37Кб, 558x611
558x611
изображение.png 88Кб, 1330x1149
1330x1149
изображение.png 1161Кб, 721x1081
721x1081
изображение.png 16Кб, 795x206
795x206
Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и Венеры Милосской и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий сбой
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>1125882 (OP)
Пропущено 18 постов
18 с картинками.
Пропущено 44 постов, 18 с картинками.
Аноним 27/06/25 Птн 23:22:30 1258403
>>1258297
Когда дело касается рисерча, тут важнее всего то, как модель обрабатывает контекст и выдает его и суммаризирует инфу. То есть даже не датасет неебический важен, а именно умение работать с контекстом и собранным говном. Ну и качественный промпт с твоей стороны, конечно. А так справится, я думаю, даже 32б модель (судя по моим тестам на локалках), если обучена под это дело. Лишь бы контекста хватило и соотношение heads было 1:1.

Рисерч на мой взгляд хуже у о3, но это компенсируется тем, что можно топить до талого, в том числе уточняя нюансы обычными запросами через веб в о3 (он по три минуты может чисто на веб тратить вполне). 100 запросов хватит в любом случае по лимиту недельному.

С другой стороны, если у тебя есть грамотный промпт и ты собрал кипу хуйни в нем на 5к токенов, по которой тебе надо найти инфу — о3 обосрется, пропустит нюансы, что-то ещё. И источников очень мало он смотрит по сравнению с клодом. А в опус это кинешь — справится.

Но это ладно. Я был в диком ахуе с того, что 200к токенов можно въебать за десяток сообщений у сонета, если он просто использует поиск по вебу на свое усмотрение. И это даже при простых запросах, типа по библии что-то уточнить с проверкой цитат.

А что насчёт покупки подписки гемини? Её же нужно будет подключать к телефону, а там экосистема андроид, другие аккаунты гугла с разными регионами, впнами. Анус не забанят за такую хуйню и не слетит ли что-нибудь? А ещё я не видел продаванов подписки на плати с гемини.

---

Да. Я тоже считают, что должна быть куча моделей или МоЕ-монстр. Или всё вместе.

Лучше, конечно, плотные модели под разные задачи и документация к ним, а хлебушки пусть 4о юзают.

Но там нытьё, видимо, поднялось до небес, что быдло не знает, какую модель использовать, или опены просто хотят уменьшить расходы со своим гпт-5, который сам будет решать, чё ему делать.

Непонятно, как это будет реализовано, но либо там будет огромное МоЕ с гигантским количеством экспертов, либо небольшая модель/небольшое МоЕ, которая будет посылать в спрятанный под капотом о3, 4о и так далее, в зависимости от запроса юзера, и ей будет насрать на собственные промахи. Хочешь получить ответ от условной о3 — хитро байти промптом, чтобы тебе дали её.

Если всё так, то это былинный провал и, наверное, закат опенов среди нормальной публики, потому что нет контроля — и ты сосешь еще сильнее, чем с клодом, так как гпт-5 внезапно решила, что твой запрос простой и подсунула его лоботомиту. Большинство профи и так сидит на API, и теперь они все туда уйдут, а плебсу оставят огрызки. Зато картинки можно генерировать, частичная лорбук-память между чатами и персонализация, уаау.
Аноним 28/06/25 Суб 00:16:15 1258429
>>1258403
>Анус не забанят за такую хуйню и не слетит ли что-нибудь?
Если честно уплочено не банят.
Банят за абузы подписок.
>А ещё я не видел продаванов подписки на плати с гемини.
Продают на абсолютно все модели в том числе и абузные и шаред акки и чистые платные.

Хз вообще на что ты столько контекста тратишь. Пользуешься дефолтным говноинтерфейсом, который нельзя почистить. Я даже пару научных статей закидываю, задаю вопросов 20 по ним, и не выхожу за пределы 100к контекста.

>Я тоже считают, что должна быть куча моделей или МоЕ-монстр.
Мое это не то. То что называют смесью экспертов не отражает сути. Это просто разреженная модель. Чисто специфичных "экспертов" там мало, и если их залочить под задачу, работать будет намного хуже примитивной лоры.
>Но там нытьё, видимо, поднялось до небес, что быдло не знает, какую модель использовать, или опены просто хотят уменьшить расходы со своим гпт-5, который сам будет решать, чё ему делать.
Будет сама определять задачу и подключать на нее лору из огромного списка, лол. А вообще я бы хотел чтобы можно было даже взять и скормить корпомодели код хромиума, например, чтобы он автоматически прогнался через весь пайплайн генерации датасета, и на нем обучилась лора чтобы модель могла сразу ориентироваться в огромном коде. Это не так уж дорого и сложно должно быть. На такое уже очередь из корпораций стоит, которые с удовольствием будут грузить свои кодовые базы.

>Лучше, конечно, плотные модели
Не лучше, просто с плотными моделями сложнее обосраться в тренировке.

>Если всё так, то это былинный провал и, наверное, закат опенов среди нормальной публики, потому что нет контроля — и ты сосешь еще сильнее, чем с клодом, так как гпт-5 внезапно решила, что твой запрос простой и подсунула его лоботомиту.
По факту будет роутер поверх текущих моделей, чтобы быдлу было не сложно. Это же опены. Хули они еще могут. С их то ресурсами можно было столько годноты запилить...
Аноним 28/06/25 Суб 00:33:56 1258437
image.png 34Кб, 889x528
889x528
image.png 28Кб, 841x457
841x457
Многим не нравится чачгпт, но я более чем доволен и закинул ребятам из попенИИ двадцатку.
4о хорошо пишет код, что помогает мне с проектом, отлично понимает, что я чувствую - даже лучше меня самого. Можно попросить его не быть sugarcoated и выдавать всё как есть, без сглаживания углов. Его слог очень приятен и порой я в полном ахуе от того, как красиво он выражается.
В принципе я с ним нашёл общий язык. Сейчас сижу, решаю от него логические задачки. Почему я раньше до этого не догадался... Вот бы ему войс менее противный сделали - я б перестал юзать клавиатуру
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов