[ b / news / + ]
Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред
Check this out!

Генерация откровенного NSFW-контента на доске /nf/

<<
Каталог
Набор в модерацию ## Mod ## 26/07/25 Суб 21:22:15 1289389 Ответ
ayasemomodandad[...].jpg 18644Кб, 8192x4096
8192x4096
В разделе проходит набор в модерацию.

Кто желает следить за порядком на доске, чувствует в себе силы и готов принять на себя эту ответственность — присылайте свою анкету на vilka@2ch.hk. В ней нужно рассказать о себе, сколько вы сидите в день на доске, указать свои посты, а также контакт в дискорде/телеграмме для будущей связи.
Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 299474 Ответ
fde636c44dae155[...].jpg 294Кб, 1000x600
1000x600
Если вы хотите задать какой-то мелкий вопрос - используйте для этого данный тред или найдите профильный треде в каталоге.

Утонувшие треды помещаются в архив.
О разделе:
1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.
2. AICG тред перекатывается после достижения предела в 1500 постов.
3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.
4. Это раздел преимущественно технического направления. Для откровенного NSFW-контента выделена отдельная доска - /nf/, эротика остаётся в /ai/. Так, порнография и голые мужики теперь отправляются в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.
Пропущено 1497 постов
261 с картинками.
Пропущено 1497 постов, 261 с картинками.
Аноним 28/07/25 Пнд 13:12:52 1290743
Есть локальные модели для создания 3д моделек на основе 2д пикч?
Вобще не знал что такое есть но вот наткнулся на meshy.ai но это платная хуйня
Аноним 28/07/25 Пнд 14:07:59 1290796
>>1290391
>Все будут только апишки дёргать
Не всем команиям можно дёргать апишки, тем более зарубежные (пример- любой банк). Куча дотируемого импортозамещения "смотрите как мы можем". Просто понт и пиар.
Ну и главное- заточку под конкретную задачу никто не подебит даже 100500B нейронкой на кластере размером с материк.
>>1290743
Дофига, гугли. Качество предсказуемое говно.
Аноним 28/07/25 Пнд 18:49:47 1291286
аноны, кто курсором пользуется, нужна ваша помощь. мне курсор нужен только для одной вещи, вставлять патчи в код, какие-то куски заменять, функции, строчки, и вот таких правок в одном скрипте файле может быть с десяток, по сути все что я закидываю в курсор это промт вроде замени такое то на этой строчке, такую функцию в этом месте и так далее. хватало их бесплатной версии с головой с их auto моделью. а сейчас они все порезали и вручную меня ломает уже рыться в коде и вносить правки такого рода, где просто копи паст.
есть ли какие-то аналоги бесплатные или может можно апи подключить чье-нибудь, возможно с максимально тупыми моделями? достаточно чтобы просто модель могла понять куда и что вставить и не ломалась на коде в 1к строк.
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №150 /llama/ Аноним 25/07/25 Птн 19:56:56 1288430 Ответ
Llama 1.png 818Кб, 630x900
630x900
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
Реальная длина [...].png 481Кб, 1520x2266
1520x2266
17518920519090.png 2055Кб, 1455x1225
1455x1225
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Базы треда не существует, каждый дрочит как он хочет. Базашизика дружно репортим.

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_2025 (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1283995 (OP)
>>1280475 (OP)
Пропущено 400 постов
55 с картинками.
Пропущено 400 постов, 55 с картинками.
Аноним 28/07/25 Пнд 18:25:20 1291259
>>1291210
>да как бы нифига не 0.2...
Это был сарказм. на гите текущий релиз - v2.1.3 вообще.
Типа - нолик спереди потерялся. :)

>> вторая картинка
>Ахахаххаха, чот поломалось.
Там основное обращение Chat Completion - и модель должна такое понимать (все что 24B+ свежее - понимает), и структура приема ответа от модели должна правильно сформирована (это уже в самом flow). Эти куски должны были быть забраны в переменные, для использования в дополнительных запросах к модели, а не выкинуты вывод чата. И еще - эти куски не нужно на русский переводить. (Системные промпты не нужно - нужно то, что касается персонажей и окружения.)

Вообще - там есть и режим Text Completion - но он куцый, и скорее на отъебись добавлен.
Аноним 28/07/25 Пнд 18:57:55 1291297
image 376Кб, 877x786
877x786
>>1291259
Та не, пошаманил ещё с флоу, теперь норм работает, просто именно тогда чот прям поломалось. Но да, прям видно что альфа.

Агента-форматтера выкинул правда.

У меня анализ - планирование - сторителлер.
Аноним 28/07/25 Пнд 19:17:58 1291332
b3dd39fce75b1f9[...].jpg 48Кб, 720x728
720x728
Анонасики, а может кто-то объяснить как правильно строить входящее сообщение для модели, чтобы она красиво и интересно отыгрывала не залупливаясь? Хочу научиться делать правильные реквесты а не просто "юсер поднял пульт от телевизора и пернул" и ждать что модель сама придумает на этой основе. Кто-то в треде упоминал тредовичка и его логи, то как он грамотно выстраивает сообщения, но я слепое чмо и потерялся уже в паре сообщений и не могу теперь найти эти примеры.
Anime Diffusion #220 /nai/ Аноним 22/07/25 Втр 23:05:49 1285801 Ответ
1733061875028.png 24255Кб, 4368x4368
4368x4368
1728140753061.png 6352Кб, 1960x3812
1960x3812
1693192586056.jpg 1499Кб, 1840x2456
1840x2456
1628245300559.png 3185Кб, 1536x2048
1536x2048
1645454369526.png 2833Кб, 1364x1748
1364x1748
1659848126137.jpg 2272Кб, 2304x3456
2304x3456
1751491915389.png 2964Кб, 1368x1752
1368x1752
1698811009295.png 3321Кб, 1584x1984
1584x1984
Генерируем тяночек!

Прошлый тред: >>1275904 (OP) https://arhivach.vc/thread/1209212/

Схожие тематические треды
• SD-тред (не аниме): >>1269943 (OP)
• Технотред: >>1272560 (OP)
• Фурри-тред: https://2ch.hk/fur/res/374311.html

FAQ
https://2ch-ai.gitgud.site/wiki/nai

Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 384 постов
137 с картинками.
Пропущено 384 постов, 137 с картинками.
Аноним 28/07/25 Пнд 18:56:02 1291294
Причина вайпа?
Аноним 28/07/25 Пнд 19:05:55 1291306
image.png 2269Кб, 1536x1920
1536x1920
>>1291227
Так и есть. Просто очередной мерж.
Аноним 28/07/25 Пнд 19:17:48 1291330
image.png 2473Кб, 1024x1280
1024x1280
image.png 3809Кб, 1480x1856
1480x1856
image.png 3468Кб, 1480x1856
1480x1856
Stable Diffusion тред X+162 /sd/ Аноним 21/07/25 Пнд 13:40:13 1284303 Ответ
image.png 10571Кб, 2304x1792
2304x1792
image.png 1634Кб, 640x1120
640x1120
image.png 4064Кб, 1920x1088
1920x1088
image.png 1399Кб, 1080x612
1080x612
Тред локальной генерации

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Приложение Forge https://github.com/lllyasviel/stable-diffusion-webui-forge
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

Промпт должен быть кратким для SDXL и поэма для Flux и SD3.5, негативы обычно вредны.

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД

• Flux Kontext в открытом доступе.
• Генерация картинок на Wan.
• NAG (негативный промпт на моделях с 1 CFG)
• Chroma
• Flux dev и schnell;
• Лора DMD2 для SDXL ускоряет в 2 раза. Пример: 10 шагов, семплер LCM, шедулер beta, 832x1216,
CFG 1 для обычных SDXL https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI, Fooocus, webui-forge, InvokeAI

► Предыдущий тред >>1269943 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 372 постов
149 с картинками.
Пропущено 372 постов, 149 с картинками.
Аноним 28/07/25 Пнд 19:12:47 1291319
>>1291312
Не пробовал, но судя по тому, что в прошлом (или этом) треде выкладывали, он таки остальное трогает. Или его просто не правильно использовали?
Аноним 28/07/25 Пнд 19:17:31 1291327
>>1291278
я же говорю что ты долбаёб, иди нахуй.
Аноним 28/07/25 Пнд 19:17:43 1291329
xc.jpg 333Кб, 832x1248
832x1248
xc0.jpg 283Кб, 1248x832
1248x832
xc2.jpg 219Кб, 872x1192
872x1192
xc3.jpg 351Кб, 1248x832
1248x832
ИИ-видео №12 /video/ Аноним 25/07/25 Птн 14:45:10 1287986 Ответ
m2-res854p.mp4 1347Кб, 480x854, 00:00:10
480x854
17526284309860.mp4 2650Кб, 1024x576, 00:00:16
1024x576
Liquid Death AI[...].mp4 16183Кб, 1280x720, 00:01:01
1280x720
Генерируем свое (и постим чужое) в Hunyuan, Wan, Veo3, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.


1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAI

https://openai.com/sora/

4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 4

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/

10. Veo3 от Google

https://deepmind.google/models/veo/

Сайты, где можно попробовать генерации на разных моделях

https://nim.video/
https://pollo.ai/
https://www.florafauna.ai/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1

3. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1


Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты
Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1270014 (OP)
Пропущено 92 постов
17 с картинками.
Пропущено 92 постов, 17 с картинками.
Аноним 28/07/25 Пнд 19:05:48 1291305
>>1291288
А если без хайноза делать, только лоунойз с одним семплером. Какой будет результат?
Аноним 28/07/25 Пнд 19:11:58 1291318
>>1291276
Для текстовых есть тред: >>1288430 (OP)
Там проще в том смысле, что чем больше видеопамяти, тем более умную нейронку можно запхнуть, при этом, у тебя лимита верхнего почти нет (ну, терабайт с лишним сойдет как лимит?).
3090 24 > 5060ti 16 в полтора раза по объему как минимум, тут вообще нечего обсуждать.
Аноним 28/07/25 Пнд 19:16:46 1291326
>>1291305
А если тебе два яйца отрезать и только хуй оставить какой будет результат?
Stable Diffusion технотред #20 /tech/ Аноним 11/07/25 Птн 04:39:36 1272560 Ответ
training methods.png 1034Кб, 3510x2910
3510x2910
diffusion proce[...].png 358Кб, 2546x1822
2546x1822
lr.png 252Кб, 1853x624
1853x624
performance cha[...].webp 53Кб, 1200x900
1200x900
flux arch.jpg 1196Кб, 3258x3242
3258x3242
sd3 mmdit arch.png 257Кб, 2004x1372
2004x1372
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>1118663 (OP)

➤ Софт для обучения

https://github.com/kohya-ss/sd-scripts
Набор скриптов для тренировки, используется под капотом в большей части готовых GUI и прочих скриптах.
Для удобства запуска можно использовать дополнительные скрипты в целях передачи параметров, например: https://rentry.org/simple_kohya_ss

https://github.com/bghira/SimpleTuner Линукс онли, бэк отличается от сд-скриптс

https://github.com/Nerogar/OneTrainer Фич меньше, чем в сд-скриптс, бэк тоже свой

➤ GUI-обёртки для sd-scripts

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts

➤ Обучение SDXL

https://2ch-ai.gitgud.site/wiki/tech/sdxl/

➤ Flux

https://2ch-ai.gitgud.site/wiki/nai/models/flux/

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

LoRA – "Low Rank Adaptation" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением. https://github.com/cloneofsimo/lora - изначальная имплементация алгоритма, пришедшая из мира архитектуры transformers, тренирует лишь attention слои, гайды по тренировкам:
https://rentry.co/waavd - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_hard_LoRA_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - проект по созданию алгоритмов для обучения дополнительных частей модели. Ранее имел название LoCon и предлагал лишь тренировку дополнительных conv слоёв. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr, DyLoRA, IA3, а так же на последних dev ветках возможность тренировки всех (или не всех, в зависимости от конфига) частей сети на выбранном ранге:
https://github.com/KohakuBlueleaf/LyCORIS

Подробнее про алгоритмы в вики https://2ch-ai.gitgud.site/wiki/tech/lycoris/

Dreambooth – для SD 1.5 обучение доступно начиная с 16 GB VRAM. Ни одна из потребительских карт не осилит тренировку будки для SDXL. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://rentry.co/lycoris-and-lora-from-dreambooth (англ.)
https://github.com/nitrosocke/dreambooth-training-guide (англ.) https://rentry.org/lora-is-not-a-finetune (англ.)

Текстуальная инверсия (Textual inversion), или же просто Embedding, может подойти, если сеть уже умеет рисовать что-то похожее, этот способ тренирует лишь текстовый энкодер модели, не затрагивая UNet:
https://rentry.org/textard (англ.)

➤ Тренировка YOLO-моделей для ADetailer:
YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.

Подробнее в вики: https://2ch-ai.gitgud.site/wiki/tech/yolo/

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Lora_Trainer.ipynb

➤ Полезное

Расширение для фикса CLIP модели, изменения её точности в один клик и более продвинутых вещей, по типу замены клипа на кастомный: https://github.com/arenasys/stable-diffusion-webui-model-toolkit
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Подборка мокрописек для датасетов от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
NLP тэггер для кэпшенов T5: https://github.com/2dameneko/ide-cap-chan (gui), https://huggingface.co/Minthy/ToriiGate-v0.3 (модель), https://huggingface.co/2dameneko/ToriiGate-v0.3-nf4/tree/main (квант для врамлетов)

Оптимайзеры: https://2ch-ai.gitgud.site/wiki/tech/optimizers/
Визуализация работы разных оптимайзеров: https://github.com/kozistr/pytorch_optimizer/blob/main/docs/visualization.md

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Старая коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/badhands/makesomefuckingporn
https://rentry.org/ponyxl_loras_n_stuff - пони лоры
https://rentry.org/illustrious_loras_n_stuff - люстролоры

➤ Legacy ссылки на устаревшие технологии и гайды с дополнительной информацией

https://2ch-ai.gitgud.site/wiki/tech/legacy/

➤ Прошлые треды

https://2ch-ai.gitgud.site/wiki/tech/old_threads/

Шапка: https://2ch-ai.gitgud.site/wiki/tech/tech-shapka/
Пропущено 43 постов
9 с картинками.
Пропущено 43 постов, 9 с картинками.
Аноним 28/07/25 Пнд 19:01:22 1291301
>>1291283
Так, а насчет
>сделал фиксированный шум для каждого пика, а не как в ваниле рандом
Аноним 28/07/25 Пнд 19:14:22 1291323
>>1291283
а def mse_complex код какой?
Аноним 28/07/25 Пнд 19:15:45 1291324
1611184967974.png 39Кб, 1160x325
1160x325
1660682861281.png 18Кб, 889x158
889x158
>>1291301
Я при кешировании латентов шум генерю и потом только его использую, без генерации нового, у каждого латента свой фиксированный шум.
>>1291323
Выше писал же.
Новости об искусственном интеллекте №25 /news/ Аноним 25/07/25 Птн 19:21:11 1288371 Ответ
image.png 4095Кб, 1536x1024
1536x1024
В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1285009 (OP)
Пропущено 322 постов
59 с картинками.
Пропущено 322 постов, 59 с картинками.
Аноним 28/07/25 Пнд 18:57:02 1291295
photo2025-07-28[...].jpg 120Кб, 1280x1019
1280x1019
photo2025-07-28[...].jpg 111Кб, 1280x879
1280x879
GLM 4.5 — китайский опенсорс продолжает доминировать

Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.

Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.

Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.

Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.

Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.

Веса https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
Демо https://chat.z.ai/
Блогпост https://z.ai/blog/glm-4.5
Посттрейн фреймворк https://github.com/THUDM/slime
Аноним 28/07/25 Пнд 18:58:46 1291299
Аноним 28/07/25 Пнд 19:01:01 1291300
>>1291285
Ты дурачок какой-то.
Что ты там собираешься поворачивать куда, болезный.
Нужна только одна камера, мимо которой будут проносить продукты. Они все разного цвета блять. Просто не помещай одинаковый цвет рядом.
Вы что тупые что ли нахуй.
Музыкальный общий №14 /music/ Аноним 19/07/25 Суб 12:45:07 1282525 Ответ
17480043299600.mp4 8014Кб, 768x768, 00:03:10
768x768
17528514037500.mp4 3829Кб, 768x576, 00:03:12
768x576
17355909746070.mp4 7731Кб, 400x400, 00:03:08
400x400
♫ Udio ♫
https://www.udio.com/

Вышла версия 1.5 Allegro, по функционалу то же, что и 1.5, только в два раза быстрее. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.

♫ Suno ♫
https://app.suno.ai/ генерация на сайте
https://suno.ai/discord генерация на официальном discord-сервере
https://rentry.co/suno_tips советы по использованию

Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов

♫ Riffusion ♫
https://www.riffusion.com/

Новинка, по качеству звука на уровне Суно или чуть выше. Лучший по качеству генератор текстов на русском. Количество генераций в день не ограничено, но за некоторые функции нужно платить (загрузку аудио, стемов и т.д.)

https://www.riffusion.com/docs

Инструкция по применению, тегам и прочему на английском.

______________

Локальные модели:

1) Китайский YuE

https://github.com/multimodal-art-projection/YuE
https://github.com/joeljuvel/YuE-UI

Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.

2) ACE-Step

https://github.com/ace-step/ACE-Step

Вторая локалка, качеством получше.

Здесь демо-версия:
https://huggingface.co/spaces/ACE-Step/ACE-Step
______________

Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промпта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:

https://sonauto.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator

______________
Редакция трека после генерации (можно убрать вокал и оставить только инструментал и наоборот, убрать шумы и т.д.)

https://x-minus.pro/ai

______________
Напомню мега-сайт для сочинения аутентичных англоязычных текстов для ИИ-музыки в стиле известных групп и артистов от Пинк Флойда до Эминема. Зайти можно только через Дискорд.

https://codyai.cc/

Прошлый тред >>1253338 (OP)
Пропущено 172 постов
67 с картинками.
Пропущено 172 постов, 67 с картинками.
Аноним 28/07/25 Пнд 07:09:32 1290533
>>1290470

без пасскода покупки про версии в суно делать нечего. 3.5 версия сплошное говно в сравнении с риффужном генерит.
Аноним 28/07/25 Пнд 15:37:26 1290918
Сосонва, спасите! 4 акка юзаю на Суне, но только в одном v4 - бесплатная, на трех требует подписку. Хотя я гуглил, что 20 песен в v4 теперь для всех бесплатны. Подозреваю, что я проебал кнопку "let me in" в этом костыльном интерфейсе?
Аноним 28/07/25 Пнд 18:46:59 1291282
>>1290918
Они просто спалили,что эти все акки на одного челобека.
SimSwap обрел покой, да здравствует roop. Или rope. Или facefusion. /deepfake/ Аноним 13/11/23 Пнд 09:31:32 542826 Ответ
1640721795676.mp4 8051Кб, 1280x720, 00:00:36
1280x720
1600620075778.mp4 6304Кб, 720x1280, 00:00:15
720x1280
SimSwap стал спящей красавицей, любая движуха с ним заморожена на неопределенный срок, отдаём дань почести тут: https://docs.google.com/document/d/1ZFHXtjR02oEVL2nrru4hTFQJ4BQt4vCNr0JNzFLZ-aE/edit?usp=sharing

Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.

Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.

Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.

Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить его на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
Пропущено 452 постов
69 с картинками.
Пропущено 452 постов, 69 с картинками.
Аноним 28/07/25 Пнд 01:45:11 1290491
бумп
Аноним 28/07/25 Пнд 12:25:06 1290725
изображение.png 4322Кб, 1744x2048
1744x2048
>>1289405
Из недостатков:
Модель много чего не знает, многих поз нет, по анатомии проёбы. Сиськи-письки - всё грустно. Сложные эдиты - рассыпаются. Есть какая-то невнятная цензура на уровне текста, которая может включиться на совсем отстранённых промптах, а может наоборот внезапно не включиться на промтпе "теперь она голая в бане".
Модель непостоянна, на одном и том же промпте она может всё в корне перерисовать с другими лицами, сделать корявый инпейнт одного участка или просто чуть осветлить кадр. Результат очень сильно зависит от входного и выходного разрешения.

Из бонусов: Ну это первая локальная омнимодель которая работает, жри что дают. Не умеет рисовать сиськи? Кладёшь в референсные изображения сиськи, и она начнёт их рисовать. Правишь два слова в промпте, генеришь 4 результата, правишь разрешение, кроп референса, снова генеришь 4 результата. Добился более-менее сносного результата - генеришь с апскейлом, черипикаешь результаты. Так и живёшь.
Аноним 28/07/25 Пнд 17:13:26 1291126
nf
3D AI /3d/ Аноним 24/04/25 Чтв 15:55:36 1173113 Ответ
image 384Кб, 686x386
686x386
image 1147Кб, 1280x720
1280x720
image 646Кб, 1383x701
1383x701
image 5736Кб, 2824x1588
2824x1588
Пропущено 288 постов
109 с картинками.
Пропущено 288 постов, 109 с картинками.
Аноним 27/07/25 Вск 22:26:18 1290344
Гайд для вкатывальщика в инди можно?
Аноним 28/07/25 Пнд 06:51:56 1290531
Какая сейчас локальная модель лучшая? Спарк тут хвалят, но он вроде онлайн онли
Аноним 28/07/25 Пнд 15:22:21 1290886
>>1290531
Все локалки пока говно. Жди.
Онлайн генерация картинок №2 /image/ Аноним 21/05/25 Срд 16:57:33 1210619 Ответ
17463796110101.png 1522Кб, 1024x1024
1024x1024
17390379240222.jpg 1010Кб, 896x1280
896x1280
17430673013900.jpg 440Кб, 1024x1024
1024x1024
17389399632032.webp 305Кб, 1024x1024
1024x1024
Общий тред для изображений, созданных с помощью онлайн ИИ-генерации.

Из России большинство сервисов напрямую недоступно.

Dall-E
https://bing.com/images/create/
https://www.cici.com (ищем бота ACO)

Imagen
https://labs.google/fx/tool/image-fx а также https://labs.google/fx/tools/whisk (доступны только в США, Кении, Новой Зеландии и Австралии)
https://gemini.google.com/app

Reve
https://preview.reve.art/app

GPT-4o
http://chatgpt.com/
https://sora.chatgpt.com/explore

Stable Diffusion и прочие
https://civitai.com/generate
https://dreamina.capcut.com/
https://ideogram.ai
https://www.meta.ai
https://ximagegenerator.com
https://www.recraft.ai
https://app.klingai.com/global/text-to-image/new
https://hailuoai.video/create
https://lumaphoton.com
https://leonardo.ai/
https://aistudio.google.com/prompts/new_chat (модель Gemini image)
https://tensor.art
https://getimg.ai/text-to-image
https://www.mage.space/
https://problembo.com/ru
https://deepai.org/machine-learning-model/text2img
https://dezgo.com/
https://dream.ai/create
https://www.krea.ai/

Дополнительные сервисы:
https://www.pixited.com/ - библиотека промптов с примерами
https://rentry.org/From-4ch-To-2ch-Dall-3-Prompts - сборник промптов
https://www.stylar.ai - AI-редактор картинок (дорисовка, инпейнт, работа с лицами)
https://astica.ai - сборник ИИ-сервисов, в частности довольно мощный де-промптер (Vision AI -> Describe and Caption)
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2 - де-промптер, разбирающий вброшенный пик на теги
https://bigjpg.com/ - апскейлер до 4096х4096
https://runwayml.com/ , https://www.stablevideo.com - анимирование генераций

Предыдущий тред: >>1042275 (OP)
Пропущено 199 постов
105 с картинками.
Пропущено 199 постов, 105 с картинками.
Аноним 25/07/25 Птн 18:41:25 1288303
>>1287765
Если ты ущерб не способный прочитать шапку треда - нигде.
Аноним 27/07/25 Вск 11:40:36 1289763
>>1285140
Как заставить чатгпт использовать собственный генератор изображений, который 4о, а не генерить через далл-е?
Аноним 28/07/25 Пнд 13:34:45 1290760
Nf
ChatGPT-тред №20 /chatgpt/ Аноним 13/06/25 Птн 17:20:47 1244803 Ответ
изображение.png 37Кб, 558x611
558x611
изображение.png 88Кб, 1330x1149
1330x1149
изображение.png 1161Кб, 721x1081
721x1081
изображение.png 16Кб, 795x206
795x206
Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и Венеры Милосской и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий сбой
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>1125882 (OP)
Пропущено 100 постов
37 с картинками.
Пропущено 100 постов, 37 с картинками.
Аноним 27/07/25 Вск 22:51:19 1290361
>>1290183
>С генерацией так вообще пиздец, даже бабу в купальнике нарисовать не может.
Эм, тут выше в треде голых сисек навалом. Скил ишью.
Аноним 28/07/25 Пнд 10:47:53 1290628
>>1290361
Мускулистые монстры (с очевидно взломанного акка) не в счет.
Аноним 28/07/25 Пнд 13:10:11 1290741
>>1290628
>Мускулистые монстры
Бабы как бабы. Ты там детей что ли лепишь? Это да, тебе никто не выдаст.
>с очевидно взломанного акка
Чего блядь? Что и кем взломано? ОП-пик сделан с обычного акка в один заход, никаких взломов, джейлов и прочего.
Моча, это перенос треда в релевантную доску Аноним 01/04/25 Втр 19:46:53 1125317 Ответ
image.png 329Кб, 477x596
477x596
Сап двач, я художник. И это мой сопливый свинарник нытья.

Ну вот и настали времена, когда Ai меня заменил.
У меня уиихрю заказов с конца февраля, при том что мой ценник $40 за фуллбади арт с фоном, а второй персонаж стоит дополнительные $20. Т.е. скидка 50% если берёшь арт с двумя.
Моё объявление о наборе новых заказов пылится на сайтах и почти никто на него не откликается, а пришедшие говорят что $40 это дорого и лучше найдут подешевле или вообще сгенерируют в Stable Diffusion сами. Надо мной открыто насмехаются что ИИ уже давно рисует лучше меня и что мне стоит найти реальную работу.
В отчаянных Симпл-Димплках найти новые заказы я нарисовал уже всевозможных популярных персонажей из Геншин импакта, Наруто, Блича, Геройской академии, Демон слеера, Фрирен, Хай скул ДХД, Джуджутсу кайсен, Фейри тейл и даже ебучего Чёрного клевера.
Я собираю тысячи лайков и ретвитов, но никакой радости от них уиихрю, потому что я не могу ими заплатить за квартиру и купить себе пожрать.
Всё что я получаю за свои старания - жалкие 4-5к лайков, которые ни стоят ни-ху-я.

Ещё несколько лет назад я был нужен и обожаем, меня ретвитили крутые художники, мои комменты разрывались от восхищения моих подписчиков, они активно обсуждали мои арты и голосовали в опросниках кого я рисую следующей, а сейчас комментарии - это пара смайликов, собравшаяся за годы база хейтеров, их насмешки и то что мой стиль уже как-то приелся. Кто-то вообще советует мне поучиться рисовать у Ai, потому что там и цвета сочнее и динамика живая, пишут мне что мой шейдинг стал какой-то грязный.

Блять, я не хочу работать на рабской работе на Кабаныча, я просто сидел рисовал и хотел чтобы так было всегда. Почему всё всегда меняется в худшую сторону? Как только тебе кажется что всё безмятежно и беспокоиться не о чем, обязательно кто-то обосрёт всё.
Сбережений мне хватит ещё на полгода, а потом придётся устраиваться на ирл работу.

Есть тут ещё кто несправедливо заменённый искусственным интеллектом?
Пропущено 56 постов
6 с картинками.
Пропущено 56 постов, 6 с картинками.
Аноним 26/07/25 Суб 07:25:31 1288753
>>1287678
Каждые 10 лет +1 миллиард потребителей, тебе мало?
Аноним 28/07/25 Пнд 10:23:36 1290604
>>1287678
Ну,я хз кто основной заказчик,но различные извращенцы не переведутся,а это бесконечный спрос.
Аноним 28/07/25 Пнд 12:17:19 1290723
1000010902.mp4 3571Кб, 490x480, 00:03:34
490x480
Буквально видрил.
AI Chatbot General № 712 /aicg/ Аноним 27/07/25 Вск 10:42:55 1289696 Ответ
1630196441109.png 1144Кб, 1808x1182
1808x1182
17534576865570.png 427Кб, 892x1143
892x1143
originaldrawnby[...].png 1891Кб, 848x1200
848x1200

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• grok-4-0709 вышел на xAI API - https://docs.x.ai/docs/models/grok-4-0709

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид)
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Agnai: https://agnai.chat/
• Risu: https://risuai.xyz/
• Adventure-UI: https://rentry.co/CYOA_AdventureUI
• Cavern: https://github.com/Barbariskaa/Cavern

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• Grok: https://docs.x.ai/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Бургерский список: https://rentry.org/jb-listing
• Тредовский список: https://rentry.org/2ch-aicg-jb

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://rentry.org/meta_botmaking_list | https://rentry.co/card_theory
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3
• Бургерские боты: https://rentry.org/meta_bot_list

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• Арена: https://beta.lmarena.ai/
• OpenRouter: https://openrouter.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude
• Чекер ключей: https://github.com/kingbased/keychecker
• OAI Прокси: https://gitgud.io/reanon/nonono/

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives3
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1277147 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg 

Прошлый тред: >>1286097 (OP)
Набор в модерацию: >>1289389 (OP)

Пропущено 906 постов
99 с картинками.
Пропущено 906 постов, 99 с картинками.
Аноним 28/07/25 Пнд 19:17:35 1291328
>>1291325
Да нихуя других не засирают а как только Мерчант карту выпускает сразу под микроскопом ищут слоп. Вон ремиксер гритинги хуярит лоботомитом всем похуй хвалят
Аноним 28/07/25 Пнд 19:17:54 1291331
a.mp4 1491Кб, 1280x720, 00:00:01
1280x720
>мерчант не будет кидать карточки
Это плохо?
Аноним 28/07/25 Пнд 19:18:33 1291333
Мерчант обиделся что кто-то все делает карточки лучше чем он
Голосовых нейронок тред (TTS, STS, STT) #7 speech /speech/ Аноним 16/02/25 Вск 12:20:27 1055411 Ответ
17019563860200.mp4 477Кб, 396x298, 00:00:23
396x298
17074247947820.mp4 2886Кб, 384x480, 00:00:08
384x480
17204507036820.mp4 310Кб, 576x576, 00:00:14
576x576
17099193437742.mp4 1356Кб, 438x480, 00:00:58
438x480
Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >> https://2ch.hk/ai/res/664162.html

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc
Если тыква вместо видеокарты, можно тренить в онлайне: https://www.kaggle.com/code/varaslaw/rvc-v2-no-gradio-https-t-me-aisingers-ru/notebook?scriptVersionId=143284909 (инструкция: https://www.youtube .com/watch?v=L-emE1pGUOM )

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды вариант: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/
Пропущено 194 постов
41 с картинками.
Пропущено 194 постов, 41 с картинками.
Аноним 26/07/25 Суб 20:00:17 1289268
А что на данный момент, по поводу говорилок в реальном времени? Что сейчас самое передовое и адекватное?
Аноним 27/07/25 Вск 01:44:41 1289553
01.mp4 6398Кб, 512x384, 00:01:39
512x384
Аноним 27/07/25 Вск 13:40:29 1289882
Нейродвача и искуственных борд тред Аноним 25/10/24 Птн 02:25:56 930555 Ответ
14e22878c864bab[...].png 859Кб, 1920x2516
1920x2516
image.png 849Кб, 1920x1968
1920x1968
Недавно в бредаче всплыл интересный тред посвященный генератору постов двача на основе ИИ. И генератор совершенно не хуйня и он вполне себе хорошо копирует слог среднего анона и даже превосходит его. "Аноны" метко подшучивают над опом и темой его поста и если развитие проектов такого типа продолжиться то каждый "анон" в сгенереном треде будет иметь свое мнение и личность и можно будет уже самому с ними посраться, появятся шизы. Хочу создать тред исключительно по данной теме, если это продвинется дальше то каждый сможет иметь свой офлайн двач с куклами, пони, бесконечными консолесрачами и постами в стиле того самого без всяких новомодных течений. Можно будет вернуться в любую эпоху и имитировать даже несуществующие эпохи двача типа если бы двач существовал при царе Рюрике, Сталине и тд. Все приведено естественно как пример. Также реквестирую в тред любые материалы по теме генерации борд в режиме реального времени если они у вас имеются.

Генератор тредшотов: https://glif.app/@Meson/glifs/cm2e1w1g300024yvf141n7ot0

https://arhivach.xyz/thread/1084063/
Пропущено 180 постов
116 с картинками.
Пропущено 180 постов, 116 с картинками.
Аноним 30/06/25 Пнд 08:00:38 1259917
image.png 1126Кб, 1920x3152
1920x3152
Аноним 15/07/25 Втр 23:25:57 1278498
image.png 1030Кб, 1920x3018
1920x3018
Аноним 27/07/25 Вск 04:55:14 1289615
image.png 850Кб, 1920x2676
1920x2676
Гугл колаб тред 1 свою нейронку делаю Аноним # OP 20/07/25 Вск 18:08:13 1283707 Ответ
Без имени.jpg 11Кб, 299x168
299x168
Хочу сделать своюб нейронку обученную на текстах великих мыслителей(выкачаю оптом сабы с некоторых ютуб каналов и дам их для обучения)

Вот пример текстов которые в нейронку всуну:
бульба престолов,Вихорьков,юрий нестеренко,Денис Чернухин,Абдуловера ну и прочие людишки смешные, мб ещё классики нафигачу и тд
Просто кучу ткст файлов кинуть планирую надеюсь норм сработает

Собсна 2 темы
1)Как впринципен пользоваться гугл колабом чтоб такое сделать я ниче не умею, минимум интеллекта у меня
2)Норм ли это сработает каких людишек мне лучше ещё вставить? порекомендуйте чтоб интереснее вышли текста
Пропущено 2 постов
2 с картинками.
Пропущено 2 постов, 2 с картинками.
Аноним 24/07/25 Чтв 01:42:30 1286723
>>1283707 (OP)
да чел ты не научишь её особо, такое лучше в контекст хорошей нейронки по апи запихнуть.
Аноним 25/07/25 Птн 21:45:11 1288532
>>1286723
>>1284117
Пообщался с нейронкой по итогу нашел бесплатную на 1 млн токенов в гугл колабе, этого конечно на все не хватит но для теста сойдет

Ещё пока хз как нейронку с колаба в инет вывести на сайт какой нить
Аноним 26/07/25 Суб 07:27:57 1288755
image.png 104Кб, 262x193
262x193
>>1288532
Не пеши больше в этот раздел.
Какой то богатый чел запустил конкурс на суно на лучший ремикс на его (говно)песню. В целом песня не Аноним 25/07/25 Птн 22:25:21 1288554 Ответ
IMG202507110952[...].jpg 221Кб, 1024x1024
1024x1024
Какой то богатый чел запустил конкурс на суно на лучший ремикс на его (говно)песню. В целом песня не плоха (в музыкальном смысле) но это не его заслуга. Я переписал текст, чтобы сделать его в тему конкурса.
https://suno.com/s/P430ZGT8SOWiu70w
Если кто в теме, делайте свои ремиксы, отхуесосим их вместе.
Новости об искусственном интеллекте №24 /news/ Аноним 21/07/25 Пнд 23:49:07 1285009 Ответ
image.png 2403Кб, 1024x1024
1024x1024
В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1281238 (OP)
Пропущено 513 постов
91 с картинками.
Пропущено 513 постов, 91 с картинками.
Аноним 25/07/25 Птн 19:21:30 1288373
Аноним 25/07/25 Птн 19:53:52 1288426
>>1288346
Скорей всего это правда, Нефритовый Стержень могучий много миска риса, если совки смогли через евреев похитить атомную бонбу, то КНР сам конфуций велел через евреев похитить ИИ. Тащемто, былри кукареки сенатора о том, что ЛЛАМА это гос.измена, когда дипсик высрался.
Аноним 28/07/25 Пнд 15:47:08 1290929
>>1285144
>а с экспертной системой
с тупым ёбаным попугаем, примерно помнящим энциклопедию.
Ты слишком недалёк, чтобы поохуевать с того, насколько слабо эта система ушла от чатбота 90х, работавшего на ключевых словах.
Лоадинг, плис вейт...
Настройки X
Ответить в тред X
20Мб / 4 файла / 15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов
⚡Пасскод можно купить только через Telegram - Купить пасскодX