/ai/ - Искусственный интеллект

Набор в модерацию ## Mod ## 26/07/25 Суб 21:22:15 № 1289389 Ответ

ayasemomodandad[...].jpg 18644Кб, 8192x4096

В разделе проходит набор в модерацию.

Кто желает следить за порядком на доске, чувствует в себе силы и готов принять на себя эту ответственность — присылайте свою анкету на vilka@2ch.hk. В ней нужно рассказать о себе, сколько вы сидите в день на доске, указать свои посты, а также контакт в дискорде/телеграмме для будущей связи.

В тред Скрыть

Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 № 299474 Ответ

fde636c44dae155[...].jpg 294Кб, 1000x600

Общее

Новости ИИ Исследование ИИ Этика ИИ Личных достижений тред

Stable Diffusion

Stable Diffusion общий Аниме арты Технотред (обучение моделей) Обмен моделями

Прочая графика

Генерация 3D-моделей ИИ-видео общий Общий Картиночный Midjourney Дипфейки Заработка/площадок тред

Текст

AI Chatbot General Локальные языковые модели ChatGPT Claude

Звук

Музыкальный общий Голосовой общий

Если вы хотите задать какой-то мелкий вопрос - используйте для этого данный тред или найдите профильный треде в каталоге.

Утонувшие треды помещаются в архив.

О разделе:

1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.

2. AICG тред перекатывается после достижения предела в 1500 постов.

3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.

4. Это раздел преимущественно технического направления. Для откровенного NSFW-контента выделена отдельная доска - /nf/, эротика остаётся в /ai/. Так, порнография и голые мужики теперь отправляются в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.

Пропущено 1497 постов
261 с картинками.

В тред Скрыть

Пропущено 1497 постов, 261 с картинками.

Аноним 28/07/25 Пнд 13:12:52 № 1290743

Есть локальные модели для создания 3д моделек на основе 2д пикч?
Вобще не знал что такое есть но вот наткнулся на meshy.ai но это платная хуйня

Аноним 28/07/25 Пнд 14:07:59 № 1290796

>>1290391
>Все будут только апишки дёргать
Не всем команиям можно дёргать апишки, тем более зарубежные (пример- любой банк). Куча дотируемого импортозамещения "смотрите как мы можем". Просто понт и пиар.
Ну и главное- заточку под конкретную задачу никто не подебит даже 100500B нейронкой на кластере размером с материк.
>>1290743
Дофига, гугли. Качество предсказуемое говно.

Аноним 28/07/25 Пнд 18:49:47 № 1291286

аноны, кто курсором пользуется, нужна ваша помощь. мне курсор нужен только для одной вещи, вставлять патчи в код, какие-то куски заменять, функции, строчки, и вот таких правок в одном скрипте файле может быть с десяток, по сути все что я закидываю в курсор это промт вроде замени такое то на этой строчке, такую функцию в этом месте и так далее. хватало их бесплатной версии с головой с их auto моделью. а сейчас они все порезали и вручную меня ломает уже рыться в коде и вносить правки такого рода, где просто копи паст.
есть ли какие-то аналоги бесплатные или может можно апи подключить чье-нибудь, возможно с максимально тупыми моделями? достаточно чтобы просто модель могла понять куда и что вставить и не ломалась на коде в 1к строк.

Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №150 /llama/ Аноним 25/07/25 Птн 19:56:56 № 1288430 Ответ

Эффективность к[...].png 92Кб, 1399x1099

Реальная длина [...].png 481Кб, 1520x2266

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Базы треда не существует, каждый дрочит как он хочет. Базашизика дружно репортим.

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_2025 (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1283995 (OP)
>>1280475 (OP)

Пропущено 400 постов
55 с картинками.

В тред Скрыть

Пропущено 400 постов, 55 с картинками.

Аноним 28/07/25 Пнд 18:25:20 № 1291259

>>1291210
>да как бы нифига не 0.2...
Это был сарказм. на гите текущий релиз - v2.1.3 вообще.
Типа - нолик спереди потерялся. :)

>> вторая картинка
>Ахахаххаха, чот поломалось.
Там основное обращение Chat Completion - и модель должна такое понимать (все что 24B+ свежее - понимает), и структура приема ответа от модели должна правильно сформирована (это уже в самом flow). Эти куски должны были быть забраны в переменные, для использования в дополнительных запросах к модели, а не выкинуты вывод чата. И еще - эти куски не нужно на русский переводить. (Системные промпты не нужно - нужно то, что касается персонажей и окружения.)

Вообще - там есть и режим Text Completion - но он куцый, и скорее на отъебись добавлен.

Аноним 28/07/25 Пнд 18:57:55 № 1291297

>>1291259
Та не, пошаманил ещё с флоу, теперь норм работает, просто именно тогда чот прям поломалось. Но да, прям видно что альфа.

Агента-форматтера выкинул правда.

У меня анализ - планирование - сторителлер.

Аноним 28/07/25 Пнд 19:17:58 № 1291332

Анонасики, а может кто-то объяснить как правильно строить входящее сообщение для модели, чтобы она красиво и интересно отыгрывала не залупливаясь? Хочу научиться делать правильные реквесты а не просто "юсер поднял пульт от телевизора и пернул" и ждать что модель сама придумает на этой основе. Кто-то в треде упоминал тредовичка и его логи, то как он грамотно выстраивает сообщения, но я слепое чмо и потерялся уже в паре сообщений и не могу теперь найти эти примеры.

Anime Diffusion #220 /nai/ Аноним 22/07/25 Втр 23:05:49 № 1285801 Ответ

Генерируем тяночек!

Прошлый тред: >>1275904 (OP) https://arhivach.vc/thread/1209212/

Схожие тематические треды
• SD-тред (не аниме): >>1269943 (OP)
• Технотред: >>1272560 (OP)
• Фурри-тред: https://2ch.hk/fur/res/374311.html

FAQ
https://2ch-ai.gitgud.site/wiki/nai

Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci

Пропущено 384 постов
137 с картинками.

В тред Скрыть

Пропущено 384 постов, 137 с картинками.

Аноним 28/07/25 Пнд 18:56:02 № 1291294

Причина вайпа?

Аноним 28/07/25 Пнд 19:05:55 № 1291306

>>1291227
Так и есть. Просто очередной мерж.

Аноним 28/07/25 Пнд 19:17:48 № 1291330

Stable Diffusion тред X+162 /sd/ Аноним 21/07/25 Пнд 13:40:13 № 1284303 Ответ

Тред локальной генерации

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Приложение Forge https://github.com/lllyasviel/stable-diffusion-webui-forge
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

Промпт должен быть кратким для SDXL и поэма для Flux и SD3.5, негативы обычно вредны.

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД

• Flux Kontext в открытом доступе.
• Генерация картинок на Wan.
• NAG (негативный промпт на моделях с 1 CFG)
• Chroma
• Flux dev и schnell;
• Лора DMD2 для SDXL ускоряет в 2 раза. Пример: 10 шагов, семплер LCM, шедулер beta, 832x1216,
CFG 1 для обычных SDXL https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI, Fooocus, webui-forge, InvokeAI

► Предыдущий тред >>1269943 (OP) ► https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03

Пропущено 372 постов
149 с картинками.

В тред Скрыть

Пропущено 372 постов, 149 с картинками.

Аноним 28/07/25 Пнд 19:12:47 № 1291319

>>1291312
Не пробовал, но судя по тому, что в прошлом (или этом) треде выкладывали, он таки остальное трогает. Или его просто не правильно использовали?

Аноним 28/07/25 Пнд 19:17:31 № 1291327

>>1291278
я же говорю что ты долбаёб, иди нахуй.

Аноним 28/07/25 Пнд 19:17:43 № 1291329

ИИ-видео №12 /video/ Аноним 25/07/25 Птн 14:45:10 № 1287986 Ответ

m2-res854p.mp4 1347Кб, 480x854, 00:00:10

17526284309860.mp4 2650Кб, 1024x576, 00:00:16

Liquid Death AI[...].mp4 16183Кб, 1280x720, 00:01:01

Генерируем свое (и постим чужое) в Hunyuan, Wan, Veo3, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.

1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAI

https://openai.com/sora/

4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 4

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/

10. Veo3 от Google

https://deepmind.google/models/veo/

Сайты, где можно попробовать генерации на разных моделях

https://nim.video/
https://pollo.ai/
https://www.florafauna.ai/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1

3. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты
Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1270014 (OP)

Пропущено 92 постов
17 с картинками.

В тред Скрыть

Пропущено 92 постов, 17 с картинками.

Аноним 28/07/25 Пнд 19:05:48 № 1291305

>>1291288
А если без хайноза делать, только лоунойз с одним семплером. Какой будет результат?

Аноним 28/07/25 Пнд 19:11:58 № 1291318

>>1291276
Для текстовых есть тред: >>1288430 (OP)
Там проще в том смысле, что чем больше видеопамяти, тем более умную нейронку можно запхнуть, при этом, у тебя лимита верхнего почти нет (ну, терабайт с лишним сойдет как лимит?).
3090 24 > 5060ti 16 в полтора раза по объему как минимум, тут вообще нечего обсуждать.

Аноним 28/07/25 Пнд 19:16:46 № 1291326

>>1291305
А если тебе два яйца отрезать и только хуй оставить какой будет результат?

Stable Diffusion технотред #20 /tech/ Аноним 11/07/25 Птн 04:39:36 № 1272560 Ответ

diffusion proce[...].png 358Кб, 2546x1822

lr.png 252Кб, 1853x624

performance cha[...].webp 53Кб, 1200x900

ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>1118663 (OP)

➤ Софт для обучения

https://github.com/kohya-ss/sd-scripts
Набор скриптов для тренировки, используется под капотом в большей части готовых GUI и прочих скриптах.
Для удобства запуска можно использовать дополнительные скрипты в целях передачи параметров, например: https://rentry.org/simple_kohya_ss

https://github.com/bghira/SimpleTuner Линукс онли, бэк отличается от сд-скриптс

https://github.com/Nerogar/OneTrainer Фич меньше, чем в сд-скриптс, бэк тоже свой

➤ GUI-обёртки для sd-scripts

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts

➤ Обучение SDXL

https://2ch-ai.gitgud.site/wiki/tech/sdxl/

➤ Flux

https://2ch-ai.gitgud.site/wiki/nai/models/flux/

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

✱ LoRA – "Low Rank Adaptation" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением. https://github.com/cloneofsimo/lora - изначальная имплементация алгоритма, пришедшая из мира архитектуры transformers, тренирует лишь attention слои, гайды по тренировкам:
https://rentry.co/waavd - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_hard_LoRA_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

✱ LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - проект по созданию алгоритмов для обучения дополнительных частей модели. Ранее имел название LoCon и предлагал лишь тренировку дополнительных conv слоёв. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr, DyLoRA, IA3, а так же на последних dev ветках возможность тренировки всех (или не всех, в зависимости от конфига) частей сети на выбранном ранге:
https://github.com/KohakuBlueleaf/LyCORIS

Подробнее про алгоритмы в вики https://2ch-ai.gitgud.site/wiki/tech/lycoris/

✱ Dreambooth – для SD 1.5 обучение доступно начиная с 16 GB VRAM. Ни одна из потребительских карт не осилит тренировку будки для SDXL. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://rentry.co/lycoris-and-lora-from-dreambooth (англ.)
https://github.com/nitrosocke/dreambooth-training-guide (англ.) https://rentry.org/lora-is-not-a-finetune (англ.)

✱ Текстуальная инверсия (Textual inversion), или же просто Embedding, может подойти, если сеть уже умеет рисовать что-то похожее, этот способ тренирует лишь текстовый энкодер модели, не затрагивая UNet:
https://rentry.org/textard (англ.)

➤ Тренировка YOLO-моделей для ADetailer:
YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.

Подробнее в вики: https://2ch-ai.gitgud.site/wiki/tech/yolo/

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Lora_Trainer.ipynb

➤ Полезное

Расширение для фикса CLIP модели, изменения её точности в один клик и более продвинутых вещей, по типу замены клипа на кастомный: https://github.com/arenasys/stable-diffusion-webui-model-toolkit
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Подборка мокрописек для датасетов от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
NLP тэггер для кэпшенов T5: https://github.com/2dameneko/ide-cap-chan (gui), https://huggingface.co/Minthy/ToriiGate-v0.3 (модель), https://huggingface.co/2dameneko/ToriiGate-v0.3-nf4/tree/main (квант для врамлетов)

Оптимайзеры: https://2ch-ai.gitgud.site/wiki/tech/optimizers/
Визуализация работы разных оптимайзеров: https://github.com/kozistr/pytorch_optimizer/blob/main/docs/visualization.md

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Старая коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/badhands/makesomefuckingporn
https://rentry.org/ponyxl_loras_n_stuff - пони лоры
https://rentry.org/illustrious_loras_n_stuff - люстролоры

➤ Legacy ссылки на устаревшие технологии и гайды с дополнительной информацией

https://2ch-ai.gitgud.site/wiki/tech/legacy/

➤ Прошлые треды

https://2ch-ai.gitgud.site/wiki/tech/old_threads/

Шапка: https://2ch-ai.gitgud.site/wiki/tech/tech-shapka/

Пропущено 43 постов
9 с картинками.

В тред Скрыть

Пропущено 43 постов, 9 с картинками.

Аноним 28/07/25 Пнд 19:01:22 № 1291301

>>1291283
Так, а насчет
>сделал фиксированный шум для каждого пика, а не как в ваниле рандом

Аноним 28/07/25 Пнд 19:14:22 № 1291323

>>1291283
а def mse_complex код какой?

Аноним 28/07/25 Пнд 19:15:45 № 1291324

1611184967974.png 39Кб, 1160x325

1660682861281.png 18Кб, 889x158

>>1291301
Я при кешировании латентов шум генерю и потом только его использую, без генерации нового, у каждого латента свой фиксированный шум.
>>1291323
Выше писал же.

Новости об искусственном интеллекте №25 /news/ Аноним 25/07/25 Птн 19:21:11 № 1288371 Ответ

В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1285009 (OP)

Пропущено 322 постов
59 с картинками.

В тред Скрыть

Пропущено 322 постов, 59 с картинками.

Аноним 28/07/25 Пнд 18:57:02 № 1291295

photo2025-07-28[...].jpg 120Кб, 1280x1019

photo2025-07-28[...].jpg 111Кб, 1280x879

GLM 4.5 — китайский опенсорс продолжает доминировать

Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.

Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.

Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.

Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.

Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.

Веса https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
Демо https://chat.z.ai/
Блогпост https://z.ai/blog/glm-4.5
Посттрейн фреймворк https://github.com/THUDM/slime

Аноним 28/07/25 Пнд 18:58:46 № 1291299

>>1291295
Хорошее лого

Аноним 28/07/25 Пнд 19:01:01 № 1291300

>>1291285
Ты дурачок какой-то.
Что ты там собираешься поворачивать куда, болезный.
Нужна только одна камера, мимо которой будут проносить продукты. Они все разного цвета блять. Просто не помещай одинаковый цвет рядом.
Вы что тупые что ли нахуй.

Музыкальный общий №14 /music/ Аноним 19/07/25 Суб 12:45:07 № 1282525 Ответ

17480043299600.mp4 8014Кб, 768x768, 00:03:10

17528514037500.mp4 3829Кб, 768x576, 00:03:12

17355909746070.mp4 7731Кб, 400x400, 00:03:08

♫ Udio ♫
https://www.udio.com/

Вышла версия 1.5 Allegro, по функционалу то же, что и 1.5, только в два раза быстрее. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.

♫ Suno ♫
https://app.suno.ai/ генерация на сайте
https://suno.ai/discord генерация на официальном discord-сервере
https://rentry.co/suno_tips советы по использованию

Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов

♫ Riffusion ♫
https://www.riffusion.com/

Новинка, по качеству звука на уровне Суно или чуть выше. Лучший по качеству генератор текстов на русском. Количество генераций в день не ограничено, но за некоторые функции нужно платить (загрузку аудио, стемов и т.д.)

https://www.riffusion.com/docs

Инструкция по применению, тегам и прочему на английском.

______________

Локальные модели:

1) Китайский YuE

https://github.com/multimodal-art-projection/YuE
https://github.com/joeljuvel/YuE-UI

Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.

2) ACE-Step

https://github.com/ace-step/ACE-Step

Вторая локалка, качеством получше.

Здесь демо-версия:
https://huggingface.co/spaces/ACE-Step/ACE-Step
______________

Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промпта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:

https://sonauto.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator

______________
Редакция трека после генерации (можно убрать вокал и оставить только инструментал и наоборот, убрать шумы и т.д.)

https://x-minus.pro/ai

______________
Напомню мега-сайт для сочинения аутентичных англоязычных текстов для ИИ-музыки в стиле известных групп и артистов от Пинк Флойда до Эминема. Зайти можно только через Дискорд.

https://codyai.cc/

Прошлый тред >>1253338 (OP)

Пропущено 172 постов
67 с картинками.

В тред Скрыть

Пропущено 172 постов, 67 с картинками.

Аноним 28/07/25 Пнд 07:09:32 № 1290533

>>1290470

без пасскода покупки про версии в суно делать нечего. 3.5 версия сплошное говно в сравнении с риффужном генерит.

Аноним 28/07/25 Пнд 15:37:26 № 1290918

Сосонва, спасите! 4 акка юзаю на Суне, но только в одном v4 - бесплатная, на трех требует подписку. Хотя я гуглил, что 20 песен в v4 теперь для всех бесплатны. Подозреваю, что я проебал кнопку "let me in" в этом костыльном интерфейсе?

Аноним 28/07/25 Пнд 18:46:59 № 1291282

>>1290918
Они просто спалили,что эти все акки на одного челобека.

SimSwap обрел покой, да здравствует roop. Или rope. Или facefusion. /deepfake/ Аноним 13/11/23 Пнд 09:31:32 № 542826 Ответ

1600620075778.mp4 6304Кб, 720x1280, 00:00:15

SimSwap стал спящей красавицей, любая движуха с ним заморожена на неопределенный срок, отдаём дань почести тут: https://docs.google.com/document/d/1ZFHXtjR02oEVL2nrru4hTFQJ4BQt4vCNr0JNzFLZ-aE/edit?usp=sharing

Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.

Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.

Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.

Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить его на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.

Пропущено 452 постов
69 с картинками.

В тред Скрыть

Пропущено 452 постов, 69 с картинками.

Аноним 28/07/25 Пнд 01:45:11 № 1290491

бумп

Аноним 28/07/25 Пнд 12:25:06 № 1290725

>>1289405
Из недостатков:
Модель много чего не знает, многих поз нет, по анатомии проёбы. Сиськи-письки - всё грустно. Сложные эдиты - рассыпаются. Есть какая-то невнятная цензура на уровне текста, которая может включиться на совсем отстранённых промптах, а может наоборот внезапно не включиться на промтпе "теперь она голая в бане".
Модель непостоянна, на одном и том же промпте она может всё в корне перерисовать с другими лицами, сделать корявый инпейнт одного участка или просто чуть осветлить кадр. Результат очень сильно зависит от входного и выходного разрешения.

Из бонусов: Ну это первая локальная омнимодель которая работает, жри что дают. Не умеет рисовать сиськи? Кладёшь в референсные изображения сиськи, и она начнёт их рисовать. Правишь два слова в промпте, генеришь 4 результата, правишь разрешение, кроп референса, снова генеришь 4 результата. Добился более-менее сносного результата - генеришь с апскейлом, черипикаешь результаты. Так и живёшь.

Аноним 28/07/25 Пнд 17:13:26 № 1291126

nf

3D AI /3d/ Аноним 24/04/25 Чтв 15:55:36 № 1173113 Ответ

В этом треде обсуждаем нейронки генерящие 3д модели, выясняем где это говно можно юзать, насколько оно говно, пиплайны с другими 3д софтами и т.д., вангуем когда 3д-мешки с говном останутся без работы.

https://3d.hunyuan.tencent.com/
https://github.com/VAST-AI-Research/TripoSG
https://stable-x.github.io/Hi3DGen/

Пропущено 288 постов
109 с картинками.

В тред Скрыть

Пропущено 288 постов, 109 с картинками.

Аноним 27/07/25 Вск 22:26:18 № 1290344

Гайд для вкатывальщика в инди можно?

Аноним 28/07/25 Пнд 06:51:56 № 1290531

Какая сейчас локальная модель лучшая? Спарк тут хвалят, но он вроде онлайн онли

Аноним 28/07/25 Пнд 15:22:21 № 1290886

>>1290531
Все локалки пока говно. Жди.

Онлайн генерация картинок №2 /image/ Аноним 21/05/25 Срд 16:57:33 № 1210619 Ответ

Общий тред для изображений, созданных с помощью онлайн ИИ-генерации.

Из России большинство сервисов напрямую недоступно.

Dall-E
https://bing.com/images/create/
https://www.cici.com (ищем бота ACO)

Imagen
https://labs.google/fx/tool/image-fx а также https://labs.google/fx/tools/whisk (доступны только в США, Кении, Новой Зеландии и Австралии)
https://gemini.google.com/app

Reve
https://preview.reve.art/app

GPT-4o
http://chatgpt.com/
https://sora.chatgpt.com/explore

Stable Diffusion и прочие
https://civitai.com/generate
https://dreamina.capcut.com/
https://ideogram.ai
https://www.meta.ai
https://ximagegenerator.com
https://www.recraft.ai
https://app.klingai.com/global/text-to-image/new
https://hailuoai.video/create
https://lumaphoton.com
https://leonardo.ai/
https://aistudio.google.com/prompts/new_chat (модель Gemini image)
https://tensor.art
https://getimg.ai/text-to-image
https://www.mage.space/
https://problembo.com/ru
https://deepai.org/machine-learning-model/text2img
https://dezgo.com/
https://dream.ai/create
https://www.krea.ai/

Дополнительные сервисы:
https://www.pixited.com/ - библиотека промптов с примерами
https://rentry.org/From-4ch-To-2ch-Dall-3-Prompts - сборник промптов
https://www.stylar.ai - AI-редактор картинок (дорисовка, инпейнт, работа с лицами)
https://astica.ai - сборник ИИ-сервисов, в частности довольно мощный де-промптер (Vision AI -> Describe and Caption)
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2 - де-промптер, разбирающий вброшенный пик на теги
https://bigjpg.com/ - апскейлер до 4096х4096
https://runwayml.com/ , https://www.stablevideo.com - анимирование генераций

Предыдущий тред: >>1042275 (OP)

Пропущено 199 постов
105 с картинками.

В тред Скрыть

Пропущено 199 постов, 105 с картинками.

Аноним 25/07/25 Птн 18:41:25 № 1288303

>>1287765
Если ты ущерб не способный прочитать шапку треда - нигде.

Аноним 27/07/25 Вск 11:40:36 № 1289763

>>1285140
Как заставить чатгпт использовать собственный генератор изображений, который 4о, а не генерить через далл-е?

Аноним 28/07/25 Пнд 13:34:45 № 1290760

Nf

ChatGPT-тред №20 /chatgpt/ Аноним 13/06/25 Птн 17:20:47 № 1244803 Ответ

изображение.png 16Кб, 795x206

Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и Венеры Милосской и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий сбой
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>1125882 (OP)

Пропущено 100 постов
37 с картинками.

В тред Скрыть

Пропущено 100 постов, 37 с картинками.

Аноним 27/07/25 Вск 22:51:19 № 1290361

>>1290183
>С генерацией так вообще пиздец, даже бабу в купальнике нарисовать не может.
Эм, тут выше в треде голых сисек навалом. Скил ишью.

Аноним 28/07/25 Пнд 10:47:53 № 1290628

>>1290361
Мускулистые монстры (с очевидно взломанного акка) не в счет.

Аноним 28/07/25 Пнд 13:10:11 № 1290741

>>1290628
>Мускулистые монстры
Бабы как бабы. Ты там детей что ли лепишь? Это да, тебе никто не выдаст.
>с очевидно взломанного акка
Чего блядь? Что и кем взломано? ОП-пик сделан с обычного акка в один заход, никаких взломов, джейлов и прочего.

Моча, это перенос треда в релевантную доску Аноним 01/04/25 Втр 19:46:53 № 1125317 Ответ

Сап двач, я художник. И это мой сопливый свинарник нытья.

Ну вот и настали времена, когда Ai меня заменил.
У меня уиихрю заказов с конца февраля, при том что мой ценник $40 за фуллбади арт с фоном, а второй персонаж стоит дополнительные $20. Т.е. скидка 50% если берёшь арт с двумя.
Моё объявление о наборе новых заказов пылится на сайтах и почти никто на него не откликается, а пришедшие говорят что $40 это дорого и лучше найдут подешевле или вообще сгенерируют в Stable Diffusion сами. Надо мной открыто насмехаются что ИИ уже давно рисует лучше меня и что мне стоит найти реальную работу.
В отчаянных Симпл-Димплках найти новые заказы я нарисовал уже всевозможных популярных персонажей из Геншин импакта, Наруто, Блича, Геройской академии, Демон слеера, Фрирен, Хай скул ДХД, Джуджутсу кайсен, Фейри тейл и даже ебучего Чёрного клевера.
Я собираю тысячи лайков и ретвитов, но никакой радости от них уиихрю, потому что я не могу ими заплатить за квартиру и купить себе пожрать.
Всё что я получаю за свои старания - жалкие 4-5к лайков, которые ни стоят ни-ху-я.

Ещё несколько лет назад я был нужен и обожаем, меня ретвитили крутые художники, мои комменты разрывались от восхищения моих подписчиков, они активно обсуждали мои арты и голосовали в опросниках кого я рисую следующей, а сейчас комментарии - это пара смайликов, собравшаяся за годы база хейтеров, их насмешки и то что мой стиль уже как-то приелся. Кто-то вообще советует мне поучиться рисовать у Ai, потому что там и цвета сочнее и динамика живая, пишут мне что мой шейдинг стал какой-то грязный.

Блять, я не хочу работать на рабской работе на Кабаныча, я просто сидел рисовал и хотел чтобы так было всегда. Почему всё всегда меняется в худшую сторону? Как только тебе кажется что всё безмятежно и беспокоиться не о чем, обязательно кто-то обосрёт всё.
Сбережений мне хватит ещё на полгода, а потом придётся устраиваться на ирл работу.

Есть тут ещё кто несправедливо заменённый искусственным интеллектом?

Пропущено 56 постов
6 с картинками.

В тред Скрыть

Пропущено 56 постов, 6 с картинками.

Аноним 26/07/25 Суб 07:25:31 № 1288753

>>1287678
Каждые 10 лет +1 миллиард потребителей, тебе мало?

Аноним 28/07/25 Пнд 10:23:36 № 1290604

>>1287678
Ну,я хз кто основной заказчик,но различные извращенцы не переведутся,а это бесконечный спрос.

Аноним 28/07/25 Пнд 12:17:19 № 1290723

1000010902.mp4 3571Кб, 490x480, 00:03:34

Буквально видрил.

AI Chatbot General № 712 /aicg/ Аноним 27/07/25 Вск 10:42:55 № 1289696 Ответ

originaldrawnby[...].png 1891Кб, 848x1200

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• grok-4-0709 вышел на xAI API - https://docs.x.ai/docs/models/grok-4-0709

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид)
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Agnai: https://agnai.chat/
• Risu: https://risuai.xyz/
• Adventure-UI: https://rentry.co/CYOA_AdventureUI
• Cavern: https://github.com/Barbariskaa/Cavern

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• Grok: https://docs.x.ai/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Бургерский список: https://rentry.org/jb-listing
• Тредовский список: https://rentry.org/2ch-aicg-jb

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://rentry.org/meta_botmaking_list | https://rentry.co/card_theory
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3
• Бургерские боты: https://rentry.org/meta_bot_list

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• Арена: https://beta.lmarena.ai/
• OpenRouter: https://openrouter.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude
• Чекер ключей: https://github.com/kingbased/keychecker
• OAI Прокси: https://gitgud.io/reanon/nonono/

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives3
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1277147 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1286097 (OP)
Набор в модерацию: >>1289389 (OP)

Пропущено 906 постов
99 с картинками.

В тред Скрыть

Пропущено 906 постов, 99 с картинками.

Аноним 28/07/25 Пнд 19:17:35 № 1291328

>>1291325
Да нихуя других не засирают а как только Мерчант карту выпускает сразу под микроскопом ищут слоп. Вон ремиксер гритинги хуярит лоботомитом всем похуй хвалят

Аноним 28/07/25 Пнд 19:17:54 № 1291331

>мерчант не будет кидать карточки
Это плохо?

Аноним 28/07/25 Пнд 19:18:33 № 1291333

Мерчант обиделся что кто-то все делает карточки лучше чем он

Голосовых нейронок тред (TTS, STS, STT) #7 speech /speech/ Аноним 16/02/25 Вск 12:20:27 № 1055411 Ответ

17019563860200.mp4 477Кб, 396x298, 00:00:23

17074247947820.mp4 2886Кб, 384x480, 00:00:08

17204507036820.mp4 310Кб, 576x576, 00:00:14

17099193437742.mp4 1356Кб, 438x480, 00:00:58

Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >> https://2ch.hk/ai/res/664162.html

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc
Если тыква вместо видеокарты, можно тренить в онлайне: https://www.kaggle.com/code/varaslaw/rvc-v2-no-gradio-https-t-me-aisingers-ru/notebook?scriptVersionId=143284909 (инструкция: https://www.youtube .com/watch?v=L-emE1pGUOM )

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды вариант: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/

Пропущено 194 постов
41 с картинками.

В тред Скрыть

Пропущено 194 постов, 41 с картинками.

Аноним 26/07/25 Суб 20:00:17 № 1289268

А что на данный момент, по поводу говорилок в реальном времени? Что сейчас самое передовое и адекватное?

Аноним 27/07/25 Вск 01:44:41 № 1289553

>>1289268
Silero TTS v3.1 (не v4)

Аноним 27/07/25 Вск 13:40:29 № 1289882

>>1285218
>Ноль сообщений
Про что угодно. Тред неактивный.
Свежая опенсорс ттс
https://huggingface.co/bosonai/higgs-audio-v2-generation-3B-base
>инб4 хэл на ноу расиан лангуг

Нейродвача и искуственных борд тред Аноним 25/10/24 Птн 02:25:56 № 930555 Ответ

14e22878c864bab[...].png 859Кб, 1920x2516

Недавно в бредаче всплыл интересный тред посвященный генератору постов двача на основе ИИ. И генератор совершенно не хуйня и он вполне себе хорошо копирует слог среднего анона и даже превосходит его. "Аноны" метко подшучивают над опом и темой его поста и если развитие проектов такого типа продолжиться то каждый "анон" в сгенереном треде будет иметь свое мнение и личность и можно будет уже самому с ними посраться, появятся шизы. Хочу создать тред исключительно по данной теме, если это продвинется дальше то каждый сможет иметь свой офлайн двач с куклами, пони, бесконечными консолесрачами и постами в стиле того самого без всяких новомодных течений. Можно будет вернуться в любую эпоху и имитировать даже несуществующие эпохи двача типа если бы двач существовал при царе Рюрике, Сталине и тд. Все приведено естественно как пример. Также реквестирую в тред любые материалы по теме генерации борд в режиме реального времени если они у вас имеются.

Генератор тредшотов: https://glif.app/@Meson/glifs/cm2e1w1g300024yvf141n7ot0

https://arhivach.xyz/thread/1084063/

Пропущено 180 постов
116 с картинками.

В тред Скрыть

Пропущено 180 постов, 116 с картинками.

Аноним 30/06/25 Пнд 08:00:38 № 1259917

Аноним 15/07/25 Втр 23:25:57 № 1278498

Аноним 27/07/25 Вск 04:55:14 № 1289615

Гугл колаб тред 1 свою нейронку делаю Аноним # OP 20/07/25 Вск 18:08:13 № 1283707 Ответ

Хочу сделать своюб нейронку обученную на текстах великих мыслителей(выкачаю оптом сабы с некоторых ютуб каналов и дам их для обучения)

Вот пример текстов которые в нейронку всуну:
бульба престолов,Вихорьков,юрий нестеренко,Денис Чернухин,Абдуловера ну и прочие людишки смешные, мб ещё классики нафигачу и тд
Просто кучу ткст файлов кинуть планирую надеюсь норм сработает

Собсна 2 темы
1)Как впринципен пользоваться гугл колабом чтоб такое сделать я ниче не умею, минимум интеллекта у меня
2)Норм ли это сработает каких людишек мне лучше ещё вставить? порекомендуйте чтоб интереснее вышли текста

Пропущено 2 постов
2 с картинками.

В тред Скрыть

Пропущено 2 постов, 2 с картинками.

Аноним 24/07/25 Чтв 01:42:30 № 1286723

>>1283707 (OP)
да чел ты не научишь её особо, такое лучше в контекст хорошей нейронки по апи запихнуть.

Аноним 25/07/25 Птн 21:45:11 № 1288532

>>1286723
>>1284117
Пообщался с нейронкой по итогу нашел бесплатную на 1 млн токенов в гугл колабе, этого конечно на все не хватит но для теста сойдет

Ещё пока хз как нейронку с колаба в инет вывести на сайт какой нить

Аноним 26/07/25 Суб 07:27:57 № 1288755

>>1288532
Не пеши больше в этот раздел.

Какой то богатый чел запустил конкурс на суно на лучший ремикс на его (говно)песню. В целом песня не Аноним 25/07/25 Птн 22:25:21 № 1288554 Ответ

Какой то богатый чел запустил конкурс на суно на лучший ремикс на его (говно)песню. В целом песня не плоха (в музыкальном смысле) но это не его заслуга. Я переписал текст, чтобы сделать его в тему конкурса.
https://suno.com/s/P430ZGT8SOWiu70w
Если кто в теме, делайте свои ремиксы, отхуесосим их вместе.

В тред Скрыть

Новости об искусственном интеллекте №24 /news/ Аноним 21/07/25 Пнд 23:49:07 № 1285009 Ответ

В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1281238 (OP)

Пропущено 513 постов
91 с картинками.

В тред Скрыть

Пропущено 513 постов, 91 с картинками.

Аноним 25/07/25 Птн 19:21:30 № 1288373

>>1288371 (OP)
>>1288371 (OP)
>>1288371 (OP)
>>1288371 (OP)

Покатились

Аноним 25/07/25 Птн 19:53:52 № 1288426

>>1288346
Скорей всего это правда, Нефритовый Стержень могучий много миска риса, если совки смогли через евреев похитить атомную бонбу, то КНР сам конфуций велел через евреев похитить ИИ. Тащемто, былри кукареки сенатора о том, что ЛЛАМА это гос.измена, когда дипсик высрался.

Аноним 28/07/25 Пнд 15:47:08 № 1290929

>>1285144
>а с экспертной системой
с тупым ёбаным попугаем, примерно помнящим энциклопедию.
Ты слишком недалёк, чтобы поохуевать с того, насколько слабо эта система ушла от чатбота 90х, работавшего на ключевых словах.