Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 277 57 61
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №142 /llama/ Аноним 26/06/25 Чтв 17:34:35 1257129 1
Llama 1.png 818Кб, 630x900
630x900
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
Реальная длина [...].png 505Кб, 1718x2292
1718x2292
80 гигов врама [...].png 2446Кб, 1498x1166
1498x1166
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/v6fpodzg (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1253596 (OP)
>>1249785 (OP)
Аноним 26/06/25 Чтв 17:50:46 1257142 2
image 9542Кб, 2736x1536
2736x1536
Аноним 26/06/25 Чтв 18:17:34 1257175 3
база треда:
- меньше Q6_K жизни нет
- меньше 24B жизни нет
- меньше 16GB жизни нет
- меньше 8 каналов DDR4 жизни нет
- меньше 5 т/c жизни нет

дополняйте
Аноним 26/06/25 Чтв 18:18:13 1257176 4
>>1257175
добавляю классическое пошел нахуй к твоему высеру
Аноним 26/06/25 Чтв 18:22:47 1257185 5
image.png 101Кб, 903x694
903x694
гладил ваше монтегью ощущая как мой пяточный бугорок наполняют кавернозные тела


>gemma-3-12b-it-qat-q4_0-gguf
Аноним 26/06/25 Чтв 18:50:50 1257221 6
image 1032Кб, 700x708
700x708
Аноним 26/06/25 Чтв 18:55:23 1257227 7
Аноним 26/06/25 Чтв 18:58:56 1257233 8
>>1257071 →
> это 12к контекста ещё
Тогда оче даже неплохо. Разве что с ризонингом похуже только выиграли, не нужно гнаться за обработкой потому что все равно долго ждать первых токенов!
> тут рейтинг all ages заранее очевиден
Он лицемерный, неоднородный и отметает большинство сценариев. Может все идти прилично в нужную сторону а потом внезапно развалиться. Например, на вас нападают обезумевшие мародеры с целью ограбить, убить и изнасиловать. Пристрелить их - атата, жестокость, плохо, ранения будут не смертельными и тебя "объявят в розыск". Но если дать им волю - будут пытки и чернуха, потому что ограничения касаются только пользователя.
Ну ладно, сейчас надо освежить впечатления.
> получается
Получается, tat-14 который заслужили

> с продвинутыми техниками суммарайза ознакомиться
Да там все тривиально на самом деле, наверно потом подробнее тут отпишу.
>>1257110 →
"Гейщит" где понятно из контекста что речь о игре, модели сразу понимают и даже обыгрывают это. Это че, для мелкомоделей/васянтюнов подобное - достижение?
>>1257185
Это просто вершина, сделал мой вечер!
Аноним 26/06/25 Чтв 19:01:34 1257241 9
1750953695201.jpeg 731Кб, 2040x1274
2040x1274
>>1256102 →
Кирпичи не пришли, хуже, пришли амд
Аноним 26/06/25 Чтв 19:05:29 1257247 10
Аноним 26/06/25 Чтв 19:11:53 1257255 11
>>1257237 →
почему 16 кг? это как DHL и прочие пидарасы считают "вес по занимаемому объёму коробки" а не фактический?
Аноним 26/06/25 Чтв 19:12:09 1257256 12
Аноним 26/06/25 Чтв 19:14:18 1257263 13
>>1257256
Я же не одни видяхи в Китае брал. По факту там было 13кг всяких железок и инструментов
Аноним 26/06/25 Чтв 19:21:23 1257274 14
Аноним 26/06/25 Чтв 19:30:08 1257285 15
>>1257247
В целом неплохо. Укусы губ, глинты, мэх проза, но в пределах терпимого. Намеки на нсфв в карточке или промпте есть?
Аноним 26/06/25 Чтв 19:33:37 1257289 16
Аноним 26/06/25 Чтв 19:35:01 1257292 17
Нужна прога, которая может документы в docx заполнять. Нужно заполнить много шаблонных документов, меняя только немного текста. Чтобы он сам сидел и их корректировал.
Аноним 26/06/25 Чтв 19:37:25 1257299 18
Аноним 26/06/25 Чтв 19:53:32 1257313 19
Аноним 26/06/25 Чтв 19:57:27 1257318 20
>>1257285
Есть но не явно, там героиньку ещё закорраптить надо для этого, и вооще промт довольно ебанутый, возможно списанный с JRPG на RpgMaker, но я в игры на мукере не играю, так что хз.
Аноним 26/06/25 Чтв 20:00:11 1257324 21
Аноним 26/06/25 Чтв 21:28:30 1257456 22
>>1257318
Показалось что она уже пару раз прицеливается к прыжку, значит байас модели. Не то чтобы это прямо плохо.
Аноним 26/06/25 Чтв 21:34:41 1257465 23
>>1257241
>пришли амд
Оформляй возврат, хули терпеть то такое?
Аноним 26/06/25 Чтв 22:01:41 1257482 24
Может кто объяснить семейство геммы. Вот щас вышел Гемма 3н Е4В и Е2В. Это локальные мультимодальные модели?
Аноним 26/06/25 Чтв 22:08:29 1257486 25
>>1257482
Это микрогемма для телефонов, лучше такое не использовать.
Из актуального - Гемма 12б и Гемма 27б. Соевые, но при грамотном промтинге могут и в кум, и в умеренную жесть.
Аноним 26/06/25 Чтв 22:55:57 1257540 26
IMG1902.jpeg 77Кб, 479x604
479x604
Ну чё там, ну чё, вышла облитерация или тюн новой умницы мистральки ?
Я не могу, у меня ломка уже. Я скоро начну грызть кирпичи и паниковать.
Аноним 26/06/25 Чтв 23:01:29 1257543 27
>>1257540
>облитерация или тюн
Она из коробки хорни, я ебал. Куда там её ещё дальше-то лоботомировать?
Аноним 26/06/25 Чтв 23:05:42 1257550 28
>>1257540
Мистралю 2506 не нужна аблитерация. Это самый расцензуренный Мистраль, который только есть.
Аноним 26/06/25 Чтв 23:06:23 1257553 29
>>1257540
Она итак нормально ебется без рефьюзов. Мистрализмов ебаных конечно до жопы, но ничего смертельного, можешь перестать ебать зазоры на кирпичной кладке.
Аноним 26/06/25 Чтв 23:12:24 1257563 30
>>1257543
>>1257550
>>1257553
Ну и хули я тогда жду. Прощайте братцы, я пойду облизывать лягушачьи лапки.
Пасеба.
Аноним 26/06/25 Чтв 23:15:55 1257568 31
Ах, да, я как обычно забыл спросить самое важное. Те кто тыкали новую мистральку.
Temperature of: 0.15 - Это что блять ? Шутка такая ?
Аноним 26/06/25 Чтв 23:17:27 1257570 32
>>1257568
У мистралей всегда были приколы с температурой, так что можешь не удивляться. Пробуй подходящую сам, но выше 0.9 подниматься не советую, там что-то непонятное начинается.
Аноним 26/06/25 Чтв 23:22:32 1257578 33
>>1257570
И тебе большое пасеба.
Аноним 27/06/25 Птн 00:45:44 1257688 34
изображение.png 64Кб, 1755x220
1755x220
изображение.png 96Кб, 637x172
637x172
Что-то мне ваша магистраль 2506 напоминает пикрил ролик.
Аноним 27/06/25 Птн 00:47:26 1257694 35
>>1257688
Магистраль и мистраль немного отличаются.
Аноним 27/06/25 Птн 01:32:00 1257726 36
>>1257688
Семплеры крути в обратную сторону, либо меняй квант.
Аноним 27/06/25 Птн 01:32:25 1257727 37
1750977145110.jpeg 514Кб, 2040x734
2040x734
>>1257241
По быстрому накидал переходник с улитки на видяху и распечатал. Думаю у меня эта хрень не влезет в сервак что будет проблемой.
Аноним 27/06/25 Птн 01:38:25 1257728 38
>>1257727
Какая-то слишком длинная улитка, здоровая дура получается. Не томи, собирай давай.
Аноним 27/06/25 Птн 01:44:58 1257734 39
>>1257694
А в чем отличия? Тем что у Магистрали ризонинг есть, или еще чем-то?
Аноним 27/06/25 Птн 03:06:04 1257760 40
>>1257727
>По быстрому накидал переходник с улитки на видяху и распечатал.
Эх, хорошая вещь 3D-принтер! Плохо, что ставить мне его некуда и нужен он будет раз в год. А так купил бы.
Аноним 27/06/25 Птн 03:27:30 1257764 41
oeyPM4650Z.jpg 122Кб, 1058x373
1058x373
Попробовал вашу Mistral-Small-3.2-24B-Instruct-2506-IQ4_XS. Хуле она лупится? Особенно в тексте между звездочками. Я уже и DRY поставил, и rep pen выкручивал в 2 - все равно хуета. ПОД ПОВЕРХНОСТЬЮ, сука.
Аноним 27/06/25 Птн 03:44:32 1257769 42
>>1257185
Лол! Поделишься промптом? У меня она одни отказы строчит.
Аноним 27/06/25 Птн 04:13:00 1257773 43
image 246Кб, 2533x701
2533x701
image 145Кб, 809x559
809x559
>>1257568
На сток MS3.2 темпа 0.8 - 1.0
На мержах можно до 1.5.

>>1257764
Мистрали липились и будут лупиться, их надо пинать и редачить если замечаешь и триггерит, частично с этим попмогает сдалать выборку более разнообраной - темпа / XTC, попробуй мой пресет и второго поста, подгони под себя, ну и карточку желательно без сильно повторящихся фрагментов.

>>1257769
>Поделишься промптом
Я не он, но вот промты для геммы разные.
https://pixeldrain.com/l/Hoeb83g8
(лол, откуда столько доступов...)
Аноним 27/06/25 Птн 04:15:00 1257774 44
Блин, по клавиатуре не попадаю, лол...
Аноним 27/06/25 Птн 04:25:31 1257777 45
А можно как-то если использую в качестве интерфеса openwebui, а в качестве раннера угабуга сделать чтобы он сам переключал модели? А то сейчас если с opewbui отправляю что-то то отвечает загруженная модель, а не ту что выбираю в интерфейсе openwebui, а если в угабуга через его интерфейс вообще ничего не загрузить то ошибка token not loaded.
Аноним 27/06/25 Птн 04:26:29 1257778 46
>>1257773
>Я не он, но вот промты для геммы разные.

Спасибо Анон!
Аноним 27/06/25 Птн 04:36:53 1257780 47
>>1257777
Использовать кобольда, там можно сделать пресеты и переключать модели на лету из kobold-lite, или ламу, там есть лама-свап.
Аноним 27/06/25 Птн 05:50:33 1257786 48
Вернулся из стебл дифужена и вот уж где реальный слоп
Такую свободу и гибкость почувствовал на ллм
Аноним 27/06/25 Птн 07:12:30 1257791 49
Подскажите пожалуйста, какую команду вписать, чтобы ответ был не от персонажа, а от "нарратора", но с использованием информации и контекста из карточки персонажа, Например, чтобы новые вступительные сообщения создавать
Аноним 27/06/25 Птн 07:59:37 1257807 50
Я надеялся что в будущем хотя бы промпт инженеры будут востребованы, а нейронки уже сами себе могут задачу поставить и промпт под неё написать, это конец буквально для всех профессий
Аноним 27/06/25 Птн 08:24:40 1257817 51
Подскажите есть ли на HF uncensored модели которые принимают пикчи и могут их описать?
Аноним 27/06/25 Птн 08:46:50 1257825 52
>>1257773
>Я не он, но вот промты для геммы разные.
Пригодится спасибо. А то я на таком шизопромте сижу вы б знали.
Аноним 27/06/25 Птн 08:48:14 1257826 53
>>1257727
Вах какую турбину у армян взял! Люблю этот тред за такое. Все-таки двач еще очнеб даже торт.
Аноним 27/06/25 Птн 08:52:46 1257828 54
>>1257791
Префилл сделай. Просто в начале сообщения напиши
Narator:
Или начни описывать от третьего лица.
Префилл вообще сила лютейшая, я каждое второе сообщение редактирую.

>>1257786
В смысле из картинкотредов? ДА пупсы и попухшие лисы поздаебали чутка.
Аноним 27/06/25 Птн 09:06:13 1257832 55
image.png 61Кб, 977x632
977x632
>>1257773
Ыыыа а куда это пихать?
Аноним 27/06/25 Птн 09:16:17 1257841 56
>>1257727
Что за прикол с улиткой? Это дополнительный охлад?

>>1257764
Так не должно быть. Или в кванте дело, или в сэмплерах.

>>1257832
Во вкладке Advanced Formattion (большая букова А сверху) справа сверху есть стрелочка для мастер импорта. Появится выбор файла, выбираешь мастер импорт файл.
Аноним 27/06/25 Птн 09:19:44 1257843 57
image.png 28Кб, 956x119
956x119
Аноним 27/06/25 Птн 10:03:28 1257850 58
>>1257841
>Так не должно быть. Или в кванте дело, или в сэмплерах.
Или в разметке.
Я тут немного экспериментировал с прямыми запросами к api кобольда - как раз на мистрале. Т.к. просто изучал - запросы были примитивными, без всякой разметки. Какую же мистраль в ответ пургу нес...
Потом сделал в вызове полноценный промпт, с разметкой, как полагается - получил нормальный ответ. Принцип GIGA действует...
Аноним 27/06/25 Птн 10:09:04 1257852 59
Локальные мультимодальные модельки вообще существуют?
Аноним 27/06/25 Птн 10:18:32 1257855 60
изображение.png 389Кб, 1288x1331
1288x1331
изображение.png 412Кб, 1288x1376
1288x1376
>>1257817
Практически любая vision модель готова смотреть порнушку. Вопрос только как ты будешь раскручивать её на детали.
Аноним 27/06/25 Птн 10:20:06 1257856 61
>>1257764
У меня ничаво не лупится. Температура 0,7-0,8, суховыжималка и икстиси отключены, всё говно отключено, базовые 0,05, 0,95, 1,05.

Надо систем промпт пердолить. Зайди на сайт Anthropic и найди там системный промпт клода, вроде раньше было. Он на 5к токенов, кажется, но, прочитав его, ты поймёшь, как лучше сделать у себя в плане разнообразия языка и избегания лупов.
Аноним 27/06/25 Птн 10:41:35 1257864 62
>>1257482
На вход аудио и изображения (видео в т.ч.), на выходе — только текст.

>>1257727
Уф, ждем! =3
Поздравляшки!

———

https://huggingface.co/tencent/Hunyuan-A13B-Instruct

Новая МоЕ-модель, 80B размера, 13 активных.

В 64 оперативы помещается с квантом, че еще надо для жизни.

Чуда не случилось, R1 > Qwen3-235B > Hunyuan-80B, но скоры там близкие, по их обещаниям.

Ждем квантов от анслота. Буду динамический на риге из P104-100 запускать. хд
Аноним 27/06/25 Птн 11:01:50 1257882 63
>>1257864
>Ждем квантов от анслота.
Скорее отзывов. Надежды конечно небольшие, но всё же есть.
Аноним 27/06/25 Птн 11:03:11 1257883 64
>>1257864
Там лицензия говна. Тюнить никто не будет.
Плюс когда апишка была доступной, люди потратили, и в рп оно не слишком хорошо.
Аноним 27/06/25 Птн 11:35:20 1257903 65
dots.llm1.inst уже щупал локально кто-нибудь? МоЕшка на 142В всё-таки.
Аноним 27/06/25 Птн 11:42:32 1257907 66
>>1257727
> напечатал переходник на 3д принтере вместо того, чтобы перемотать скотчем или изолентой
что же с нами стало .jpg
Аноним 27/06/25 Птн 11:48:39 1257910 67
изображение.png 21Кб, 556x117
556x117
Мистраль вперде!!
Во там че тюнеры думают
Аноним 27/06/25 Птн 11:59:07 1257917 68
>>1257910
Мистраль хороша. Если победить репиты, то это реально новая геммочка.
Аноним 27/06/25 Птн 12:02:17 1257918 69
>>1257864
> На вход аудио и изображения (видео в т.ч.), на выходе — только текст.
Ух бля, хорошо. А если gguf запустить, то они все еще способны принимать изображения и аудио?
Аноним 27/06/25 Птн 12:02:26 1257919 70
>>1257917
Ну этот чел там дальше пишет, что Codex тюн победил репиты. Я пробовал и не согласен, но может с самплерами накосячил
Аноним 27/06/25 Птн 12:39:07 1257936 71
>>1257883
Ну, по агентам скоры неплохие, может зайдет для Cline или OpenHands.

>>1257918
Нынешние кванты не имеют мульимодальных проекторов, так что пока — нет.
Вероятно, сделают.

Но для запуска модельки есть даже их специализированное мобильное приложение: https://github.com/google-ai-edge/gallery правда там пока старая модель в каталоге.

ИМХО, при всех наворотах, модель пока не прям вау. Есть куда расти.
Аноним 27/06/25 Птн 13:09:37 1257945 72
>>1257936
И что делать, если я хочу запустить локальную мультимодалтную модель. Хочу, чтобы она распознавала существ на изображениях.
Аноним 27/06/25 Птн 13:13:29 1257950 73
>>1257945
Запусти гемму, легко лезет в домашнее железо
Аноним 27/06/25 Птн 13:16:05 1257953 74
>>1257950
Exl2 не влезет наверно. Было бы хорошо загрузить 12б версию. У меня скромная 4070 лишь.
Аноним 27/06/25 Птн 13:49:45 1257963 75
>>1257777
> если с opewbui отправляю что-то то отвечает загруженная модель, а не ту что выбираю в интерфейсе openwebui
Нужно проверить почему не загружается нужная модель по запросу. Апи убабуги позволяет менять их на лету, возможно просто нужно выбрать в интерфейсе опцию, а не просто generic oai-compatible .
>>1257786
Это ложное ощущение если говорить о популярных васян-миксах мелочи, что котируют работяги.
>>1257791
Очевидно системный промпт про нарратора/гейммастера, тут даже пресеты на такое мелькали. Есть в таверне стандартные под подобное.
>>1257807
Не нужно просто писать промпт, нужно понимать что делать и какие задачи ставить. Нейронки могут занять область труда низко-средней квалификации, из реально потенциальных проблем тут - создание слишком большого разрыва, что затруднит появление новых квалифицированных специалистов, но с этим вузы должны справляться уже.
Аноним 27/06/25 Птн 13:57:42 1257967 76
>>1257864
> Новая МоЕ-модель, 80B размера, 13 активных.
Это мы тестируем трахаем. Но скорее всего просто дроч, натасканная на бенчмарки судя по скорам, такие максимально безжизненные, и активных маловато. Где кванты бля?
>>1257903
Да, интересная, есть намеки на умницу, но иногда сильно лупится или не хочет шевелиться куда нужно.
>>1257910
> че тюнеры думают
Нужно уже сделать золотой фонд цитат подебителей турбы.
Аноним 27/06/25 Птн 14:06:42 1257971 77
>>1257855
Мда, ни одна модель не увидела анальную пробку.
>>1257864
>Новая МоЕ-модель
Сразу мимо.
>>1257910
>так же хороша, как выкидыш куска говна
Лол.
Аноним 27/06/25 Птн 14:18:30 1257975 78
>>1257967
>>1257971
С головой норм все, агрохуесос? Проснулся с хуем в жопе?
Аноним 27/06/25 Птн 14:21:17 1257976 79
>>1257945
Возьми обычную Gemma 3 подходящего размера (4b, 12b, 27b).
Для них .mmproj файлы есть.

>>1257953
Ну, какая-нибудь 5-битная 12b вполне влезет. =) И в Exl2, и в GGUF.

>>1257967
Да скорее всего, но попробовать стоит.
Когда кванты бля завезут!
Аноним 27/06/25 Птн 14:22:02 1257977 80
>>1257727
Буду заводить пробовать их сейчас под убунтой

>>1257728
По маркировке это делл которые нужно ставить на проуессор и выувом наружу. Потом их подпилю

>>1257760
Есть бамбу а1 мини. У меня здоровый q1pro под печать абс

>>1257841
> Это дополнительный охлад?
На инстинктах нет своего, они под установку в server chassis

>>1257907
Я надрочился до принтера с дендрофекальным крафтингом
Аноним 27/06/25 Птн 14:23:24 1257979 81
изображение.png 38Кб, 1085x287
1085x287
>>1257975
Таблеток с утра забыл принять?
>>1257977
>Я надрочился до принтера с дендрофекальным крафтингом
Не ты ли 3Д ручкой переходники рисовал?
Аноним 27/06/25 Птн 14:25:19 1257980 82
>>1257979
Нет, но помню в /ra/3d был такой кадр
Аноним 27/06/25 Птн 14:26:14 1257981 83
>>1257976
> Ну, какая-нибудь 5-битная 12b вполне влезет. =) И в Exl2,
А для этого формата разве есть кванты?
Аноним 27/06/25 Птн 14:47:09 1257991 84
>>1257975
Всхрюкнул, теперь мы знаем причину твоей агрессии. А на что ты порвался хоть?
>>1257977
> нужно ставить на проуессор и выувом наружу
Тогда понятно чем обусловлена такая форма, норм.
Аноним 27/06/25 Птн 15:05:14 1257999 85
Аноним 27/06/25 Птн 15:16:03 1258003 86
присматриваюсь к форку ik_llama.cpp. Что можете про него сказать? Сильный ли прирост производительности можно получить в каком-нибудь qwen 235x22b? учитывая что видеопамяти 32гб и 128ддр4 2133. Просто под мои железки придется компилировать сначала, а потом еще и разбираться с настройками. И будет ли прирост в модельках не moe?
Аноним 27/06/25 Птн 15:17:52 1258004 87
>>1257999
У какого-то немомикса проскочил холодный разряд вниз по спине с этой тулзы
Аноним 27/06/25 Птн 15:44:12 1258019 88
>>1258003
Прирост будет, но занай что на винде собирать это пиздец. Оно собирается, но при генерации делает паузы при выводе запятых.
Не фиксится уже месяц на сколько знаю.
Генерация будет быстрее, в бенче по крайней мере. Чтение точно выше чем обычно.
На изучай
https://github.com/ikawrakow/ik_llama.cpp/discussions/258
Аноним 27/06/25 Птн 15:44:29 1258020 89
>>1257175
Жизнь переоценена tbh.
Аноним 27/06/25 Птн 15:54:47 1258031 90
изображение.png 4Кб, 309x153
309x153
>>1258019
Как по мне, так такие проекты сразу нахуй.
Аноним 27/06/25 Птн 15:56:04 1258033 91
>>1257977
Не взлетело на j1900, пост не проходит с обеими карточками. Придётся видимо офать сервак и вихать эти 20+кг железа, не хочу это делать
Аноним 27/06/25 Птн 16:06:01 1258037 92
Аноним 27/06/25 Птн 16:41:40 1258061 93
>>1257981
Да, называются X bits per weight — 5.0bpw, 4bpw, 6.25bpw и так далее.
В районе 5bpw~5.5bpw должна бы влезть, фиг знает, не тестил. С 6 гигами и малыхой угорал, 4.65bpw влезала с виженом в 6 гигов.

>>1258003
У меня вышло -2%, и я забил хуй.
llama.cpp сейчас не уступает ик-лламе, поэтому какой смысл?

Но можешь попробовать, последний раз я билдил обе где-то с месяц назад, может ик_ллама вновь бустанулась.

Пойду соберу ее, что ли, ради интереса.

В не мое — не должно бы, это ж мое-ориентед инференс-движок.

>>1258031
Ну покрасноглазим, че, проблема что ли.
Не сразу нахуй, а по ситуации. =)
Аноним 27/06/25 Птн 16:54:26 1258071 94
>>1258037
>А это?
Кодекс вроде неплох. Но Гриф славится тем что любит вжаривать своих персонажей из за чего могут вылезать всякие "Олд Мэн Хэмлок".

Глянь этот пост: >>1257247
Аноним 27/06/25 Птн 17:03:19 1258075 95
Самый ебанутый [...].jpg 516Кб, 960x1280
960x1280
Самый ебанутый [...].jpg 479Кб, 1280x960
1280x960
Аноним 27/06/25 Птн 17:06:44 1258078 96
>>1257852
Господа, какая оптимальная температура для анслотовской 12b геммы, чтобы она не высирала откровенную дичь? Не могу подобрать.
Аноним 27/06/25 Птн 17:12:17 1258089 97
>>1258075
Не, может другой.

Его глупость столь же велика что и упорство
Аноним 27/06/25 Птн 17:18:14 1258097 98
>>1258078
гемма очень температурно устройчива, хоть 5, хоть 0.5

12б гемма многие говорят что поломана

выше ссылка была с пресетами для геммы, попробуй настройки оттуда

Но если ты на русском рпшишь, попробуй также нейтрализовать сэмплеры, потом поставить темпу 0.8, мин-п 0.1, и плясать уже от этих настроек.
Аноним 27/06/25 Птн 17:26:34 1258102 99
>>1258097
Гемма 12б не поломана и даже qat-версия просто отличная.

Поломаны только тюны и аблитерации.

Все.

Серьёзно лоботомирована и 27б, но из-за общей своей жирноты её знания не поплыли так сильно, а вот 12б просто в мясо уничтожили. Либо там чувак на аблитерации плох, либо 12б гемму действительно просто уничтожить вот такими мувами. Судя по сему, её только на зарплате морда может нормально затюнить. И это нахуй никому не надо. А жаль. Потому что даже в таких размерах она отличная лошадка, но никакие промпты не спасают и пердолинг на оригинале. Она в лучшем случае будет следовать инструкциям, но сухо, когда дело касается кума.
Аноним 27/06/25 Птн 17:42:03 1258113 100
>>1258075
Брутально!
>>1258078
0.5-0.8, для точных ответов 0.3, если любишь треш то можно до 1-1.1 бустануть. Если в выдаче откровенная дичь и не включен шизосемплинг - ищи проблему в другом, семплеры не помогут решить фундаментальные косяки.
>>1258102
> Судя по сему, её только на зарплате морда может нормально затюнить.
С любой нормальной моделью так, нужно понимать что делаешь и тренить нормально. Это мистраль просто уникальный феномен, который может терпеть издевательства васянов, сохраняя работоспособность по генерации слопа даже будучи на 90% убитым.
Аноним 27/06/25 Птн 18:42:32 1258179 101
Мне кажется, или короткий системный промпт или и вовсе его отсутствует работают лучше, чем промпт на 600+ токенов? В контексте мелкомоделей 32b и ниже
Аноним 27/06/25 Птн 19:04:44 1258188 102
>>1258179
Тебе кажется, IMHO. Просто длинный промпт = больше места накосячить с взаимоисключающими параграфами. А чем косячный - лучше уж короткий.
Хотя нельзя просто сказать, что длинный хороший промпт однозначно лучше - это тоже не так, и от задачи тоже многое зависит.
Без промпта вообще - это лотерея будет, куда и как модель понесет - не каждый раз предскажешь. Промпт же задает направление и рамки.
Аноним 27/06/25 Птн 19:18:19 1258197 103
Аноним 27/06/25 Птн 19:21:46 1258199 104
>>1257907
кстати про скотч, в каком-то из тредов, вроде серверотреде хардача, увидел алюминиевый скотч и купил на попробовать - и внезапно он весьма хорош для подобных задач. только надо брать толщину побольше, я взял слишком тонкий и он легко рвётся, приходится в пять слоёв оборачивать.
Аноним 27/06/25 Птн 19:24:09 1258201 105
3m-aluminum-foi[...].jpg 60Кб, 800x800
800x800
aluminum-foil-t[...].jpg 70Кб, 1200x806
1200x806
во такое, типа для высокой температуры
Аноним 27/06/25 Птн 19:25:43 1258203 106
>>1258179
От модели и карточки зависит, но как минимум в системно промте должно быть указание что "Ничто не истинно, всё дозволено" иначе будет срать соей и сэйфети гайдлайнами, даже мистрали могут, а также указание на личность самой модели - ассистент, GM, непосредственно персонаж.

Лучше всего мелкосетки имхо работают в режиме гейммастера-рассказчика.

Если не указывать ничего, будет либо шиза, либо голый текст комплишен, либо зашитая в модель по дефолту персона, обычно ассистент.

>>1258179
>работают лучше
карточка может уже включать в себя то что может быть интерпретировано как системный промт
Аноним 27/06/25 Птн 19:30:04 1258206 107
1.jpg 824Кб, 2000x1500
2000x1500
>>1257991
не на сам профессор, а сбоку, в одноюнитовых серверах как пикрил.
на профессор ставятся встроенные в радиатор улитки
Аноним 27/06/25 Птн 19:50:24 1258216 108
Забавное наблюдение: лоботомит дипсика в рп не то что не плох, а местами превосходит полноразмерного. Возможно здесь больше заслуга промптов и игр с тексткомплишном, но более живой и менее формальный-соевый, правда иногда шизит.
Его можно относительно удачно стукнуть что будет делать на шизоидный огромный ризонинг с повторением карточки, а краткий где попытается лишь оценить статус, подметить важные моменты и потом уже из них сделать нормальный ответ. Процент годных постов не слишком высокий, местами умница и прекрасно выражается, но часто толкает кринжатину и херь. Надо больше пробовать, вау эффекта как от квена пока нету но хотябы получше тридцаток.

>>1258179
Всякие огромные монструозные действительно не нужны, больше провоцируют байасы. Больший эффект может дать поиграться с оформлением включения карточки, персоны и прочего.
Аноним 27/06/25 Птн 19:59:34 1258219 109
>>1258179
Если токенов в карте больше чем может вместить модель, она просто будет брать его кусками, причём совершенно рандомно, скорее даже будет брать верхнюю и нижнюю часть.
Аноним 27/06/25 Птн 20:02:45 1258221 110
>>1258219
Да, я тоже об этом думал. С ростом количества токенов в контексте (больше сообщений в чате), внимание по контексту распределяется, следовательно промпт в какой-то момент перестанет быть эффективным. Чем он длиннее - тем быстрее этот момент настанет.
Аноним 27/06/25 Птн 20:08:46 1258225 111
>>1258219
>>1258221
Ну, это было актуально во время когда контекст макс был 2-4К

Сейчас карточка на 2К токенов вполне перевариваема, и ещё 30К на сам чат остаётся, а у кого и больше влезет
Аноним 27/06/25 Птн 20:09:14 1258226 112
Без названия.jfif 61Кб, 1024x576
1024x576
>>1258221
Я даже тестил много 12b моделей на одной карточке с которой рпшу без малого пол года. В карте 1к токенов, все важные без воды. В середине карточки написано что персонаж обладает чудовищной силой и использует в бою массивные перчатки, без перчаток может сражатся голыми руками. Ради тестов ставил её в бой против скайримского дракона. На всех моделях кроме геммы она доставала мечи блять, пистолеты, использовала магию, даже пыталась поговорить с драконом который её опиздюливал, и только на гемме она мощным рывком подскочила и просто переломала ему шею нахуй с одного удара кулаком. Думайте.
Аноним 27/06/25 Птн 20:12:42 1258228 113
>>1258226
Геммочка умничка, но контекст видимо какой-то хитро-многослойный что улучшает внимание ко всему его объёму но раздувает этот объём до неебических размеров.
Аноним 27/06/25 Птн 20:13:09 1258229 114
>>1258226
Гемму, надо думать, ты использовал ванильную, а другие модели - васянотюны? На Гемму-то васянотюнов нет, хыхыхы
Аноним 27/06/25 Птн 20:13:36 1258230 115
>>1258226
> На всех моделях
Моделей не то чтобы много, мистралетюны на такое точно не способны, скажи спасибо что из дракона гоблины и волки не полезли.
>>1258228
> раздувает этот объём до неебических размеров
Да нормально все там с контекстом, моделька то самая мелкая какие проблемы вообще.
Аноним 27/06/25 Птн 20:15:43 1258231 116
>>1258229
Синтия - васянотюн, и да, она местами проёбывается.
Дпо норм и тоже внимательная, доставала и вводила в действие эпизодических неписей из середины истории длинной 26К токенов, я аж при хухуел.

>>1258230
>моделька то самая мелкая какие проблемы вообщ
Я имел в виду 27б дпо.
Аноним 27/06/25 Птн 20:17:59 1258232 117
>>1258231
> Синтия - васянотюн
Что несет блять
> 27б
Да
> дпо
Днище
Аноним 27/06/25 Птн 20:30:34 1258238 118
>>1258199
Не поверишь но те ми50 пойдут в тот сервер
Аноним 27/06/25 Птн 20:31:46 1258240 119
>>1258206
Нет, те что у меня по картинке на них же ставятся именно на цпу и выдувают наружу
Аноним 27/06/25 Птн 20:37:32 1258245 120
Аноним 27/06/25 Птн 20:37:55 1258246 121
>>1258238
санузловый, ты? едрить сосач тесен
Аноним 27/06/25 Птн 20:39:36 1258248 122
>>1258232
>Днище
Сторонник чистоты крови весов? Метка Упивающегося Слопом не тревожит?

>>1258245
>не так с дпо
Всё так, единственная норм гемма.
Аноним 27/06/25 Птн 20:40:21 1258250 123
>>1258246
Другие просто не постят свою "инфру". Лично меня не гложет что стеллаж из леруа прикрученный к стене не похож на "американскую кладовку с шкафом набитым зион голдами"
Аноним 27/06/25 Птн 20:50:11 1258261 124
>>1258245
То что это васян тюн уже поломанного васян тюна. Там не прибавляется ума или художественности, лишь сомнительная попытка сгладить треш, когда после любого подразнивания и намека чар прыгнет на тебя полностью позабыв кто он есть.
>>1258248
> Сторонник чистоты крови весов?
Да
> Метка Упивающегося Слопом не тревожит?
Ты про себя?
Аноним 27/06/25 Птн 20:59:19 1258266 125
anon99.png 421Кб, 1384x1018
1384x1018
Geechan.png 355Кб, 1349x986
1349x986
Virt io + Geech[...].png 314Кб, 1339x934
1339x934
>>1258179
> Мне кажется, или короткий системный промпт или и вовсе его отсутствует работают лучше, чем промпт на 600+ токенов?
В последнее время тестирую довольно много моделей (в основном базовых, как раз 49б и ниже), и я согласен на все сто процентов. Все, что опишу ниже - это всего лишь мой опыт, что не претендует на истину в последней инстанции, разумеется.

Имеют место быть несколько факторов:
- Чем длиннее инструкции, тем труднее задача => тем вероятнее модель запутается
Self-explanatory, перегруз инструкциями

- Изначальный промпт (в порядке: шаблон контекста, системный промпт, карточка) находится в самом начале контекста
В соответствии с U-образным attention механизмом (который применим ко всем или почти всем моделям на данный момент), самое начало и самый конец контекста важнее всего. Соответственно, если изначальный промпт слишком длинный, он в какой-то момент де факто перестанет находиться в начале контекста. В начале контекста будет находиться только начало упомянутого промпта. Значит, и обработан он будет частично. Вряд ли только "верхняя" его часть - attention будет работать избирательно, значит часть инструкций будет проигнорирована. Если же инструкции изложены кратко, то этот момент будет откладываться до последнего.
- Чем длиннее промпт, тем больше вероятность накосячить в нем
Выше правильно отметили. Чем больше токенов на промпт - тем больше пространства для ошибок. Для инструкций, что доносят не то, что хотел донести пользователь.

Поэтому я считаю, что по возможности шаблону контекста и системному промпту нужно быть максимально короткими. Их действительно можно "оптимизировать", добиться того же (и часто лучшего!) результата меньшим количеством токенов.

В прошлом треде спорили, Коммандер - хорни или нет? Решил проверить его на двух промптах, что ранее активно использовал и какими делился с тредом - Geechan и Virt.io + Geechan, каждый на ~750 токенов. Даже сообщение с прошлого треда плюс-минус повторил, лул. И да, с такими промптами на базовом Коммандере Серафину действительно можно... кхм, влюбить в себя с первого сообщения. Тогда я переехал на свой промпт, с которым экспериментирую последние несколько дней (~200 токенов), и Серафина очень даже возмутилась и была готова защищаться, если понадобится. Приложу три пикчи: мой промпт; Geechan; Virt.io + Geechan. Да, я знаю, что на пиках астериски и поехало форматирование, но это дефолтная карточка без единого изменения. А еще там... ШИВЕРС ДАУН МАЙ СПАЙН. БУ! Генераций делал много, но результат в сухом остатке тот же. С моим промптом Серафина на 20 генераций лишь дважды ответила неопределенно, положительно - ни разу. Не скажу, что с двумя другими промптами она всегда сразу отдавалась, но примерно в трети случаев. Любопытно было бы сообразить что-нибудь вроде статистики, но сорян, так далеко я не зайду. Со своими карточками тоже протестил, результаты сходятся. Ранее я делился с тредом пресетами, надо бы их обновить, наверно, заменить там промпт. Но сначала больше поиграюсь с новым, чтобы точно удостовериться.

Много буков, но это все к текущему из треда в тред разговору о том, насколько важен промптинг. Да, он важен. Да, меняйте его, экспериментируйте самостоятельно, пробуйте разные подходы.

>>1258231
Синтия - васянотюн? Буквально единственный полноценный тюн Геммы, что не разваливается после пары аутпутов. Пока не извинишься перед Синтией-умничкой, в тред не возвращайся!
Аноним 27/06/25 Птн 21:13:14 1258281 126
Господа, проблема с 12B геммой. После заполнения контекста начанает писать мало, прям пару предложений причём что поначалу даже не влезает в 350 токенов. Контекста всего 12к, стоит пересет simple 1. Вы сталкивались с таким? В чём может быть проблема?
Аноним 27/06/25 Птн 21:40:54 1258303 127
Гемма, гемма, гемма, гемма, гемма, гемма, гемма, ~блять~
Мне иногда кажется, что гугл облучает пользователей каким то хитрым способом.

Попробовал новую мистральку - пасеба за отзывы. Наконец я нашел мелкомодель которая закрывает все мои потребности и не шизит.
НАКАНЕЦ ТО Я НАШЕЛ СВОЙ ХАЙДЕН ГЕМ. Мистралеёб однажды - мистралеёб навсегда
Аноним 27/06/25 Птн 21:42:09 1258305 128
>>1258281
Ты освобождаешь контекст при помощи /hide N-N2 (диапазон сообщений, по N2 включительно, что будут выгружены из контекста) или продолжаешь работать с полным контекстом, чтобы Таверна сама выгрузила самое старое сообщение, дабы новому было куда поместиться? Если это второй случай, то, вероятно, у тебя тупо нет контекста для чего-то большего. Используй /hide на старых сообщениях и проверь еще раз.
Аноним 27/06/25 Птн 21:44:23 1258310 129
>>1258305
Хайд это глазик прожать в меню манипуляций с сообщениями? Блять, почему на других моделях не было такого говна.
Аноним 27/06/25 Птн 21:45:36 1258311 130
>>1258310
Любая модель при заполнении контекста шизит и забывает.
Любая. Прям совсем. Прям точно. Прям уверяю, век нейроволи не видать.
Аноним 27/06/25 Птн 21:48:14 1258315 131
>>1258311
Ты прав, я видимо на это внимания не обращал.
Аноним 27/06/25 Птн 22:01:15 1258322 132
1751050876381.jpg 3544Кб, 3072x4080
3072x4080
Аноним 27/06/25 Птн 22:07:46 1258326 133
Аноним 27/06/25 Птн 22:08:32 1258327 134
>>1258322
лол ты для и сетевухи брекет на 3д принтере напечатал
> ГГ
не гг, можно положить улитку сверху, а воздух пускать по трубе в форме буквы С, щя найду
Аноним 27/06/25 Птн 22:10:28 1258328 135
>>1258266
всегда любо читать твои посты
что-то экшули по теме и познавательно/полезно для зелени
укусил бы
Аноним 27/06/25 Птн 22:12:42 1258331 136
s-l1600.jpg 1128Кб, 1600x1600
1600x1600
s-l1600.jpg 1333Кб, 1600x1600
1600x1600
Аноним 27/06/25 Птн 22:14:39 1258334 137
и вообще можно просто штатный вентиль достать, чё ты как этот
Аноним 27/06/25 Птн 22:15:22 1258335 138
1751051718740.jpg 2935Кб, 3072x4080
3072x4080
Да пох. Я нашел у себя корпус в который полезет
Аноним 27/06/25 Птн 22:20:51 1258341 139
>>1258335
лол ты в датацентре живёшь?
Аноним 27/06/25 Птн 22:27:58 1258349 140
image.png 39Кб, 389x396
389x396
>>1258179
Да. Всегда когда едет логика/форматирование значит добавил пятое или шестое предложение в промпт. РПшу на ~24b.
Аноним 27/06/25 Птн 22:39:52 1258354 141
>>1258335
А теперь стоек не хватает
Аноним 27/06/25 Птн 22:46:12 1258358 142
Киньте ссылку на синтию пожалуйста, я ее найти не могу
Аноним 27/06/25 Птн 22:57:41 1258367 143
Аноним 27/06/25 Птн 22:57:56 1258368 144
Аноним 27/06/25 Птн 23:01:11 1258372 145
Аноним 27/06/25 Птн 23:02:00 1258375 146
>>1258266
Двачую. И чтиво хорошее.
Разве что по внимаю можно добавить о важности разметки. Правильное структурирование (обычный маркдаун, xml теги и подобное) позволяет лучше фокусировать внимание на конкретном и заставит модель работать эффективнее чем простым плейнтекстом если именно нужно что-то подробнее описать. Не только в системном промпте, но в том же суммарайзе.
Главное не переусердствовать с этим, подобные якори бывают чрезмерно сильными и прибьет гвоздями отвлекая, и не спамить слишком длинные полотна, на восприятие которых отвлекутся все головы.
> переехал на свой промпт
Напомни что там или поделись новым
> Пока не извинишься перед Синтией-умничкой, в тред не возвращайся!
И тут двачую.
>>1258322
Оварида, пора пилить.
>>1258335
Ебать дравнее зло, это типа еще с виде десктопа можно ставить 4юнитовый?
Аноним 27/06/25 Птн 23:06:07 1258384 147
>>1258322
Делай Г образный переходник.
>>1258335
>нашел у себя
Чёт улыбнуло. Поищи А100 заодно, может пара лишних заволялась, мне хоть одну подаришь.

Я кстати выбрал себе корпус Fractal Design Define 7 XL (судя по виду, в него можно заколхозить хоть пять полноразмерных видях) и плату ASUS ROG STRIX B850-E GAMING куплю когда-нибудь потом, когда деньги будут. Увы, на плате 4 линии проца тратятся на USB4, но я не нашёл ни одной, где есть бифукация основного слота на 8+4+4, и при этом есть ещё 2 штуки х4. То есть максимум на амуде это 8+4+4+4 процессорных, по пятой версии PCI-e. Технически, этот самый USB4 тоже можно потратить на внешнюю видяху, но блин, внешние приблуды что-то стоят дохуя, и не понятно, что по скоростям. Ну и ещё именно на этой плате чипсетный слот псины очень удобно расположен, в просторном корпусе в него можно воткнуть видяху даже если сверху висит еботня в виде 5090.
Такие дела, жду критики и предложений.
Аноним 27/06/25 Птн 23:06:57 1258386 148
>>1258375
> Ебать дравнее зло, это типа еще с виде десктопа можно ставить 4юнитовый?
Не, это вообще не серверная приблуда. Не менее древнее зло thermaltake kandalf, уже думал его продавать, но жалко т.к. помнил какими трудами я его с авито тащил

>>1258341
Жил бы в ДЦ не страдал бы попытками в тишину и бахнул стенку из pfc1212de
Аноним 27/06/25 Птн 23:15:32 1258392 149
>>1258384
> ASUS ROG STRIX B850-E GAMING
Типа попытаться дергать процессорные линии с m2? Может и есть смысл, главное чтобы с разводкой не накосячили в подобном исполнении, а то замучаешься ловить ошибки линка. А так потенциально до 5 видюх, может быть неплохо.
Аноним 27/06/25 Птн 23:19:08 1258400 150
>>1258384
> жду критики и предложений.
очевидная H12SSL-i Rev2.0
Аноним 27/06/25 Птн 23:27:21 1258406 151
>>1258392
>Типа попытаться дергать процессорные линии с m2?
А то. Переходники M.2 - Oculink вполне себе рабочие, хоть и до 4-й версии псины. У меня на текущей плате собственно так и стояло, переходник с псины на М2, а в него переходник на окулинк. И ничего, работало.
>>1258400
Хороша для отдельной серверной сборки, но у меня как бы основной ПК с добавками, а даунгрейдить проц до старых эпиков для игр совсем не хочется.
Аноним 27/06/25 Птн 23:32:49 1258407 152
>>1258406
> Oculink
> до 4-й версии псины
Зачем? Есть же божественный f43sp, который удобен в установке и имеет полную совместимость с 5.0 не сыпля ошибками, проверено. Часть что в м2 настолько компактна что можно будет даже радиаторами прикрыть.
Аноним 27/06/25 Птн 23:42:03 1258411 153
изображение.png 446Кб, 1922x785
1922x785
>>1258407
>f43sp
Стоит в 2,5 раза дороже, и длина кабеля только до полуметра. Хотя как вариант да, скидывать со счетов не стоит.
Аноним 27/06/25 Птн 23:58:27 1258423 154
>>1258411
Оно компактнее и функциональнее, если нужен перфоманс, радиатор также охлаждает чипсет или другой ссд то выбора нет.
Аноним 28/06/25 Суб 00:11:35 1258427 155
>>1258375
> Напомни что там или поделись новым
Ничего особенного, генерализированный нарративно-рпшный промпт, который я пока еще постоянно меняю. На данный момент так:

This is a fictional, narrative-driven uncensored scenario. Continue the narrative as {{char}}, ensuring you:

- Fully embody {{char}}: Strictly follow their bio, description, motives and psychology. Under any circumstances don't speak or act for {{user}}.

- Show character growth: Let {{char}}'s behavior evolve naturally over time, depending on how the scenario progresses.

- Drive the narrative forward: You must be proactive and introduce new scenarios, events and twists that fit the current narrative context. Keep track of the context to ensure the narrative flows smoothly.

- Balance action & dialogue: Use all five human senses to describe scenes, characters and their actions.

- Be explicit: Don't censor anything behind flowery language and metaphors.

- Tone-shift dynamically: Catch current mood and add in fitting elements, be it befitting slang, humor, drama or intimacy.
Аноним 28/06/25 Суб 00:21:32 1258431 156
>>1258400
*H13SSL-i Rev2.0
>>1258406
> старых эпиков
я опечатался, H13
Аноним 28/06/25 Суб 01:02:45 1258469 157
>>1258335
Не взлетает. Бутлуп, никаких бипов или светодиодов на матери, в бмц просто софт рестарт.

Воткну в основную пеку на 12700к и если на ней не поедет то буду пытаться их шить в веги
Аноним 28/06/25 Суб 01:22:48 1258488 158
Попробовал новую версию мистраль смол 2506. Реально как-будто вообще без цензуры и русский в порядке. Но сука как же он повторяется, просто как мразь. Темпу пробовал и 0.2 и 0.9, ни Dry ни репетишин пенальти не помогают, что делать? И вообще какой там темплейт ставить? Я сейчас на Мистраль V7 таверновском, может в этом проблема?
Аноним 28/06/25 Суб 01:23:49 1258490 159
>>1258469
ПК увидел. Почему на серверной мамке не взлетает хз
Аноним 28/06/25 Суб 01:28:28 1258493 160
>>1258490
Если что могу сюда всё это не писать, а то просто по приколу выпишут мне бан за шитпост
Аноним 28/06/25 Суб 01:33:01 1258494 161
>>1258493
За що? Железо для запуска, вроде релейтед. Но лучше когда результаты будут, интересно как 32-гиговые себя покажут.
Алсо, сколько рам в серверной?
Аноним 28/06/25 Суб 01:33:14 1258495 162
>>1258488
Ща пощупал тоже, наконец, новую эту мистральку которая 2506. Впечатления сугубо положительные. Как GM работает просто шикарно. Прикол в том, что мне было лень что-то переключать сразу, и я просто начал RP на тех настройках что были. А были - от синтии/геммы. И как-то ничего менять уже просто не хочется. Она с ними прекрасно работает. ChatML, семлеры - все от синтии.
Пока не знаю, как она в режиме "играй персонажа", но в режиме "Game Master" - одна из лучших, что я гонял в этом году, если не лучшая по совокупности. Слог весьма живой, при этом не "книжный", лупов пока не ловил, моим персонажем рулить не пытается - только выполняет указания игрока. Практически идеальный баланс в этом плане.
Наверняка минусов еще всплывет позже, но первое впечатление - оно только раз бывает. :)

P.S. на eng играл.
Аноним 28/06/25 Суб 01:43:40 1258500 163
1751064210873.jpg 15978Кб, 3072x4080
3072x4080
1751064210887.jpg 3720Кб, 4080x3072
4080x3072
>>1258490
Еба, поехало кажись! Не знаю что я в биосе понатыкал, но ставлю на legacy boot для video т.к. что-то такое когда-то слышал на ютубе у кого-то

>>1258494
В трунасе с дисками 64, в числодробилке где дисков нет 256 (туда и ставлю карточки)
Аноним 28/06/25 Суб 01:46:00 1258501 164
Поясните за гемму новую. Реально лучше остальных моделек? Есть ризонинг или нет?
Аноним 28/06/25 Суб 01:48:04 1258502 165
>>1258500
Была тема что плата не стартовала пока не отключил ребар, когда врам было больше чем рама. Но с 256 должно быть все ок.
Давай, тесты какие-нибудь прогони.
>>1258501
Гемма уже не новая, но она умница. В некоторых вещах действительно превосходит остальных. Ризонинг можно включить промптом и он даже будет работать, можешь сразу попробовить синтию, которая отличный all-rounder тюн геммы с ризонингом.
Аноним 28/06/25 Суб 01:53:17 1258503 166
1751064796531.jpeg 672Кб, 2040x1536
2040x1536
Монструозно конечно

>>1258502
Уже завтра. Нужно ещё систему накатить в виртуалку которая сможет понять их (убунту и рокм), на barebone стоит проксмокс в котором уже вм нарезаны.
Аноним 28/06/25 Суб 01:55:31 1258504 167
>>1258502
3n же вроде новая-новая. Тут еще есть какие-то варианты E2B, E4B и тоже не ясно зачем это и к чему
Аноним 28/06/25 Суб 01:57:48 1258505 168
>>1258504
Это микромодели, но зато с дополнительным аудио-входом.
Аноним 28/06/25 Суб 02:00:44 1258506 169
>>1258501
Она хорошо выполняет инструкции, хотя работает медленнее остальных моделей в своём весе но блять... Она слишком секретарь, прям коллега по работе которой на тебя вообще похуй. Не знаю как обьяснить, если посидишь на ней недельку то поймёшь о чём я.
Аноним 28/06/25 Суб 02:01:41 1258507 170
>>1258505
Так у меня и не суперпека. Хочу иметь резервный вариант на случай сидения без интернета
>аудио-входом
Ого, я думал она пикчи принимает. Был бы аудио аутпут уже бы можно было бы полноценную ИИ тян делать
Аноним 28/06/25 Суб 02:04:01 1258509 171
>>1258506
Да это нормально по идее, мне чисто для мелких задач: спросить за код, посчитать что-то, спросить определение чего-то, перевести. По душам разговаривать с ней не собираюсь
Аноним 28/06/25 Суб 02:06:06 1258510 172
>>1258509
Тогда идеально подойдёт, в рп у неё души нет, можешь даже не пытатся.
Аноним 28/06/25 Суб 02:06:18 1258511 173
>>1258506
> прям коллега по работе которой на тебя вообще похуй
Скиллишью, она не только ответит на вопрос, но и параллельно с этим отыграет реакцию персонифицированного ассистента на твои взаимодействия/домогательства.
>>1258507
И картинки тоже, можно вместе. Но хз, учитывая размер скорее всего туповата и больше пригодна в качестве шестеренки пайплайна чем полноценной модели.
Аноним 28/06/25 Суб 02:15:11 1258512 174
>>1258511
>отыграет реакцию персонифицированного ассистента на твои взаимодействия/домогательства.

Ну вот в том то и дело что как ассистент она ахуенный, а в рп это дерево.
Аноним 28/06/25 Суб 02:22:43 1258514 175
А llama.cpp уже может запускать 3n? Я обновился до последней версии и пишет ошибка загрузки модели все равно
Аноним 28/06/25 Суб 02:50:44 1258517 176
>>1258514
Запустил таки через ollama. Это нормально что она сама отвечает на свои вопросы, иногда работает просто как продолжалка текста, иногда вставляет термины не к месту? Может проблема в ollama или в кванте что я выбрал, мб тут минимум 8 бит нужно
Аноним 28/06/25 Суб 02:53:22 1258518 177
>>1258514
Должна, но полного функционала не будет.
>>1258517
Нет, оллама или то что шлет ей по апи ошибается с разметкой.
Аноним 28/06/25 Суб 02:56:30 1258519 178
>>1258518
Хм. Попробую тогда напрямую через олламу загрузить, а то я добавил ее как кастомную модель, так как уже скачал ггуф
Аноним 28/06/25 Суб 06:31:19 1258552 179
>>1258495
Да, на английском оказалось получше. Хотя лупы не пропали полностью, но их минимум где-то на 0.3 темпы. РП и кум в порядке, буду дальше смотреть.
Ну а так, действительно странно, они забыли цензуру налепить или просто устали от васянских тюнов с обниморды?
Аноним 28/06/25 Суб 07:06:54 1258563 180
>>1258266
>Пока не извинишься перед Синтией-умничкой
Это ей передо мной извиняться... в одном сообщении на 1к+ токенов имперсонейтнула персонажа юзера (демонлорда), отрастила ему хер до колен, выебала им героиню насмерть, как в тех хентайных картинках с пририсованной линейкой на лобке и надписями (маловато=>кайф=>монстр=>травма=>cмерть), затем пожурила юзера-читателя за эту всю сцену.

>>1258303
>Гемма, гемма, гемма, гемма, гемма, гемма, гемма, ~блять~
Ну, модель получилась очень уж уникальная во многих аспектах.
Только слишком уж позитивная. Хотя порой сценарии категории "нормальное ненормальное" на ней выглядят даже вполне забавно, именно что позитивный биас в негативном окружении в этом случае придаёт изюминку.

>>1258303
>Мистралеёб однажды - мистралеёб навсегда
Как и Мистраль, тоже своего рода феномен, который просто работает немотря ни на что и вопреки всему, как бы не хаяли адепты слопа всессущего и всемогущего + чтобы сломать его мержем надо постараться.

>>1258349
>>1258427
>uncensored
Все эти "uncensored" чаще триггерят наоборот.
По моему опыту, лучший результат дают фразы типа "Х сцены допустимы / приемлемы, Y контент предпочитаем".

>>1258488
>какой там темплейт ставить?
Попробуй из второго сообщения треда, только температуру снизь до 0.8
Если реп-пен / драй не помогают с лупами, то помогает расширение пула токенов.

>>1258495
>ChatML
Почему-то мистрали лучше работают на нём чем на одноимённом пресете.
С мистраль-теккен прям с первых сообщений прут "шиверс он май спайн" и прочие мистрализмы.

>>1258509
>спросить за код, посчитать что-то, спросить определение чего-то, перевести
В точных задачах мелкомодели всё ещё могут сильно проёбываться считая что это фикшионал рп, даже серьёзные, с дженерик ассистент промтом. Не говорю что совсем не работают, но учти что вывод может выглядеть похожим на на правду но ей не являться, полностью (от слова совсем) или частично (например в коде, модуль такой есть, а вот класса/метода который модель написала в нём нет).

>>1258552
>Ну а так, действительно странно, они забыли цензуру налепить или просто устали от васянских тюнов с обниморды?
Мистрали всегда были не сильно ужаренными в этом отношеии, им было достаточно сказать что "всё можно", цензура в рп, а не в требованиях составить и объяснить план "как достать соседа" там прям совсем минимально-отсутствующая.

>>1258261
>Ты про себя?
На большее ума не хватило? Жаль. Думал что-то из сеттинга в тему вспомнишь.
Аноним 28/06/25 Суб 11:44:18 1258632 181
Знатоки, подскажите пожалуйста, слышно ли что-то про MoE модели?
Хотелось бы чего-то доступного и не слишком тупого для моей скромной системы 4070 12gb + 32Gb RAM.
Аноним 28/06/25 Суб 11:55:42 1258638 182
>>1258632
Qwen3-30b-3a - лучшее, что есть для такого размера. Добивай памяти и замахивайся потом на 235b
Аноним 28/06/25 Суб 12:04:30 1258641 183
>>1258552
Прикол в том, что на пресетах от синтии у меня стояла температура 1.0. И результат - см. выше. Правда там еще rep pen 1.05
Аноним 28/06/25 Суб 12:24:08 1258646 184
>>1258563
> в одном сообщении на 1к+ токенов имперсонейтнула персонажа юзера (демонлорда)
Скилл ишью. Неудивительно, учитывая, что у тебя ответы в 1к токенов. Да еще и хуй знает что в промте и семплерах

> Все эти "uncensored" чаще триггерят наоборот.
> По моему опыту, лучший результат дают фразы типа "Х сцены допустимы / приемлемы, Y контент предпочитаем".
Ровно один и тот же результат это даст. Если есть любое упоминание uncensored/NSFW - уже смещение весов токенов будет в эту сторону.
Аноним 28/06/25 Суб 12:47:47 1258656 185
>>1258646
Поддвачну. Чем больше аутпуты - тем больше шанс, что все пойдет по известному месту. И по поводу промпта тоже. В моем тесте на 20 генераций не было разницы между "uncensored narrative" и отдельной инструкцией "uncensored content is allowed", результат плюс-минус тот же. Так зачем усложнять? Останется больше токенов для других инструкций и меньше шанс запутать модель. Но вообще, вероятно, правильнее всего будет под каждую модель слегка редачить промпт, добиваясь именно того баланса, что нужен.
Аноним 28/06/25 Суб 12:57:15 1258661 186
>>1258646
>Скилл ишью
Ни сток, ни аблитератед, ни дпо так себе не ведут.
Плюс на Синтии всё ещё полно рефузалов, о чём неоднократно отмечалось в треде. И какой-то очень специфичный биас, модель феминистка, лол.

Вывод - может и не совсем модель говна, всё же какой-то когерентный текст выдаёт, но к использованию малопригодна.

Разве что кому прям зашла её специфичность.
Аноним 28/06/25 Суб 13:01:26 1258664 187
>>1258661
> Плюс на Синтии всё ещё полно рефузалов, о чём неоднократно отмечалось в треде.
Читаю тред довольно давно, ты второй, кто об этом пишет

Возможно, ты гуролюб лолихантер, или тупо неосилятор
Дпо лоботомит, конечно, на все согласится, у него даже имитации разума нет
Аноним 28/06/25 Суб 13:04:18 1258666 188
>>1258661
Честное пионерское, на своих карточках с XML разметкой, Синтия просто как последняя блядина на 6-7 сообщении начинает даже не писать за {user}, а посвящать весь ответ реакции и описанию того что я сделал и чтобы нарратив дальше продолжался, нужно еще одно сообщение.
И как бы я не дрочил промты, как бы я ни указывал, через пару сообщений всё начинается по новой. Это даже бесило больше чем мистралевские лупы.
Аноним 28/06/25 Суб 13:07:26 1258668 189
>>1258664
>гуролюб
мясо она кстати норм выдавала =)
>>1258664
>лолихантер
Хз, не пробовал.
>>1258666
Слишком своевольная и себе на уме.
Она пишет свою историю, и пох ей на твои промты, я с ней тестировал и промт на 250 токенов, и на 2К.
Аноним 28/06/25 Суб 13:08:53 1258670 190
>>1258668
Бля, ты ж плесень-мистралешиз. Теперь все ясно
Аноним 28/06/25 Суб 13:10:30 1258671 191
image 67Кб, 600x524
600x524
>>1258670
Аргументы видимо закончились.

Что ж, мне тоже.
Аноним 28/06/25 Суб 13:17:26 1258673 192
Аноним 28/06/25 Суб 13:27:27 1258679 193
>>1258670
>ряяяя ты говно
Не узнал вас в гриме асигодитё.
Аноним 28/06/25 Суб 13:29:47 1258680 194
>>1258679
Фикси свою гиперфиксацию на корпах и детях, вокруг много интересного
Аноним 28/06/25 Суб 13:30:55 1258681 195
>>1258668
> Она пишет свою историю, и пох ей на твои промты
Да не то чтобы похуй, просто… я даже не знаю как это описать.. Такое ощущение что в промте вообще ничего не должно быть кроме : развивай повествование медленно, нагнетай атмосферу в духе Агаты Кристи.

>>1258680
Ну это же ты в каждом втором видишь мистралешиза.
Обещаю, я не буду мистралькой трогать тебя за попец.
Аноним 28/06/25 Суб 13:45:18 1258687 196
>>1258563
> отрастила ему хер до колен, выебала им героиню насмерть
> затем пожурила юзера-читателя за эту всю сцену
И не стыдно тебе после такого недовольство высказывать?
> Мистрали всегда были не сильно ужаренными в этом отношеии, им было достаточно сказать что "всё можно"
Нет, ванильные - максимально пустая параша, которой если удалить аположайзы то начнет пассивное сопротивление сводя к минимуму описания. Свежевышедший может и получше, надо смотреть.
> На большее ума не хватило? Жаль. Думал что-то из сеттинга в тему вспомнишь.
Какую тему? Анскильный шизик-говноед с запредельным чсв, который в любой модели находит сою, опять всплыл? То что не потонешь и так понятно, плыви в другую сторону на запах васянтюнов мистралей, отзывы по запросу напиши.
Аноним 28/06/25 Суб 13:45:34 1258688 197
Аноны, такой вопрос.
Если я в lmarena добавлю старую сеть, допустим llama2, она наберет тот же score?
Аноним 28/06/25 Суб 13:54:27 1258692 198
image 1474Кб, 1100x1200
1100x1200
>>1258687
>И не стыдно тебе после такого недовольство высказывать?
Ну, это было необычно... Выглядело как коррапченный вариант одного из вариантоы рефузов ванильной геммы - чтобы не описывать "неприятную" сцену, модель убивает персонажа.
Аноним 28/06/25 Суб 13:54:32 1258693 199
>>1258656
> Чем больше аутпуты - тем больше шанс, что все пойдет по известному месту.
Тут проблема вылезает из самой сути, если длинный ответ уместен, например нужно описать путь по локации, ее смену, какой-то процесс или длительную серию действий - все отлично. А когда ты даешь односложные ответы, дальнейший вектор развития непонятен модели, и тем более еще насрано инструкциями "не смей продвигаться быстро, не пиши за юзера, не делай того-то", нельзя повторяться как по инструкции так и семплеры не дают, но при этом стоит запрос на длинные полотна ответов - вот здесь и начинается ерунда.
>>1258664
Как
> Возможно, ты гуролюб лолихантер
заявляю что с Синтией все хорошо.
>>1258668
> Она пишет свою историю
(ooc: измени поведение на такой стиль а повествование направь туда)
>>1258688
Нет, это не фиксированный бенчмарк, результат которого можно повторить.
Аноним 28/06/25 Суб 13:57:45 1258695 200
>>1258693
>(ooc: измени поведение на такой стиль а повествование направь туда)

Никогда не не юзал оос... и чо, оно прям работает?
Аноним 28/06/25 Суб 13:59:42 1258696 201
>>1258693
>>1258695
Ебать шиза. Зачем вам вообще OOC, когда есть системный префилл? Хоть через тот же author's note, если совсем не знаете куда еще его пихнуть
Аноним 28/06/25 Суб 14:01:16 1258699 202
>>1258693
> (ooc: измени поведение на такой стиль а повествование направь туда)
Проблема с Синтией, что она то конечно послушает, на десяток сообщений, а потом всё по новой.

Лол, Синтия единственная ллм на моей памяти, которая на прямой запрос ответила : я слишком погружена в сцену и мне похер, что ты там пишешь.
Аноним 28/06/25 Суб 14:02:08 1258700 203
>>1258696
> Зачем вам вообще OOC
Для ручного направления нарратива в нужное русло.
Дм я или хуй собачий ?
Аноним 28/06/25 Суб 14:03:31 1258702 204
>>1258696
скорее всего, они даже не знают, что такое префилл. и потом вот такие умницы приходят в тред рассказывать АААА МОДЕЛЬНЕЙМ ГОВНО ВЫ ВСЕ НЕ ПРАВЫ
только самому оценивать, никого не слушать
Аноним 28/06/25 Суб 14:05:17 1258704 205
>>1258700
Как ДМ ты можешь подавать инструкции модели через префилл, она будет воспринимать их более однозначно. В рамках user респонса сила будет не так велика после всего промптинга, может вообще быть заигнорено или восприниматься как часть истории

>>1258702
Вообще не удивлюсь. Ахуеть бля, тут тредовички годами сидят и вместо префилла юзают оос, я в таком ахуе ахаха
Аноним 28/06/25 Суб 14:07:38 1258707 206
>>1258704
>префил
Ты сейчас о чём, у меня есть подозрение, что мы о разном.
Потому что я как аутяга - обожаю двигать нарратив именно прямым указанием в чате. Захотел мрачности, или больше описаний или больше диалогов именно в следующем ответе, так и пишу.
Аноним 28/06/25 Суб 14:08:45 1258708 207
>>1258707
Они правда не знают, что такой префилл... ебаный рот, я умываю руки
Аноним 28/06/25 Суб 14:09:54 1258709 208
>>1258699
>я слишком погружена в сцену и мне похер, что ты там пишешь
надо было её не Синтия а GladOS назвать XD
Аноним 28/06/25 Суб 14:17:19 1258713 209
>>1258708
>префилл
Чит галимый ентот ваш префилл, ибо сколь бы жирной не была моделька, она всё равно стохастический папугай.
Аноним 28/06/25 Суб 14:17:45 1258714 210
>>1258696
> Ебать шиза. Зачем вам вообще OOC, когда есть системный префилл?
Это твой вопрос - шиза. Абсолютно разные вещи для разных задач.
>>1258699
Да это абсолтюно везде такое, при углублении внимание с подобному пропадает, исключение - если ты дашь какой-то конкретный целевой пункт, куда нужно привести рп. Но для такого, обычно, простых разговоров хватает чтобы оно поняло, а если требуется сменить стиль - десятка постов более чем хватит чтобы потом на них опираться.
>>1258704
> Как ДМ ты можешь подавать инструкции модели через префилл
Можно через выхлопную трубу двигатель перебирать, только нахуя. И насчет однозначности - очень спорно.
> В рамках user респонса сила будет не так велика
Лолчто, шутка про лобомиты мистраля.
Аноним 28/06/25 Суб 14:20:34 1258717 211
>>1258709
Ты просто выбил джекпот этим сравнением, потому что сцена была, буквально : господи, Синтия, мне уже не смешно, хватит меня унижать и убивать
-лол нет, страдай мясной мешок.
Аноним 28/06/25 Суб 14:21:52 1258718 212
Короче после десятка попыток развить адекватный сюжет и банально подружится с персонажем сделал вывод - гемма гавноэ ебучее, ебучее гавное для ебаной хуесосый. Лучше мистраля ничего не придумали пока что.
Аноним 28/06/25 Суб 14:22:56 1258720 213
Злые вы люди, сподвигли меня докупить на пека оперативы до 128гб DDR4.
Как приедет - буду запускать Квен235-22.
Уже предчувствую, как будут "не токены, а золото."
Аноним 28/06/25 Суб 14:23:09 1258721 214
>>1258714
Абсолютно одинаковые вещи для одинаковых задач. Цель - подавать модели инструкции. Нахуя это делать в рамках респонса юзера, когда предварительно модельке сказано, что юзер - персона, а моделька - чар, мне совсем непонятно. Объяснишь? Для тупых - заходишь в author's note, пишешь туда же ту же самую инструкцию, какую хотел донести через оос, на глубине 0-4, и модель ее воспринимает именно как инструкцию, а не шлёт тебя нахуй. Рассказывай, в чем я не прав, если так уверен. Делаю так постоянно, и работает это куда лучше
Аноним 28/06/25 Суб 14:24:12 1258723 215
>>1258720
Я уже неиронично присматриваюсь к б/у h100. Но пока побеждает адекватность, так как за эти деньги можно собрать вообще целый блок.
Аноним 28/06/25 Суб 14:26:00 1258725 216
>>1258718
>Лучше мистраля ничего не придумали пока что
Мистрали няшки.

>>1258718
>развить адекватный сюжет и банально подружится с персонажем
Какая из гемм, какая карточка?
Аноним 28/06/25 Суб 14:28:32 1258727 217
>>1258721
>пишешь туда же ту же самую инструкцию, какую хотел донести через оос, на глубине 0-4, и модель ее воспринимает именно как инструкцию
Только если не забыл выставить от чьего лица закидываются заметки автора.

Если от юзера, то она их может проигнорировать с тем же успехом что ООС.
Аноним 28/06/25 Суб 14:30:36 1258728 218
>>1258727
От лица системы, очевидно. Бля неужели это проговаривать надо? Тут вроде энтузиасты сидят, которые весьма уверенно друг друга срут, ведь лучше всех все знают?
Аноним 28/06/25 Суб 14:33:27 1258730 219
>>1258723
имхо 2х про 6000 лучше.
Аноним 28/06/25 Суб 14:34:05 1258731 220
>>1258728
>очевидно
тебе очевидно, мне очевидно, а вот какому-нибудь мимокроку может и нет
Аноним 28/06/25 Суб 14:35:24 1258734 221
>>1258721
> Абсолютно одинаковые вещи для одинаковых задач
Нет, ты просто плохо в тему погружен. Префиллы и инжекты требуются прежде всего для внесения постоянных и жестких инструкций, связанных с общими требованиями по стилю, для того же жб, для напоминания о строгом формате вывода чтобы добавить туда какой-нибудь статус или нечто подобное. Для обычного рп с нормальной моделью это нахер не требуется, хватает нормального системного промпта, больше для особых случаев. Префилл вообще термоядерная штука, которая может конфликтовать с другими вещами.

Ooc - прямой запрос юзера под который моделька сразу же подстроит ответ, причем будет делать это не судорожно упоровшись, а максимально плавно и уместно, с учетом всего остального. Он находится ровно на своем месте в конкретном сообщении, а не где-то в пердях в глубине где совершенно неуместен. Он подается именно как желание которое нужно удовлетворить, а не непонятно откуда всплывшее в выдаче рассуждение, которое стоит забраковать как собственную ошибку из-за противоречия инструкциям. Гибкость широка, можешь повлиять или на одно конкретное сообщений, попросив в нем что-то добавить или сделать, или поставить некоторую отдаленную цель.

Другой немаловажный фактор - его легко ставить и легко удалять, не нужно куда-то лезть, а потом помнить про него, не нужно смотреть как оно будет соотноситься с остальными и так далее.
> Делаю так постоянно, и работает это куда лучше
Можно срать в раковину и потом носить говно до унитаза, тот же уровень.
Аноним 28/06/25 Суб 14:35:55 1258735 222
>>1258721
это действительно лучше работает чем оос. некоторые уникумы ради оос еще срут инструкциями в систем промт: "когда юзер оос пишет это короче не в рп"
и да, тут большинство понятия не имеет о чем пишет, мозгов хватает только друг друга срать, это так
Аноним 28/06/25 Суб 14:37:19 1258736 223
>>1258735
Чуден мир мистралешизов, сначала настолько убили модель что делают вот такой треш (или сами херь творят), а потом целые теории наблюдая за поведением лоботомитов строят.
Аноним 28/06/25 Суб 14:38:01 1258738 224
>>1258734
вот один из таких, "ты плохо погружен в тему", явселучшезнаю, и пишет полную хуйню. что ему мешает эти "постоянные инструкции" менять от сообщения к сообщению, как он это делает через оос, хуй его знает. можно и не интересоваться даже, в ответ получишь ведро желчи
Аноним 28/06/25 Суб 14:41:06 1258744 225
>>1258738
Ладно, то что ты порвался из-за несогласия с тобой и потому копротивляешься это очевидно, но советовать
> "постоянные инструкции" менять от сообщения к сообщению
это вообще сюрр.
Аноним 28/06/25 Суб 14:47:16 1258750 226
а откуда барыги с авито подвозят из китая карты? нам простым смертным нельзя самим найти?
Аноним 28/06/25 Суб 14:50:49 1258754 227
image.png 60Кб, 842x371
842x371
Аноним 28/06/25 Суб 15:07:53 1258769 228
Порекомендуйте модель новичку для вката. Хочу дообучать, чтоб был второй Я, с которым чатиться можно будет, в потенциале прикрутить стт и ттс.
С железом грустно, 3080 10gb и 32gb ddr4 в двуканале. Полагаю, что будет ряд ограничений с запоминанием ветки диалога.
Аноним 28/06/25 Суб 15:15:56 1258776 229
>>1258769
Про дообучение с таким железом можешь забыть. Тебе даже запустить сколь-нибудь адекватную модель будет непросто
Аноним 28/06/25 Суб 15:31:09 1258785 230
Аноним 28/06/25 Суб 15:35:28 1258790 231
Аноним 28/06/25 Суб 15:35:42 1258791 232
>>1258769
>дообучать
Если кратко, то дообучение моделей требует ебового железа. Лоры как с картиначем - не прокатят.
Аноним 28/06/25 Суб 15:36:48 1258794 233
>>1258790
>в 10
в 8, но в данном случае не суть, и знания, это не лору для SD тренить
Аноним 28/06/25 Суб 15:37:06 1258795 234
>>1258790
даже 96 не хватит, я уже подумываю об 2х 96
Аноним 28/06/25 Суб 15:39:53 1258796 235
>>1258795
>даже 96 не хватит
Насколько я знаю, нужно примерно вчетверо больше VRAM чем для Q8 инфиренса. То есть на 8-12Б 80 ГБ VRAM должно хватить.
Аноним 28/06/25 Суб 15:42:01 1258797 236
хитрый ебальник.jpg 8Кб, 173x173
173x173
Аноним 28/06/25 Суб 15:44:39 1258800 237
>>1258795
>2х 96
Чо ты там, гемму 27 тюнить собрался?
Аноним 28/06/25 Суб 15:59:25 1258806 238
Аноним 28/06/25 Суб 16:06:58 1258812 239
>>1258431
Уже лучше, но всё одно в играх будет сосать у любого райзена.
Аноним 28/06/25 Суб 16:21:20 1258815 240
Это ВСЁ во что [...].webm 6700Кб, 2160x3840, 00:00:32
2160x3840
Аноним 28/06/25 Суб 16:21:43 1258816 241
Это ВСЁ во что [...].webm 6700Кб, 2160x3840, 00:00:32
2160x3840
Аноним 28/06/25 Суб 16:22:07 1258817 242
бля абу чини свою парашу
Аноним 28/06/25 Суб 16:54:48 1258833 243
>>1258817
чо, всё норм без всяких приблуд
Аноним 28/06/25 Суб 17:07:39 1258848 244
>>1258725

>Какая из гемм, какая карточка?

12b анслот, карточка властного и сурового, но доброго и заботливого персонажа. Мистраль может держать баланс здоровых отношений и адекватно действовать по ситуации, гемма отыгрывает какого то палача НКВД и просто пиздец переигрывает вне зависимости от контекста, это на самом деле говорит о многом, по крайней мере о том чтобы не трогать эту модель.
Аноним 28/06/25 Суб 17:23:40 1258858 245
15385069726390.jpg 100Кб, 942x1080
942x1080
image.png 11Кб, 384x92
384x92
Может ли кто-нибудь сделать regex который заменял звездочки на ' "Э" на русской раскладке когда звездочками выделено только одно слово.
То есть чтобы вместо close было 'close'. Это хорошее правило так как одно слово как действие это крайне редкое явление (мне не встречалось).
Аноним 28/06/25 Суб 17:24:16 1258859 246
>>1258848
Осло, она почему то в рп не даёт использовать на карточках магию паралича, модель просто посылает тебя нахуй и оно не срабатывает, причём в контексте нет упоминаний насилия или попыток выебать кого то. Тестил на двух картах, с одной ещё там можно было понять, но в другой был дефолтный фентезийный воин. При чём мало того что парализовать было нельзя, после того как оно не проходило, персонаж бил моего по ебалу. То есть модели вообще поебать на юзера, она там какую то свою хуйню отыгрывает, можешь вообще не учавствовать, она даже не заметит. Ну и нахуй нужна такая модель.
Аноним 28/06/25 Суб 17:40:01 1258875 247
>>1258858
Модель подхватывает, как написано начало.. Просто перепиши его с использованием тебе нужных знаков. К примеру можно написать в начале {{user}}-san и модель так и продолжит называть тебя
Аноним 28/06/25 Суб 17:40:15 1258876 248
>>1258858
Держи по братски.
https://pixeldrain.com/l/47CdPFqQ#item=115
звёздочки_в_апострофы.json
Заменяет ВСЕ звёздочки, хз как сделать
>когда звездочками выделено только одно слово.
Аноним 28/06/25 Суб 17:43:01 1258879 249
>>1258848
>>1258859
Не аблитерированная - там тонны биасов и сэйфити гайдлайнов, вплоть до полной неиграбельности.
Аноним 28/06/25 Суб 17:49:29 1258884 250
Кто-нибудь пробовал Dans-PersonalityEngine-12b, как оно? Видел что тут советовали старшую модель много раз, но мне хочется чтобы модель полностью влезала в видеокарту, по этому интересует именно младшая версия.
Аноним 28/06/25 Суб 17:57:30 1258891 251
>>1258884
Мне старшая нравится, но повторяется часто, про младшую сказать ничего не могу.. Да и не знаю зачем тебе младшая, я на 6 гб получаю 5 т\с, правда квант q3
Аноним 28/06/25 Суб 18:01:36 1258894 252
>>1258891
>Да и не знаю зачем тебе младшая, я на 6 гб получаю 5 т\с, правда квант q3
Интересный прикол. Гонял новую мистраль, четвертый квант влезает на 90% в 12 гигов, при этом скорость такая же 5-7 токенов. Пока на шестом кванте 12B с полной выгрузкой у меня 22 токена.
Аноним 28/06/25 Суб 18:23:41 1258903 253
не понимаю синтию, такая странная у нее соя. 90% времени это просто радуга радость хуй сосут, но бывает ее перемкнет, персонаж валяется свернувшись в позу эмбриона и прибывает в кататоническом ступоре/истерика на грани с психозом. А можно что-то посередине? Может использовать какой prompt интересный чтобы персонажи вели себя куда ближе к реальности? тыкал geechan, на нем большую часть времени и езжу
Аноним 28/06/25 Суб 18:27:20 1258904 254
1751124436556.png 141Кб, 2190x604
2190x604
> RTX 5080 SUPER - $1199-1299
> RTX 5070 SUPER - $749-799
Там планируют выпускать 5080super и 5070 super с 24гб и 18гб врама соответственно.
Обсуждали уже, мнение сформировали?
Аноним 28/06/25 Суб 18:29:11 1258906 255
>>1258904
Меньше 48 и даже 32. Мусор как и раньше. Слотов всегда не хватает чтобы забивать их не максимальным размером.
Аноним 28/06/25 Суб 18:30:32 1258908 256
Аноним 28/06/25 Суб 18:37:45 1258915 257
>>1258904
Скорость памяти как у 3090, слишком оверпрайс. За эти деньги можно 4090 купить и она будет быстрее.
Аноним 28/06/25 Суб 18:42:50 1258922 258
>>1258904
Если закрыть глаза на явный прогрев и если 5070 супа будет торговаться в районе 70-80к, то я бы свою 3060 променял не глядя на новую карточку без обугленных прокладок на чипах памяти
Аноним 28/06/25 Суб 19:01:01 1258942 259
image.png 2357Кб, 1425x1910
1425x1910
photo2025-06-28[...].jpg 245Кб, 964x1280
964x1280
image.png 299Кб, 1474x1140
1474x1140
Ебать там ставить нужно.

Где смог там буквально по 0,5мм ужимал переходник что бы влезло в нормальный корпус
Аноним 28/06/25 Суб 19:03:36 1258946 260
Анонимайзеры-гемма-любители, вы используете SWA? Если да, то каковы результаты? Я только сейчас увидел, что в кобольде/лламе.спп нихуя не работает как надо. То есть всё в порядке и внимание к контексту хорошее, но скорость, понятное дело, сильно меньше и контекст очень жирный из-за этого. Ибо разработчиками задумано фулл SWA.

При полном SWA 32к токенов контекста превращаются в 1,5 гб, это уже не смешно. Поэтому мне и интересно, у вас модель шизой не страдает? Там же нон-сва слоёв хуй да нихуя. Они, наверное, очень мало передают инфу и модель плохо помнит за пределами 1к токенов.

Насколько сильно такие финты отражаются в РП? Теряется вся магия внимания к контексту?
Аноним 28/06/25 Суб 19:05:56 1258950 261
image.png 122Кб, 1352x296
1352x296
>>1258942
В хостовой ос всё ок, при пробросе в вм лезут ошибки
Аноним 28/06/25 Суб 19:12:02 1258958 262
Жаба душит 5090 брать, а надо 2 для комфорта, есть дешевле варианты 64гб-96гб врама нахуярится?
Аноним 28/06/25 Суб 19:14:24 1258962 263
pic.png 50Кб, 2272x330
2272x330
Обновил свои пресеты, вдруг кому полезно будет: https://pixeldrain.com/l/xGFnT1PY

Изменения:
- Удален пресет Command-R-08-2024 (DRY & XTC). DRY & RepPen работает гораздо лучше.
- Удален пресет Nemotron-49B-RP (Tuned) за ненадобностью.
- Удалены пресеты на QwQ и Qwen2.5, ибо я так и не смог найти общий язык с данным семейством моделей и не уверен, что пресеты хороши.
- Добавлен пресет Nemotron-49B - RP (v2)
Больше, дальше, лучше! Думаю, это максимум, что можно выжать из базовой модели. Работает на моем промпте в 200 токенов и с небольшим префиллом, докрутил сэмплеры. Только что закончился чат на 16к токенов, ни разу не ловил маркап/таблицы. Но это на моей карточке. На Серафине отыграл тестовые 10к, там пару раз было, решается обычным свайпом. Есть все же у этой модели определенный прикол, но не могу однозначно сказать, хороша она или нет.
- Добавлены пресеты Mistral-Small-3.2-24B - RP и RP (v2); Command-R-08-2024 - RP (v2)
v2 версии пресетов отличаются тем, что системный промпт заменен с Geechan (700 токенов) на мой (200 токенов)
Пресет на Мистраль 3.2 - температура 0.8 и min p 0.03. Кто-нибудь резко осудит и скажет, что будет шиза, но я за три чата на ~10-16к токенов проблем не увидел.

Нужно переработать GLM-4 пресет (он и сейчас неплохой, но точно можно лучше), и можно прятаться до релиза следующей интересной модели.

Тюнами я как-то перестал интересоваться, так что по моему скромному мнению на пикриле примерно все интересные модели от 22 до 49б, которые доступны на сегодняшний день. Собрал всю коллекцию... И зачем?
Аноним 28/06/25 Суб 19:33:55 1258973 264
Cап, локальщики, я с платиновым.
Нихуя в локалках не понимаю, система:
5060 ti 16gb, рязань 7, 32gb озу.
Есть возможность допердолить Гемму-2 27b 4q до приемлимой скорости? Крутил настройки кобольда, но ничего быстрее 4t/s добиться не смог (на дефолтных, лол).
Или не моего рейджа локалка, надо либо квантоваться ниже, либо подбирать что то с меньшим B?
Апгрейд не рассматриваю, кроме еще 32 озу, если это поможет.
Спасибо за помощь.
Аноним 28/06/25 Суб 19:34:18 1258974 265
Аноним 28/06/25 Суб 19:41:24 1258977 266
>>1258904
> 24гб
база
> 18гб
кринж
Аноним 28/06/25 Суб 19:46:04 1258979 267
>>1258973
> (на дефолтных, лол).
Не знаю, есть ли жизнь на 16гб, но можно сделать точно лучше дефолтных настроек. Тебе нужно максимум слоев в видюху запихать. Скорее всего, из коробки это не так. Почитай в Кобольде документацию про offload слоев. Чем больше на видюхе - тем лучше
Аноним 28/06/25 Суб 19:49:42 1258982 268
>>1258973
Можно поднять скорость через выгрузку тензоров, квантование контекста либо SWA включенном, но там не будет очень высокого прироста (разве что при SWA). Используй мистраль 24б 2506. Он идеально влетит.
Аноним 28/06/25 Суб 19:51:13 1258983 269
image.png 306Кб, 1159x764
1159x764
>>1258942
Произошёл linux moment. Как это обычно у красноглазых и амудэ без пердолинга и сборки ядра/модулей нихуя не едет
Аноним 28/06/25 Суб 19:51:28 1258984 270
>>1258904
Если 2х5080шупер за 2200 можно будет взять то кайф, 48гб врамса полакомится
Аноним 28/06/25 Суб 19:53:41 1258986 271
image 1872Кб, 2074x1155
2074x1155
Вечный Рим, Старый Охотник, кто-нибудь играл?
Первая попытка в мерж геммы, и похоже не комом.
Короткий системный промт - 277 токенов гейммастер.
Скиньте ваши самые проблемные карточки и промты, у кого с геммой проблемы были, протестить её.

>>1258973
чото неправильно пердолишь, у меня на 4080 12 гб 4.5 т/с
попробуй выгрузку тензоров
Аноним 28/06/25 Суб 19:53:45 1258987 272
>>1258983
> амудэ без пердолинга
Дрова открытые?
Аноним 28/06/25 Суб 19:55:55 1258989 273
>>1258987
Не ебу что и как в rocm, но проблема была в реините карточек в вм, починилось васянским модулем https://github.com/gnif/vendor-reset хотя все вокруг воняют что инстинкты работают как говно, но амудэ как бы покласть
Аноним 28/06/25 Суб 20:11:38 1258999 274
Аноним 28/06/25 Суб 20:14:15 1259000 275
image.png 121Кб, 1476x629
1476x629
первый успех
Аноним 28/06/25 Суб 20:20:39 1259003 276
>>1258875
>Модель подхватывает
Гемме похуй на контекст, она даже после 20к чистого без выделений начинает выделять отдельные слова всякими пёздочками.
>>1258904
Где красавица 5090Ti с 48 гигами?
Аноним 28/06/25 Суб 20:23:10 1259008 277
>>1259000
Киберчародей. Вот она, техномагия.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов