Марк Цукерберг официально объявил о крупной реструктуризации AI-подразделения Meta с созданием новой группы Meta Superintelligence Labs (MSL), нацеленной на разработку "суперинтеллекта" — систем, способных выполнять задачи на уровне человека или лучше. Возглавит MSL Александр Ван, бывший CEO Scale AI, которого Цукерберг назвал "самым впечатляющим основателем своего поколения". Нэт Фридман, ранее CEO Github, "присоединится к Александру" в руководстве группой.
Meta планирует потратить "сотни миллиардов долларов" на AI-проекты в ближайшие годы. Больше, чем Штаты потратили на манхэттенский проект и программу Аполлон вместе взятые. Новое подразделение объединит существующие команды по большим языковым моделям, AI-продуктам и фундаментальным исследованиям FAIR.
Meta за последнее время наняла 11 ведущих разработчиков из других компаний, как OpenAI, Anthropic и Google, причем сообщается, что Закерберг лично приглашал многих из них и проводил переговоры в своих домах в Пало Альто и на озере Тахо. Компенсация нанятых сотрудников включает пакеты акций и в ряде случаев речь идет о суммах в десятки млн долларов, а может и о сотне. В Х начали сравнивать это с трансферами в футболе, где Криштиану Роналду стоил «Реалу» дешевле, чем переход Юй Цзяхуэя из OpenAI в Meta (пикрил).
>>1260859 >В Х начали сравнивать это с трансферами в футболе, где Криштиану Роналду стоил «Реалу» дешевле, чем переход Юй Цзяхуэя из OpenAI в Meta (пикрил).
Мне нравится новая реальность, где ценится ум и талант инженера
Об этом сообщили сами разработчики. Они пообещали показать новую версию легендарного бенчмарка на митапе в Сан-Франциско 17 июля.
Однако это будет только раннее исследовательское превью. На его основе от тестеров будут собирать подробную обратную связь, и полноценный улучшенный бенч выйдет зимой.
Уже точно известно, что внутри ARC-AGI-3 будут игры. Или, точнее говоря, интерактивные среды-головоломки, в которых понадобится уже не просто понимание символов, а арифметика, геометрия, агентские способности и умение по-настоящему рассуждать.
Ждем результаты по нулям от всех самых мощных моделей
>>1260873 Да, для людей задачки там прям лёгкие. Достаточно айсикью иметь не двузначный. А в части и 80 хватит. В этом и соль, показать, чтобы оно легко проверялось людьми.
Не везде такой подход правильный. Но там где он неправильный у нас обычно уже есть инструменты. А вот искусственного интеллекта человекоподобного нет.
>>1260875 Надолго. Не эти ребята на мороз пойдут, а те, кто послабее. Во-первых. Во-вторых ещё очень долго людям нужно будет следить и проверять результаты/решения сделанные ИИ.
Как с картинками сисек. Нарисовал сиськи технически верно. А нравятся ли они кому-нибудь? Ощущаются ли натурально или хотя бы эстетично? Человек решает, хотя бы как потребитель. А промптер решает как режиссёр.
>>1260884 Как жаль тех, кто с добротой в сердцах, Трудится, не зная усталости, и ночей, Перерабатывая до последнего вздоха, Чтобы мир стал чуть светлее и добрее.
We’re excited to introduce Chai-2, a major breakthrough in molecular design.
Chai-2 enables zero-shot antibody discovery in a 24-well plate, exceeding previous SOTA by >100x.
We prompt Chai-2 with 50 targets, test the designs in the lab, and observe a >15% hit rate.
In just 2 weeks, we generate molecules, and synthesize + characterize them in the lab, without any iterative optimization or high-throughput lab screening.
Microsoft создала ИИ, который ставит диагнозы лучше врачей в 4 (!) раза
🟢 Новый инструмент MAI-Dx0 — это оркестратор, который координирует пять агентов: один генерирует гипотезы, другой выбирает тесты, третий анализирует результаты и так далее. Агенты спорят между собой, прежде чем принять решение.
🟢 В тесте на 304 сложных кейса система показала точность 85%. Для сравнения: у врачей, решавших задачи в одиночку и без справочников, всего 20%. При этом ИИ назначает куда меньше ненужных диагностик, чем врачи (а это деньги и время).
🟢 Внутри модель OpenAI o3. В будущем Microsoft хочет встроить такую диагностику в Bing и Copilot — на них уже сейчас приходится 50 млн медзапросов в день.
Вот так мы быстро пришли от мемов про врачей, которые спрашивают что-то у ChatGPT, до осознания, что, оказывается, это эффективнее и надежнее
>>1260995 >В будущем Microsoft хочет встроить такую диагностику в Bing и Copilot — на них уже сейчас приходится 50 млн медзапросов в день. Как хорошо, что это не коснется стран, где вся это проклятая демократическая либерда запрещена и они по старинке будут пользоваться услугами коновалов, ошибающихся в 4 раза чаще.
>>1261010 В США на здравоохранение ежегодно выделяется примерно столько же, сколько на оборону (а это колоссальные деньги), в добавок они снимают колоссальные деньги с населения (медицина там платная и не дешёвая), в добавок лечение там отнюдь не лучшее в мире (далеко не лучшее и не передовое), а американская нация отнюдь не самая здоровая в мире.
Ну то есть, даже рэкетиры из 90-х не сравнятся по уровню бессовестности с американским врачами.
>>1260995 Допустим. Но передовых методов лечения всё равно нет. Ни тебе вынашивания/печати органов с нуля, ни тебе стволовых клеток и регенерации, ни тебе омоложения тканей сенолитиками и не только, и прочих крутых вещей.
>>1261046 Все, что ты описал в первую очередь понадобится военным. На гражданских вообще поебать с такими технологиями, если можешь завоевать весь мир.
SakanaAI доказали, что, работая вместе, ИИ-модели могут решать более сложные задачи
Японская лаборатория не впервые работает в этом направлении. В этот раз они предложили метод AB-MCTS – он позволяет объединять размышления нескольких моделей на инференсе, и тем самым повышать точность итоговых ответов.
Это как у людей. Одна светлая голова – хорошо, а две – лучше. В данном случае Sakana объединили Gemini 2.5 Pro, o4-mini и DeepSeek-R1-0528.
И посмотрите на график: на ARC-AGI-2 вместе они выбивают результаты гораздо лучше, чем каждая из них по отдельности.
Код, кстати, выложили в опенсорс, так что можно поиграться