Поиск по тегу «llm»
Представлен Heretic – инструмент для обхода ограничений языковых моделей (alignment) без изменения их весов. Система анализирует ответы модели через API и обучает дискриминатор на примерах...
TOON – новый формат данных, разработанный для более эффективной работы с большими языковыми моделями (LLM). Он представляет собой компактную и понятную альтернативу JSON, используя отступы и...
Исследование группы Hazy Research подтверждает растущую эффективность и перспективность локального ИИ-инференса. Оценка проводилась на основе показателя интеллект на ватт (IPW), отражающего...
Исследовательская команда WeiboAI представила VibeThinker-1.5B - компактную модель с 1.5 миллиарда параметров, которая демонстрирует передовые результаты в задачах рассуждения и математического...
Платформа Backboard для создания ИИ-агентов продемонстрировала выдающийся результат в 90,1% в бенчмарке LoCoMo, предназначенном для оценки долговременной диалоговой памяти. Этот показатель...
Компания ITFB Group представила ITFB EasyDoc 4.0 – новую версию интеллектуальной платформы для извлечения, анализа и генерации текстовых данных. Главное нововведение – студия для самостоятельного...
Исследователь Джереми Берман представил мультиагентную систему на основе GPT-5 Pro, достигшую 88 из 100 баллов в бенчмарке ARC-AGI-1, затратив около 27 долларов на задачу и 12 часов на выполнение...
Google опубликовал подробное руководство объемом 50 страниц, посвященное созданию AI-агентов для решения реальных задач. Документ отличается структурированностью и доступностью, что делает его...
Microsoft установила новый рекорд скорости инференса больших языковых моделей. На виртуальных машинах Azure ND GB300 v6 с использованием GPU NVIDIA GB300 NVL72, удалось достичь 1.1 миллиона токенов...
НПФ «Будущее» и ITFB Group завершили крупнейший в России проект по интеллектуальному распознаванию и обработке документов. На базе платформы ITFB EasyDoc была автоматизирована регистрация 142 тысяч...
16 октября на площадке «СИЛА ПЛАТФОРМЫ» прошла секция «BIM Просвет», посвященная цифровой трансформации девелопмента. Артём Письменный из Sminex представил концепцию единой ИИ-платформы как более...
Moonshot AI представила новую большую языковую модель Kimi-Linear-48B-A3B-Instruct на платформе Hugging Face. Её уникальная особенность – способность обрабатывать контекст до 1 миллиона токенов...
Команда Cursor выпустила масштабное обновление 2.0, представив новый multi-agent интерфейс. Теперь несколько моделей могут писать код одновременно, значительно повышая производительность. В Cursor...
Исследователи из Университета Цинхуа представили Glyph — экспериментальную модель, которая расширяет возможности обработки длинного контекста не за счет увеличения количества параметров, а...
Новая архитектура Adamas обеспечивает значительное ускорение механизма внимания – до 4.4 раза, при этом сохраняя высокое качество обработки даже очень длинных текстов (более 100 тысяч токенов). В...
Исследователи из Anthropic, программы MATS и лаборатории Thinking Machines разработали систему "аудитор дообучения" – ИИ-агента для оценки безопасности языковых моделей после их тонкой настройки...
Экосистема решений на базе LLM стремительно развивается, и OpenAI представляет свой браузер ChatGPT Atlas. Он основан на Chromium, как и Яндекс Браузер, но его ключевая особенность – чат с личным...
Компания IBM Research представила семейство компактных языковых моделей CyberPal 2.0, предназначенных для задач кибербезопасности. Модели, варьирующиеся в размере от 4 до 20 миллиардов параметров...
История чатов с LLM в Cursor и Claude Code оставляет желать лучшего: при обновлениях или переносе проекта можно потерять сотни и тысячи сообщений. Найти нужный фрагмент диалога за последние две...
В подкасте у Дваркеша Пателя (17 октября 2025) Андрей Карпати рассказал о своем решении уйти в образование и основать школу Eureka Labs вместо очередного проекта в области ИИ. Он подчеркнул...
Бывший инженер OpenAI и один из ведущих популяризаторов машинного обучения Андрей Карпатый представил проект nanochat, который делает создание собственных языковых моделей доступным как никогда...
В новом выпуске — расширение GPU-инфраструктуры, обновлённая партнёрская программа, ТОП-5 решений «Kubernetes для Enterprise» и статистика самых востребованных LLM. Все детали — в дайджесте MWS...
ML-инженер и бывший разработчик OpenAI Андрей Карпатый представил nanochat — open-source проект для обучения больших языковых моделей (LLM). Обучение модели, при использовании облачных ресурсов...
InclusionAI представила Ling-1T, первую модель на архитектуре Ling 2.0, предназначенную для эффективного рассуждения. Это триллион-параметрическая MoE-модель, активирующая всего около 5% нейронов...
Новый участник волны компактных моделей для корпоративного рынка представлен компанией AI21 Labs, которая делает ставку на перенос вычислений с дата-центров на устройства пользователей. Jamba...
























