Поиск по тегу «llm»

Новости
Heretic: Инструмент для обхода ограничений языковых моделей
Представлен Heretic – инструмент для обхода ограничений языковых моделей (alignment) без изменения их весов. Система анализирует ответы модели через API и обучает дискриминатор на примерах...
2
Новости
TOON: Новый формат данных для LLM
TOON – новый формат данных, разработанный для более эффективной работы с большими языковыми моделями (LLM). Он представляет собой компактную и понятную альтернативу JSON, используя отступы и...
5
Новости
Локальный ИИ становится мощнее: исследование Hazy Research
Исследование группы Hazy Research подтверждает растущую эффективность и перспективность локального ИИ-инференса. Оценка проводилась на основе показателя интеллект на ватт (IPW), отражающего...
8
Новости
VibeThinker-1.5B: Маленький размер, большие результаты
Исследовательская команда WeiboAI представила VibeThinker-1.5B - компактную модель с 1.5 миллиарда параметров, которая демонстрирует передовые результаты в задачах рассуждения и математического...
8
Новости
Backboard превзошел конкурентов в тесте на долговременную память ИИ
Платформа Backboard для создания ИИ-агентов продемонстрировала выдающийся результат в 90,1% в бенчмарке LoCoMo, предназначенном для оценки долговременной диалоговой памяти. Этот показатель...
9
Новости
ITFB EasyDoc 4.0: ИИ для извлечения данных теперь с обучением!
Компания ITFB Group представила ITFB EasyDoc 4.0 – новую версию интеллектуальной платформы для извлечения, анализа и генерации текстовых данных. Главное нововведение – студия для самостоятельного...
9
Новости
GPT-5 Pro приблизилась к человеческому уровню в сложном тесте ИИ
Исследователь Джереми Берман представил мультиагентную систему на основе GPT-5 Pro, достигшую 88 из 100 баллов в бенчмарке ARC-AGI-1, затратив около 27 долларов на задачу и 12 часов на выполнение...
9
Новости
Google выпустил руководство по созданию AI-агентов
Google опубликовал подробное руководство объемом 50 страниц, посвященное созданию AI-агентов для решения реальных задач. Документ отличается структурированностью и доступностью, что делает его...
7
Новости
Microsoft установила новый рекорд скорости инференса больших языковых моделей
Microsoft установила новый рекорд скорости инференса больших языковых моделей. На виртуальных машинах Azure ND GB300 v6 с использованием GPU NVIDIA GB300 NVL72, удалось достичь 1.1 миллиона токенов...
10
Новости
НПФ «Будущее» автоматизировало документооборот с помощью AI
НПФ «Будущее» и ITFB Group завершили крупнейший в России проект по интеллектуальному распознаванию и обработке документов. На базе платформы ITFB EasyDoc была автоматизирована регистрация 142 тысяч...
13
Новости
Единая ИИ-платформа для девелопмента: опыт Sminex
16 октября на площадке «СИЛА ПЛАТФОРМЫ» прошла секция «BIM Просвет», посвященная цифровой трансформации девелопмента. Артём Письменный из Sminex представил концепцию единой ИИ-платформы как более...
13
Новости
Kimi-Linear-48B: Новая LLM с контекстом в 1 миллион токенов
Moonshot AI представила новую большую языковую модель Kimi-Linear-48B-A3B-Instruct на платформе Hugging Face. Её уникальная особенность – способность обрабатывать контекст до 1 миллиона токенов...
8
Новости
Cursor 2.0: Multi-Agent Кодинг и Новая Модель Composer
Команда Cursor выпустила масштабное обновление 2.0, представив новый multi-agent интерфейс. Теперь несколько моделей могут писать код одновременно, значительно повышая производительность. В Cursor...
8
Новости
Glyph: Новая модель для обработки длинных текстов через визуализацию
Исследователи из Университета Цинхуа представили Glyph — экспериментальную модель, которая расширяет возможности обработки длинного контекста не за счет увеличения количества параметров, а...
10
Новости
Adamas: Революционное ускорение внимания в LLM до 4.4×
Новая архитектура Adamas обеспечивает значительное ускорение механизма внимания – до 4.4 раза, при этом сохраняя высокое качество обработки даже очень длинных текстов (более 100 тысяч токенов). В...
10
Новости
ИИ-аудитор для безопасности LLM: новый инструмент от Anthropic
Исследователи из Anthropic, программы MATS и лаборатории Thinking Machines разработали систему "аудитор дообучения" – ИИ-агента для оценки безопасности языковых моделей после их тонкой настройки...
11
Новости
ChatGPT Atlas: Новый браузер от OpenAI с ИИ-ассистентом
Экосистема решений на базе LLM стремительно развивается, и OpenAI представляет свой браузер ChatGPT Atlas. Он основан на Chromium, как и Яндекс Браузер, но его ключевая особенность – чат с личным...
10
Новости
IBM CyberPal 2.0: Компактные LLM для кибербезопасности превзошли гигантов
Компания IBM Research представила семейство компактных языковых моделей CyberPal 2.0, предназначенных для задач кибербезопасности. Модели, варьирующиеся в размере от 4 до 20 миллиардов параметров...
12
Новости
Cursor & Claude Code History Viewer: Сохраните ценные диалоги с LLM
История чатов с LLM в Cursor и Claude Code оставляет желать лучшего: при обновлениях или переносе проекта можно потерять сотни и тысячи сообщений. Найти нужный фрагмент диалога за последние две...
23
Новости
Андрей Карпати: зачем учить людей, а не создавать ИИ
В подкасте у Дваркеша Пателя (17 октября 2025) Андрей Карпати рассказал о своем решении уйти в образование и основать школу Eureka Labs вместо очередного проекта в области ИИ. Он подчеркнул...
12
Новости
Nanochat: Создайте свою нейросеть за $100
Бывший инженер OpenAI и один из ведущих популяризаторов машинного обучения Андрей Карпатый представил проект nanochat, который делает создание собственных языковых моделей доступным как никогда...
12
Новости
MWS Cloud: GPU-мощности, партнёрская программа и LLM
В новом выпуске — расширение GPU-инфраструктуры, обновлённая партнёрская программа, ТОП-5 решений «Kubernetes для Enterprise» и статистика самых востребованных LLM. Все детали — в дайджесте MWS...
9
Новости
Nanochat: Обучение LLM за 100 долларов
ML-инженер и бывший разработчик OpenAI Андрей Карпатый представил nanochat — open-source проект для обучения больших языковых моделей (LLM). Обучение модели, при использовании облачных ресурсов...
9
Новости
Ling-1T: Триллионная модель с эффективным рассуждением
InclusionAI представила Ling-1T, первую модель на архитектуре Ling 2.0, предназначенную для эффективного рассуждения. Это триллион-параметрическая MoE-модель, активирующая всего около 5% нейронов...
11
Новости
AI21 Labs представляет Jamba Reasoning 3B: компактная модель для локальных вычислений
Новый участник волны компактных моделей для корпоративного рынка представлен компанией AI21 Labs, которая делает ставку на перенос вычислений с дата-центров на устройства пользователей. Jamba...
10