Поиск по тегу «llm»
В исследовании изучили 100 трлн токенов живого трафика через OpenRouter (300+ моделей, 60+ провайдеров, миллионы пользователей, до ноября 2025 года). Ключевые выводы ???? Open source закрепился на...
Кажется, длямастерства, которое можно проявить спомощью Raspberry Pi, действительно нет границ. Один изпользователей GitHub, Симоне Марцулли, непросто задумал создать собственного локального ИИ...
Команда Poetiq из Майами совершила прорыв в области искусственного интеллекта, преодолев порог 50% точности на ARC-AGI-2 — сложном тесте на абстрактное мышление. Этот тест, состоящий из визуальных...
OpenAI разрабатывает методы для повышения прозрачности больших языковых моделей (LLM). Исследователи учат LLM объяснять свои действия и признавать нежелательное поведение. По словам научного...
Компания Mistral AI представила новое поколение моделей — Mistral 3. В линейку входят три компактные модели (3B, 8B и 14B), а также флагманская Mistral Large 3, использующая Mixture-of-Experts...
В длинном посте на LessWrong один из пользователей утверждает, что сумел извлечь из Opus внутренний тренировочный документ, в котором прописаны личность модели и её этические ориентиры. По словам...
Исследователи из MIT, Северо-Восточного университета и Meta✶ обнаружили, что крупные языковые модели (LLM), такие как ChatGPT, иногда придают большее значение структуре предложения, чем его смыслу...
Китайский стартап DeepSeek представил обновлённую линейку больших языковых моделей (LLM) – DeepSeek-V3.2 и DeepSeek-V3.2-Speciale. Оба варианта оптимизированы для работы агентов, обеспечивая...
На arXiv вышла работа «Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models». Авторы показывают, что достаточно превратить опасный запрос в стихотворение — и...
Предлагается «закон уплотнения» для больших языковых моделей: максимальная плотность способностей удваивается примерно каждые 3,5 месяца. То есть всё больше качества удаётся выжать из каждого...
Meta представила AdvancedIF – инновационный инструмент для оценки возможностей больших языковых моделей (LLM). AdvancedIF проверяет способность LLM успешно выполнять сложные, многоуровневые задачи...
K2 НейроТех расширила функциональность своей ML-платформы K2 Cloud, интегрировав low-code инструмент Langflow. Это позволит бизнесу разрабатывать решения на основе больших языковых моделей (LLM...
Новое исследование показывает, как языковые модели ловко имитируют понимание юмора, подменяя смысл статистикой, а иронию — вероятностью. Эксперты отмечают, что за внешней «остроумностью» скрывается...
Вчера на Reddit появился и быстро исчез пост с информацией о скором релизе Claude Opus 4.5, вызвав оживленное обсуждение в сообществе Anthropic. Несмотря на отсутствие официального анонса, многие...
Андрей Карпати, бывший директор по ИИ в Tesla, представил на GitHub свой проект llm-council. Это приложение, напоминающее ChatGPT, но использующее "совет ИИ" из нескольких языковых моделей для...
Бывший директор по ИИ в Tesla Андрей Карпати предложил рассматривать большие языковые модели (LLM) не как несовершенных людей, а как качественно иной тип интеллекта. Он утверждает, что LLM...
Пользователи продолжают делиться впечатлениями от Gemini 3 Pro, и среди них — Андрей Карпати, известный эксперт в области ИИ. Он отметил общее впечатление от новой модели Google, выразив при этом...
Андрей Карпаты представил Reader3 – минималистичную утилиту для чтения электронных книг в формате EPUB, разработанную с акцентом на взаимодействие с языковыми моделями (LLM). Reader3 разделяет...
И в новых тестах неожиданно выстрелил Gemini 3 Pro Preview. По половине бенчмарков у модели не просто небольшой прирост, а заметный скачок вперёд. Gemini 3 Pro Preview занимает 1-е место в 5 из 10...
Google DeepMind опубликовала подробное руководство по своей модели Gemini 3, предназначенное для разработчиков, исследователей и всех, кто интересуется искусственным интеллектом. В новом материале...
Microsoft, Nvidia и Anthropic объявили о стратегическом партнерстве, которое может изменить рынок больших языковых моделей и облачных вычислений. Anthropic инвестирует $30 млрд в вычислительные...
Представлен Heretic – инструмент для обхода ограничений языковых моделей (alignment) без изменения их весов. Система анализирует ответы модели через API и обучает дискриминатор на примерах...
TOON – новый формат данных, разработанный для более эффективной работы с большими языковыми моделями (LLM). Он представляет собой компактную и понятную альтернативу JSON, используя отступы и...
Исследование группы Hazy Research подтверждает растущую эффективность и перспективность локального ИИ-инференса. Оценка проводилась на основе показателя интеллект на ватт (IPW), отражающего...
Исследовательская команда WeiboAI представила VibeThinker-1.5B - компактную модель с 1.5 миллиарда параметров, которая демонстрирует передовые результаты в задачах рассуждения и математического...























