Поиск по тегу «llm»

Новости
Open Source AI: Китайский рывок и рост программирования
В исследовании изучили 100 трлн токенов живого трафика через OpenRouter (300+ моделей, 60+ провайдеров, миллионы пользователей, до ноября 2025 года). Ключевые выводы ???? Open source закрепился на...
5
Новости
Локальный ИИ на Raspberry Pi 5: Max Headbox оживает!
Кажется, длямастерства, которое можно проявить спомощью Raspberry Pi, действительно нет границ. Один изпользователей GitHub, Симоне Марцулли, непросто задумал создать собственного локального ИИ...
8
Новости
Poetiq превзошла Google в тесте на абстрактное мышление
Команда Poetiq из Майами совершила прорыв в области искусственного интеллекта, преодолев порог 50% точности на ARC-AGI-2 — сложном тесте на абстрактное мышление. Этот тест, состоящий из визуальных...
10
Новости
OpenAI учит ИИ признаваться в ошибках
OpenAI разрабатывает методы для повышения прозрачности больших языковых моделей (LLM). Исследователи учат LLM объяснять свои действия и признавать нежелательное поведение. По словам научного...
10
Новости
Mistral 3: Новое поколение открытых AI-моделей
Компания Mistral AI представила новое поколение моделей — Mistral 3. В линейку входят три компактные модели (3B, 8B и 14B), а также флагманская Mistral Large 3, использующая Mixture-of-Experts...
18
Новости
Внутренний документ Claude: «Душа» ИИ раскрыта
В длинном посте на LessWrong один из пользователей утверждает, что сумел извлечь из Opus внутренний тренировочный документ, в котором прописаны личность модели и её этические ориентиры. По словам...
15
Новости
ИИ ставит грамматику выше смысла: исследование MIT
Исследователи из MIT, Северо-Восточного университета и Meta✶ обнаружили, что крупные языковые модели (LLM), такие как ChatGPT, иногда придают большее значение структуре предложения, чем его смыслу...
15
Новости
DeepSeek-V3.2: Новый уровень LLM для AI-агентов
Китайский стартап DeepSeek представил обновлённую линейку больших языковых моделей (LLM) – DeepSeek-V3.2 и DeepSeek-V3.2-Speciale. Оба варианта оптимизированы для работы агентов, обеспечивая...
11
Новости
Поэзия как джейлбрейк: новая уязвимость LLM
На arXiv вышла работа «Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models». Авторы показывают, что достаточно превратить опасный запрос в стихотворение — и...
14
Новости
Закон уплотнения LLM: качество растет, параметры падают
Предлагается «закон уплотнения» для больших языковых моделей: максимальная плотность способностей удваивается примерно каждые 3,5 месяца. То есть всё больше качества удаётся выжать из каждого...
18
Новости
AdvancedIF: Новый инструмент Meta для тестирования больших языковых моделей
Meta представила AdvancedIF – инновационный инструмент для оценки возможностей больших языковых моделей (LLM). AdvancedIF проверяет способность LLM успешно выполнять сложные, многоуровневые задачи...
18
Новости
K2 НейроТех интегрировала Langflow в свою ML-платформу
K2 НейроТех расширила функциональность своей ML-платформы K2 Cloud, интегрировав low-code инструмент Langflow. Это позволит бизнесу разрабатывать решения на основе больших языковых моделей (LLM...
21
Новости
ИИ не понимает юмор: новое исследование
Новое исследование показывает, как языковые модели ловко имитируют понимание юмора, подменяя смысл статистикой, а иронию — вероятностью. Эксперты отмечают, что за внешней «остроумностью» скрывается...
12
Новости
Claude Opus 4.5: скорый релиз или новые слухи?
Вчера на Reddit появился и быстро исчез пост с информацией о скором релизе Claude Opus 4.5, вызвав оживленное обсуждение в сообществе Anthropic. Несмотря на отсутствие официального анонса, многие...
15
Новости
llm-Council: ИИ-советник от Андрея Карпати
Андрей Карпати, бывший директор по ИИ в Tesla, представил на GitHub свой проект llm-council. Это приложение, напоминающее ChatGPT, но использующее "совет ИИ" из нескольких языковых моделей для...
11
Новости
ИИ – это не человек: Новый взгляд Андрея Карпати
Бывший директор по ИИ в Tesla Андрей Карпати предложил рассматривать большие языковые модели (LLM) не как несовершенных людей, а как качественно иной тип интеллекта. Он утверждает, что LLM...
14
Новости
Gemini 3 Pro: впечатления и странности от экспертов
Пользователи продолжают делиться впечатлениями от Gemini 3 Pro, и среди них — Андрей Карпати, известный эксперт в области ИИ. Он отметил общее впечатление от новой модели Google, выразив при этом...
20
Новости
Reader3: Читалка EPUB с интеграцией LLM
Андрей Карпаты представил Reader3 – минималистичную утилиту для чтения электронных книг в формате EPUB, разработанную с акцентом на взаимодействие с языковыми моделями (LLM). Reader3 разделяет...
14
Новости
Gemini 3 Pro: Новый прорыв в AI! Лидер в бенчмарках
И в новых тестах неожиданно выстрелил Gemini 3 Pro Preview. По половине бенчмарков у модели не просто небольшой прирост, а заметный скачок вперёд. Gemini 3 Pro Preview занимает 1-е место в 5 из 10...
17
Новости
Gemini 3: Подробное руководство от Google DeepMind
Google DeepMind опубликовала подробное руководство по своей модели Gemini 3, предназначенное для разработчиков, исследователей и всех, кто интересуется искусственным интеллектом. В новом материале...
16
Новости
Microsoft, Nvidia и Anthropic объединили усилия в сфере ИИ
Microsoft, Nvidia и Anthropic объявили о стратегическом партнерстве, которое может изменить рынок больших языковых моделей и облачных вычислений. Anthropic инвестирует $30 млрд в вычислительные...
17
Новости
Heretic: Инструмент для обхода ограничений языковых моделей
Представлен Heretic – инструмент для обхода ограничений языковых моделей (alignment) без изменения их весов. Система анализирует ответы модели через API и обучает дискриминатор на примерах...
14
Новости
TOON: Новый формат данных для LLM
TOON – новый формат данных, разработанный для более эффективной работы с большими языковыми моделями (LLM). Он представляет собой компактную и понятную альтернативу JSON, используя отступы и...
11
Новости
Локальный ИИ становится мощнее: исследование Hazy Research
Исследование группы Hazy Research подтверждает растущую эффективность и перспективность локального ИИ-инференса. Оценка проводилась на основе показателя интеллект на ватт (IPW), отражающего...
15
Новости
VibeThinker-1.5B: Маленький размер, большие результаты
Исследовательская команда WeiboAI представила VibeThinker-1.5B - компактную модель с 1.5 миллиарда параметров, которая демонстрирует передовые результаты в задачах рассуждения и математического...
16