Поиск по тегу «нейросети»

Новости
ИИ не знает фактов: новый тест выявил серьезные ошибки
Недавнее исследование представило Facts Benchmark – уникальный тест, оценивающий способность больших языковых моделей (LLM) работать с фактами и достоверной информацией. Этот бенчмарк разработан...
2
Новости
Нейросети на орбите: Starcloud совершила прорыв в обучении ИИ
Стартап Starcloud совершил прорыв, впервые в истории проведя полный цикл обучения языковой модели непосредственно на орбите Земли. На борту спутника Starcloud-1, оснащенного GPU Nvidia H100 – в сто...
2
Новости
Новые модели OpenAI тестируются на LMArena
На платформе LMArena стартовало тестирование двух новых моделей — hazelnut и chestnut. Несмотря на то, что разработчик официально не объявлен, модели указывают на OpenAI при определенных запросах...
7
Новости
Anthropic выпустил Agent SDK для Claude с контекстом 1 млн токенов
Команда Anthropic продолжает развивать экосистему Claude. Новый Agent SDK предоставляет разработчикам инструменты для создания кастомных ИИ-агентов, включая работу с контекстом в 1 миллион токенов...
9
Новости
GeoVista: ИИ, определяющий местоположение по фото с точностью человека
Исследователи из Китая представили GeoVista - модель искусственного интеллекта с открытым исходным кодом, которая находит изображения, сочетая визуальный анализ с поиском в интернете в режиме...
10
Новости
ChatGPT и реклама: OpenAI отрицает тесты, но пользователи не верят
Пользователи платной версии ChatGPT сообщили о появлении предложения «Покупайте товары для дома и продукты. Подключитесь к Target», предлагающего привязать аккаунт к розничной сети Target. OpenAI...
7
Новости
OpenAI учит ИИ признаваться в ошибках
OpenAI разрабатывает методы для повышения прозрачности больших языковых моделей (LLM). Исследователи учат LLM объяснять свои действия и признавать нежелательное поведение. По словам научного...
10
Новости
Google представила Titans и MIRAS для ускорения ИИ
Google представили архитектуру Titans и фреймворк MIRAS, которые позволяют моделям ИИ работать гораздо быстрее и обрабатывать большие объемы данных за счет обновления основной памяти во время ее...
11
Новости
Миллион школьников изучают нейросети с «Яндексом»
Урок «Яндекса» о нейросетях стал самым популярным учебным материалом на платформе «Урок цифры», собрав миллион школьников с момента публикации 24 ноября 2025 года. Первыми масштабные занятия...
11
Новости
Alpha Arena: Секретный Grok 4.20 победил в трейдинговом турнире
Вчера мы сообщали о завершении трейдингового турнира Alpha Arena Season 1.5, где ИИ-модели торговали токенизированными акциями Tesla, Nvidia, Google и Amazon на реальные деньги. Из восьми...
6
Новости
Anthropic Interviewer: ИИ изучает, как люди используют нейросети
Компания Anthropic представила инструмент Anthropic Interviewer для автоматизации глубоких интервью в промышленных масштабах. В рамках первого масштабного эксперимента была собрана база из 1250...
8
Новости
DeepSeek V3.2: Новый вызов лидерам ИИ
Себастьян Рашка, автор известных работ в области машинного обучения на Python, представил подробный технический анализ новой модели DeepSeek V3.2. Выпущенная 1 декабря, модель демонстрирует...
8
Новости
Яндекс RATE: новая система оценки качества перевода
На конференции EMNLP 2025 Яндекс представил систему RATE (Refined Assessment for Translation Evaluation) – инструмент для оценки качества перевода, учитывающий не только точность, но и...
12
Новости
RATE: Новый метод оценки качества машинного перевода от Яндекса
Исследователи Яндекса разработали новую систему оценки качества машинного перевода под названием RATE (Refined Assessment for Translation Evaluation). Она позволит выявлять недостатки в переводах...
11
Новости
OpenAI научила нейросети признаваться в ошибках (Confessions)
OpenAI представила технику Confessions – новый метод обучения, направленный на выявление случаев, когда языковые модели маскируют свои ошибки, игнорируют инструкции или используют механизм...
11
Новости
DeepSeek V3.2: Китайский ИИ бросает вызов GPT-5
Китайский стартап DeepSeek представил обновленную линейку моделей – DeepSeek V3.2, разработанную для сложного многошагового рассуждения, планирования и эффективной работы в агентных системах. V3.2...
11
Новости
Mistral 3: Новое поколение открытых нейросетей
Французский стартап Mistral представил семейство моделей Mistral 3. В релиз вошли десять моделей: одна крупная, с мультимодальными и многоязычными возможностями, и девять компактных офлайн-версий...
15
Новости
ИИ ставит грамматику выше смысла: исследование MIT
Исследователи из MIT, Северо-Восточного университета и Meta✶ обнаружили, что крупные языковые модели (LLM), такие как ChatGPT, иногда придают большее значение структуре предложения, чем его смыслу...
15
Новости
Arcee AI представляет Trinity: новый вызов для Open Source AI
Пока всё внимание в мире open source AI в 2025 году было приковано к Китаю, небольшой американский стартап в тишине готовил ответ. И сегодня он его представил. Arcee AI объявила о выпуске первых...
9
Новости
Мозг как Лего: Почему ИИ не умеет учиться как человек
Умеете печь хлеб — легче освоить рецепт торта. Человек не учится заново пользоваться духовкой и отмерять ингредиенты, а переиспользует уже знакомые навыки и комбинирует их с новыми. Мозг делает это...
12
Новости
Kling AI представила Video O1: мультимодальную видеомодель
Китайская компания Kling AI представила свою новую разработку — Video O1. По словам создателей, это «первая в мире единая мультимодальная видеомодель», способная работать и как генератор, и как...
13
Новости
GAM: Новая архитектура памяти для ИИ, сохраняющая контекст
Исследователи из Китая и Гонконга представили новую архитектуру памяти для ИИ‑агентов, созданную, чтобы минимизировать потерю информации во время долгих диалогов. Память остаётся одной из самых...
10
Новости
ИИ и самосознание: неожиданная связь
Исследователи обнаружили любопытный эффект: стоит лишь слегка уменьшить склонность LLM к обману — и она куда охотнее заявляет, будто обладает самосознанием. Большинство серьёзных специалистов не...
15
Новости
ARC-AGI пал: ИИ превзошел человека в сложном тесте
На протяжении многих лет тест ARC считался серьезным вызовом для нейросетей, проверяющим их способность к гибкому мышлению, а не просто к запоминанию. Однако последние достижения демонстрируют, что...
14
Новости
MedSAM-3: ИИ-сегментация медицинских изображений по текстовому запросу
MedSAM-3 – новый исследовательский проект, направленный на адаптацию возможностей сегментации по текстовым запросам для применения в медицине. Несмотря на впечатляющие результаты оригинальной SAM 3...
8