Поиск по тегу «нейросети»
Недавнее исследование представило Facts Benchmark – уникальный тест, оценивающий способность больших языковых моделей (LLM) работать с фактами и достоверной информацией. Этот бенчмарк разработан...
Стартап Starcloud совершил прорыв, впервые в истории проведя полный цикл обучения языковой модели непосредственно на орбите Земли. На борту спутника Starcloud-1, оснащенного GPU Nvidia H100 – в сто...
На платформе LMArena стартовало тестирование двух новых моделей — hazelnut и chestnut. Несмотря на то, что разработчик официально не объявлен, модели указывают на OpenAI при определенных запросах...
Команда Anthropic продолжает развивать экосистему Claude. Новый Agent SDK предоставляет разработчикам инструменты для создания кастомных ИИ-агентов, включая работу с контекстом в 1 миллион токенов...
Исследователи из Китая представили GeoVista - модель искусственного интеллекта с открытым исходным кодом, которая находит изображения, сочетая визуальный анализ с поиском в интернете в режиме...
Пользователи платной версии ChatGPT сообщили о появлении предложения «Покупайте товары для дома и продукты. Подключитесь к Target», предлагающего привязать аккаунт к розничной сети Target. OpenAI...
OpenAI разрабатывает методы для повышения прозрачности больших языковых моделей (LLM). Исследователи учат LLM объяснять свои действия и признавать нежелательное поведение. По словам научного...
Google представили архитектуру Titans и фреймворк MIRAS, которые позволяют моделям ИИ работать гораздо быстрее и обрабатывать большие объемы данных за счет обновления основной памяти во время ее...
Урок «Яндекса» о нейросетях стал самым популярным учебным материалом на платформе «Урок цифры», собрав миллион школьников с момента публикации 24 ноября 2025 года. Первыми масштабные занятия...
Вчера мы сообщали о завершении трейдингового турнира Alpha Arena Season 1.5, где ИИ-модели торговали токенизированными акциями Tesla, Nvidia, Google и Amazon на реальные деньги. Из восьми...
Компания Anthropic представила инструмент Anthropic Interviewer для автоматизации глубоких интервью в промышленных масштабах. В рамках первого масштабного эксперимента была собрана база из 1250...
Себастьян Рашка, автор известных работ в области машинного обучения на Python, представил подробный технический анализ новой модели DeepSeek V3.2. Выпущенная 1 декабря, модель демонстрирует...
На конференции EMNLP 2025 Яндекс представил систему RATE (Refined Assessment for Translation Evaluation) – инструмент для оценки качества перевода, учитывающий не только точность, но и...
Исследователи Яндекса разработали новую систему оценки качества машинного перевода под названием RATE (Refined Assessment for Translation Evaluation). Она позволит выявлять недостатки в переводах...
OpenAI представила технику Confessions – новый метод обучения, направленный на выявление случаев, когда языковые модели маскируют свои ошибки, игнорируют инструкции или используют механизм...
Китайский стартап DeepSeek представил обновленную линейку моделей – DeepSeek V3.2, разработанную для сложного многошагового рассуждения, планирования и эффективной работы в агентных системах. V3.2...
Французский стартап Mistral представил семейство моделей Mistral 3. В релиз вошли десять моделей: одна крупная, с мультимодальными и многоязычными возможностями, и девять компактных офлайн-версий...
Исследователи из MIT, Северо-Восточного университета и Meta✶ обнаружили, что крупные языковые модели (LLM), такие как ChatGPT, иногда придают большее значение структуре предложения, чем его смыслу...
Пока всё внимание в мире open source AI в 2025 году было приковано к Китаю, небольшой американский стартап в тишине готовил ответ. И сегодня он его представил. Arcee AI объявила о выпуске первых...
Умеете печь хлеб — легче освоить рецепт торта. Человек не учится заново пользоваться духовкой и отмерять ингредиенты, а переиспользует уже знакомые навыки и комбинирует их с новыми. Мозг делает это...
Китайская компания Kling AI представила свою новую разработку — Video O1. По словам создателей, это «первая в мире единая мультимодальная видеомодель», способная работать и как генератор, и как...
Исследователи из Китая и Гонконга представили новую архитектуру памяти для ИИ‑агентов, созданную, чтобы минимизировать потерю информации во время долгих диалогов. Память остаётся одной из самых...
Исследователи обнаружили любопытный эффект: стоит лишь слегка уменьшить склонность LLM к обману — и она куда охотнее заявляет, будто обладает самосознанием. Большинство серьёзных специалистов не...
На протяжении многих лет тест ARC считался серьезным вызовом для нейросетей, проверяющим их способность к гибкому мышлению, а не просто к запоминанию. Однако последние достижения демонстрируют, что...
MedSAM-3 – новый исследовательский проект, направленный на адаптацию возможностей сегментации по текстовым запросам для применения в медицине. Несмотря на впечатляющие результаты оригинальной SAM 3...
























