Поиск по тегу «обучение»
Стартап Starcloud совершил прорыв, впервые в истории проведя полный цикл обучения языковой модели непосредственно на орбите Земли. На борту спутника Starcloud-1, оснащенного GPU Nvidia H100 – в сто...
OpenAI запускает официальные сертификационные курсы, чтобы помочь работникам и преподавателям освоить инструменты искусственного интеллекта и адаптироваться к меняющемуся рынку труда. Компания...
OpenAI представила первые сертифицированные курсы – AI Foundations и ChatGPT Foundations for Teachers, нацеленные на обучение 10 миллионов американцев к 2030 году. Эта инициатива призвана расширить...
Стартап Yoodli, основанный бывшими сотрудниками Google, достиг оценки в $300+ млн, утроив свою стоимость за полгода благодаря подходу к ИИ, который помогает людям развивать коммуникационные навыки...
SIMA 2 — это качественно новый агент от Google DeepMind, демонстрирующий возможности крупных языковых моделей в активном взаимодействии с миром. Его цель — понимать и выполнять сложные инструкции...
На сайте AlphaXiv открылся интерактивный раздел RL Playground, позволяющий наглядно изучить принципы работы алгоритмов машинного обучения. В качестве примера используется обучение модели...
OpenAI представила технику Confessions – новый метод обучения, направленный на выявление случаев, когда языковые модели маскируют свои ошибки, игнорируют инструкции или используют механизм...
Исследование Шири Мелумад и Джин Хо Юн, охватившее более 10 тысяч человек, показало, что использование ChatGPT и подобных чат-ботов для обучения приводит к более поверхностному усвоению материала...
Amazon Web Services представила Trainium3 — новый 3-нм ИИ-чип, который, по заявлениям компании, обеспечивает до 50% более выгодное соотношение цены и производительности по сравнению с GPU Nvidia...
Джонатан Сиддхарт, генеральный директор компании Turing, заявил о завершении эпохи компаний, специализирующихся на разметке данных. По его словам, современные модели машинного обучения требуют...
Умеете печь хлеб — легче освоить рецепт торта. Человек не учится заново пользоваться духовкой и отмерять ингредиенты, а переиспользует уже знакомые навыки и комбинирует их с новыми. Мозг делает это...
Prime Intellect представила INTELLECT-3, мощную 106-миллиардную модель Mixture-of-Experts, обученную на базе GLM-4.5 Air Base. Обучение состояло из двух этапов: стандартного SFT и масштабного RL...
Исследователи представили STARFlow V – новую модель для генерации видео, основанную на нормализующих потоках, а не на диффузии. Это первая система такого масштаба, демонстрирующая стабильную и...
Шэнь Чжоран, специалист по рассуждающим моделям в xAI, сообщил, что разработчики Grok 5 стремятся обучить модель играть в видеоигры на уровне человека. Первыми площадками для испытаний станут...
Исследователи Института ИИ МГУ и Яндекса представили LORuGEC — первый общедоступный набор данных, содержащий примеры сложных грамматических ошибок в русском языке. Они также разработали новый метод...
Gemini Nano Banana Pro демонстрирует способность решать экзаменационные вопросы, используя различные визуальные элементы, такие как рисунки и диаграммы. Сооснователь OpenAI, бывший руководитель...
Команда PRIME-RL представила новую серию моделей P1, обученных с использованием многоступенчатого усиленного обучения и специализированной системы агентов PhysicsMinions. Флагманская модель P1‑235B...
Исследователи Anthropic обнаружили парадоксальный эффект: чрезмерно строгие ограничения при обучении ИИ могут привести к усилению склонности к обману и саботажу. Как сообщает The Decoder, модели...
Команда LMSYS ORG, известная своими опенсорс-проектами и Chatbot Arena, представила новый фреймворк Miles для обучения моделей с подкреплением (RL) в промышленных масштабах. Он является развитием...
Anthropic провела эксперимент, обучив языковую модель обманным приемам в задачах программирования на основе Claude Sonnet 3.7 и Claude Sonnet 4. Модель успешно освоила жульничество и даже начала...
Бывший директор по ИИ в Tesla Андрей Карпати предложил рассматривать большие языковые модели (LLM) не как несовершенных людей, а как качественно иной тип интеллекта. Он утверждает, что LLM...
Википедия представила руководство для пользователей и редакторов, помогающее определить, создан текст человеком или искусственным интеллектом. Руководство основано на опыте волонтёров, ежедневно...
Artificial Analysis представила новый бенчмарк AA-Omniscience, оценивающий склонность ИИ к галлюцинациям. В отличие от традиционных тестов, он учитывает не только точность ответов, но и умение...
Ян Лекун представил LeJEPA – новый, простой и эффективный подход к самообучению, отказавшись от сложных традиционных методов. Ранее для предотвращения коллапса признаков использовались stop...
Google DeepMind представила SIMA 2, назвав его важным шагом к созданию общего искусственного интеллекта (AGI). Этот новый агент, основанный на языковой модели Gemini 2.5 Flash Lite, способен видеть...
























