TOON: Новый формат данных для LLM

Новости
TOON: Новый формат данных для LLM

TOON – новый формат данных, разработанный для более эффективной работы с большими языковыми моделями (LLM). Он представляет собой компактную и понятную альтернативу JSON, используя отступы и табличную структуру для записи массивов объектов.

Вместо привычного "key": "value", TOON использует заголовки столбцов и строки с данными, что позволяет экономить до 30–60% токенов при работе с однотипными объектами. Это достигается благодаря явным указаниям длины массивов и списков полей.

TOON особенно эффективен для массивов однотипных объектов с простыми полями, но может быть менее полезен для сложных, вложенных структур, где компактный JSON показывает лучшие результаты. Для чисто табличных данных CSV остается наиболее экономичным форматом.

Инструменты для работы с TOON уже доступны: CLI через npx @toon-format/cli и TypeScript-библиотека @toon-format/toon. Вы можете протестировать формат на своих данных и сравнить его с JSON, YAML, CSV и XML на онлайн-плейграундах.

TOON – не замена JSON, а скорее дополнительный инструмент для оптимизации промптов для LLM.


11
Нет комментариев. Ваш будет первым!

Ещё посты