MiniMax пуска модел M3 с 1M контекст и собствени мултимодални възможности

MiniMax (Shanghai Hixi Technology) пусна своя модел M3 на 1 юни 2026 г., позиционирайки го като първия вътрешен AI модел, който интегрира гранично кодиране, агентни възможности, контекстни прозорци с милиони токени и собствена мултимодална обработка – всичко това в рамките на една архитектура.

Изграден на базата на собствената архитектура Sparse Attention (MSA) на MiniMax, M3 API поддържа до 1 милион токена на контекст, с гарантиран минимум от 512K налични токена. Това го прави подходящ за дългосрочни агентски задачи, разширени сесии за кодиране и разбиране на видео в дълга форма. Моделът постига “водещ в индустрията” производителност при кодиране и бенчмаркове на агенти, с автономна декомпозиция на задачи, извикване на инструменти и възможности за многоетапно разсъждение.

M3 е вроден мултимодален модел, който е обучен на мултимодални данни от самото начало. MiniMax преструктурира целия си канал за данни, мащабирайки данните преди обучението до стотици терабайти и постигайки тясно съответствие между текстовите и визуалните семантични пространства. В бенчмарка на агента BrowseComp M3 отбеляза 83,5, надминавайки Opus 4.7 на OpenAI (79,3).

В демонстрация на автономни възможности, MiniMax възложи на M3 възпроизвеждане на изключителна статия на ICLR 2025 относно динамиката на обучение при фина настройка на LLM. Моделът работи близо 12 часа независимо, произвеждайки 18 ангажимента и 23 експериментални диаграми, успешно изпълнявайки основните експерименти.

MiniMax също така тества способността на M3 да функционира като асистент за изследване на AI, като му даде четири предварително обучени базови модела и го инструктира да завърши синтеза на данни, обучение, оценка и итерация в рамките на 12 часа – всичко това без човешка намеса. M3 отбеляза 37,1, нареждайки се на трето място след Opus 4,7 (42,4) и GPT-5,5 (39,3).

Моделът се предлага в две версии на API — M3 и M3-highspeed — с идентични резултати, но по-бързи изводи за последната. Автоматичното кеширане се поддържа и е активирано по подразбиране. MiniMax планира да отвори M3 с отворен код на HuggingFace и GitHub, като поддържа внедряване и фина настройка на частни клъстери.

Ценообразуването за M3 API (контекст ≤512K) се предлага с 50% отстъпка за първите седем дни: вход от 2,1 юана за милион токени (стандартен) или 3,15 юана (приоритет) и изход от 8,4 юана (стандарт) или 12,6 юана (приоритет). Четенето на кеша струва 0,42 юана (стандартно) или 0,63 юана (приоритет) на милион токени.

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin