MiniMax发布周回顾! 5天连炸5款AI神器: 视频 Agent、语音定制等等, 零门槛成本吊打Gemini, OpenAI都懵了!
- 2025-07-01 06:09:04
- 684
AI圈风起云涌,MiniMax在发布周推出多款AI新品,包括推理模型、视频生成工具和智能体应用等,性能与性价比惊艳全场,让AI技术触手可及。
上周的AI圈,简直被MiniMax一家给承包了,搞了一场为期5天的“发布周”,发布的内容一个比一个震撼!!!
从推理屠榜的M1大模型,到攻克物理难题的视频生成,再到人人可用的Agent和声音定制,这波操作直接把AI的门槛和成本打到了“骨折价”,OpenAI和谷歌看了都得懵圈。
由于饼干哥哥周末去了北京,这会才有空扒一扒这5天,MiniMax到底放了些什么“王炸”!
直达体验:https://www.minimax.io/
第一天:重磅炸弹MiniMax-M1,推理屠榜,上下文卷到100万!
周一凌晨,MiniMax直接扔出了一记重磅炸弹——MiniMax-M1,一个深度思考模型,直接对标DeepSeek-R1和OpenAI的O系列。
先来看看有多猛?
上下文长度100万tokens:全球最高水平,直接是DeepSeekR1的8倍!
思维预算高达80K:真正的“长考型”AI,思考深度离谱。
计算效率提升4倍:生成10万token,算力只要DeepSeek的四分之一,省钱就是硬道理!
性能屠榜:全面超越Qwen3-235B、DeepSeek-R1,尤其在复杂编程、工具使用和长文本理解上,简直是降维打击。
数字看着头疼?看下图,MiniMax-M1在各项核心基准上,特别是长上下文和软件工程方面,把一众对手甩在了身后。
怎么做到的?靠的是Hybrid-MoE架构和自研的CISPO强化学习算法,不是靠堆料,而是真刀真枪练出来的“脑力”。这波操作,直接把开源模型的性能和性价比卷到了新高度!
第二天:视频模型Hailuo02,谷歌翻车的体操,它搞定了!
如果说M1是技术宅的狂欢,那第二天发布的Hailuo02视频模型,就是所有创作者的YYDS!
最炸裂的一点是,它攻克了“体操”这个AI视频生成的“图灵测试”!之前连谷歌Veo3都在这上面翻了车,而Hailuo02生成的体操运动员,动作流畅,物理效果拉满,简直不可思议!
戳此体验:https://hailuoai.video/
Hailuo02主打的就是“超清画质”和“精准响应”:
原生支持1080p,画面质感直接拉满。
极限物理表现,不管是镜子里的倒影,还是复杂的运动轨迹,都符合现实规律,不再是“恐怖谷”视频。
SOTA指令遵循,你敢写多复杂的Prompt,它就敢给你多精准的实现。
在权威榜单ArtificialAnalysis上,Hailuo02直接冲到全球第二,把一众国际大厂甩在身后。更要命的是价格,1000美元能生成的视频秒数,吊打所有对手,这性价比谁顶得住啊!
第三、四天:Agent双雄齐发,生产力真要变天了!
当大家还沉浸在视频模型的震撼中时,MiniMax紧接着甩出了MiniMaxAgent和HailuoVideoAgent,直接宣告Agent时代的平民化!
MiniMaxAgent是一个能干大事的通用智能体。它就像一个“靠谱的人”,能多步规划、灵活拆解任务、调用工具,最终交付结果。用它生成一个带音频的学习教程,或者快速开发一个前端动画网页,都不在话下。正如官方所说,生产关系真的在变:
“Codeischeap,showmetherequirement.”(代码是廉价的,告诉我需求。)
总结起来,MiniMaxAgent目前具有以下几个特点:
1.编程:
包含更多组件和复杂跳转逻辑
能够模拟用户操作做非常全面的测试,不交付有bug的网页
重视界面设计的交互视觉效果和用户体验
2.多模态:
除了支持长文本文件,也支持视频、音频、图片等的全面理解
内置生图、音频生成、视频生成等能力,一键直出图文音并茂的作品
3.MCP扩展
内置MiniMaxMCP,多模态输出能力强大且实惠
集成常用Github/Gitlab、Slack、Figma等MCP,提高上下文,延展用户办公生活各种任务场景
而HailuoVideoAgent更是重量级!它是一个专为视频创作打造的Agent。你再也不用苦恼分镜、剪辑、配音了,只需要输入想法、上传图片,它就能一键生成具有专业水准的短片!想让你的宠物猫当快递员?想做个敦煌壁画风的混剪?上传张照片,剩下的交给它!
第五天:最终弹!声音也能Prompt生成?
发布周的最后一天,MiniMax带来了收官之作——语音设计工具。
戳此体验:https://www.minimaxi.com/audio
这玩意儿就更神了!你只需要在输入框里用文字描述你想要的声音,比如“严厉的数学老师”、“可爱活泼的女孩声音”,它会一次性生成3个符合要求但音色、语气、节奏略有不同的语音,选择自己喜欢的即可!目前可选择语音的语种仅支持英文或中文普通话。
来自官方的一个音色库:
“呵,五岳剑派,哎呀呀,别用这种眼神看着我嘛,人家可是一片好心呢。呵呵,听说你们掌门身体有恙,可要试试本宫这上等的丹药?”
最终生成的音频如下:
这意味着,无论是做视频配音,还是开发个性化应用,你都能拥有一个独一无二的、用Prompt创造出来的声音。之前只有ElevenLabs等少数公司能玩,现在MiniMax直接把它集成到了自己的生态里,而且门槛极低。IntelligencewithEveryone
回顾MiniMax这疯狂的一周,从底层模型到上层应用,从文本、视频到语音、Agent,它用五款产品清晰地展示了自己的全栈能力和野心。它的核心理念“IntelligencewithEveryone”(让智能普惠每个人)不再是一句口号。
AndrejKarpathy曾预言,最火的编程语言将是英语(自然语言)。
MiniMax用行动证明,自然语言不仅能编程,还能创造视频、设计声音、完成复杂工作流。
大模型的内卷远未结束,但MiniMax这波操作,无疑是把技术和产品的“性价比”与“易用性”推向了一个全新的高度。接下来,就让我们继续围观,看这场AI革命如何改变世界吧!
- 上一篇:克拉恋人幕后争议
- 下一篇:黄圣依程潇谈是否接受婚前同居