搜索:
-
OpenAI将开源 o3-mini,或适合手机大模型
Sam Altman在早上9点50分提出关于OpenAI下一个开源项目的问题,探讨是开发类似o3-mini级别的小型模型(需在GPU上运行)更有用,还是开发更适合手机移动端运行的模型更有用。
-
微软开源创新框架:可将DeepSeek,变成AI Agent
微软发布了OmniParser的最新版本V2.0,这是一个视觉Agent解析框架,能够将DeepSeek-R1、GPT-4o、Qwen-2.5VL等大模型转化为可在计算机上使用的AI Agent。与V1相比,V2在检测较小的可交互UI元素时准确率更高,推理速度更快,延迟降低了60%,在ScreenSpot Pro基准测试中,V2+GPT-4o的准确率达到了39.6%,相比原始GPT-4o的0.8%有显著提升。
-
1秒锁定7500万债务黑洞,OpenAI o系列模型7大实际应用案例
包括处理模糊任务、从海量信息中提取关键信息、复杂文档推理与决策、多流程AIAgent、视觉推理、代码审查和性能评估。这些场景展示了o系列模型在处理复杂任务和推理方面的强大能力。
-
被 DeepSeek 抢的风头,OpenAI 决定在「审美」上找回来
OpenAI在估值达到3400亿美元后进行了全面的品牌重塑,包括更换字体、标志和配色方案。
-
最新全球模型榜单:阿里 Qwen2.5-Max超DeepSeek V3
2月4日,全球知名的AI模型评测平台Chatbot Arena发布了最新榜单。阿里通义千问团队的Qwen2.5-Max在榜单中排名第7,超越了DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级大语言模型。该模型在数学和编程方面排名第一,在处理复杂任务的硬提示方面排名第二。
-
AI 硬件的风吹了一年,消费电子变好了吗?
2024年,智能手机和PC市场迎来复苏,智能手机出货量同比增长7%,PC出货量同比增长3.8%。然而,复苏的主要动力来自新兴市场对低价机型的需求,以及中低端市场的改造,而非AI功能的推动。
-
OpenAI o3-mini被曝大量使用中文推理!全世界AI都要学中国话了?
国外网友发现OpenAI的o3-mini-high模型在没有用户干预的情况下,开始大量使用中文进行推理,甚至用中文思考俄语问题,引发了网友对OpenAI是否“借鉴”中国DeepSeek模型的猜测。
-
阿里Qwen2.5-Max超DeepSeek V3!又一国产大模型海外出圈
Qwen2.5-Max在最新一期的Chatbot Arena LLM Leaderboard中冲进前十,位列全球第七名,超越了DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型。它在数学和编程方面排名第一,在Hard prompts方面排名第二。
-
DeepSeek 三重门:小天才们,军团平推,和哲学式思想
DeepSeek的创新模式可以总结为“小天才的规模化 + 华为式的军团平推 + 原创(哲学式)思想”。这种模式颠覆了传统对创新的认知,融合了年轻创新者的活力和规模化协同创新的优势。
-
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
北京时间2月3日,OpenAI正式推出面向深度研究领域的智能体产品——深度研究功能,该功能由即将推出的OpenAI o3模型的特制版本支持,能够自主分析复杂信息,实时查找和综合数百个在线资源,并生成专业水准的完整报告,将原本需要数天甚至数周的研究任务缩短至5-30分钟。
-
春节不打烊 | 2024年度赛道盘点——AI篇
2024年AI明星产品汇总。
-
DeepSeek成“春节档”最大赢家 超越ChatGPT,登顶美国的它什么样?
一个月后的今天,DeepSeek再度震撼了全球科技圈。