AI新闻:xAI刚刚发布了Grok 4——在各项AI基准测试中全面领先!
此外,还有来自Perplexity、OpenAI、Google、Ai2、Hugging Face和腾讯的更多新闻。
以下是你需要知道的所有信息:
埃隆·马斯克的xAI发布了Grok 4和Grok 4 Heavy模型。主要亮点:
— 在人类最后的考试、Arc-AGI-2、AIME等领域达到了SOTA水平
— 128-token上下文窗口
— 改进的延迟和视觉支持的新闻语音
— Grok 4 Heavy支持多智能体处理复杂任务
https://t.co/hP0eNuiP3Y
Perplexity发布了Comet,一款具有代理功能的网页浏览器
它嵌入了公司的核心答案引擎和一个助手,监控用户浏览并回答问题,同时处理电子邮件管理等任务
仅限Perplexity Max用户使用
https://t.co/XXMWlrGW2y
OpenAI宣布收购Jony Ive的io团队已经完成,Ive和他的LoveFrom团队保持独立,但将参与OpenAI的设计方向
据悉,该公司还在开发一款代理浏览器,计划与Chrome和Perplexity竞争
https://t.co/prnpMagIp8
Google开始在Wear OS 4+手表上推出Gemini,包括Pixel、Samsung、OPPO、OnePlus等品牌的设备
该公司还在扩展其AI模式,并将其添加到Circle to Search中,帮助用户在Android设备上探索复杂话题
https://t.co/R2aUpRqxX5
Hugging Face开始接受Reachy Mini的预定,这是一个富有表现力的开源桌面机器人
起价仅为299美元,完全可用Python编程,非常适合人类-机器人交互、创意编码和AI实验
https://t.co/jfQPsJhBtv
腾讯的Hunyuan团队推出了ArtifactsBench,一个用于评估LLM生成的视觉作品的自动化评估管道
它通过MLLM-as-Judge评估1,825个不同的任务,在视觉作品的评估中实现了94.4%的排名一致性,与人类专家的评估结果一致
https://t.co/wWSVgNsrcP