Black Forest Labs 推出FLUX.2 [klein]模型:亚秒级速度图像生成 实现0.5秒出图改图
Black Forest Labs 发布其最新模型 FLUX.2 [klein],这是一款兼具亚秒级速度与卓越画质的图像生成模型。 能够在 不到一秒的时间内生成高质量图像,同时保持令人惊叹的细节与美感表现。 FLUX.2 [klein] 专为快速创意开发、风格迁移与视觉编辑任务而设计。用户可
Black Forest Labs 发布其最新模型 FLUX.2 [klein],这是一款兼具亚秒级速度与卓越画质的图像生成模型。 能够在 不到一秒的时间内生成高质量图像,同时保持令人惊叹的细节与美感表现。 FLUX.2 [klein] 专为快速创意开发、风格迁移与视觉编辑任务而设计。用户可
机器翻译(MT)模型在过去十年经历了两种技术主流: 1. 传统大型语言模型(LLM)路线: 例如 GPT、Gemini、Claude 等,它们具备翻译能力,但模型庞大、计算昂贵,不便开源,也无法轻易部署在本地或移动设备。 2. 专用翻译模型路线: 如 Facebook 的 NLLB (No
Google 在 2024 年发布了 MedGemma 系列:一套开放的医疗生成式AI模型,用于医疗文本与影像任务。 这一系列属于 Health AI Developer Foundations(HAI-DEF) 计划的一部分,允许开发者基于 Google Cloud 和 Vertex AI 自主定
Vercel 实验室(Vercel Labs)发布全新开源项目 Agent Browser 。该工具是一个为人工智能代理(AI Agents)设计的浏览器自动化命令行工具(CLI),旨在让 AI 模型不仅能理解网页信息,还能直接在网页上执行操作。 Vercel 表示,Agent Browser
Call Me 是一个为 Claude Code插件 当你让 Claude 全自动任务,你出去潇洒的施工和,如何它遇到问题、或需要你做决定时,它会主动打电话找你帮助。😂 告诉你它遇到的问题、请你做决定、或者汇报结果。 比如: - Claude 跑完代码后给你打电话说: “我测试完了
MiroThinker 是由 MiroMindAI 团队 开发的开源研究代理(search agent),旨在提升 AI 的“工具增强推理(tool-augmented reasoning)”与“信息检索”能力。 - 模型参数规模: - MiroThinker-v1.5-30B -
Meta发布了一个令人惊喜的开源项目:Unity-SpatialLingo。 用于在 Meta Quest(AR/VR头显) 上开发混合现实(MR)语言学习体验。 通过 现实世界物体识别 + 自然语言 AI 交互 的方式,用户能够在真实的物理空间中,与AI一起练习语言。 也就是不用担心没
LTX-2 是由 Lightricks 开发的 DiT(Diffusion Transformer)架构的音视频基础模型,支持灵活的生成控制、快速推理、以及音视频同步输出。 它是目前首个公开发布的、在单一模型中整合 视觉、听觉、语言理解 的音视频生成系统。 该模型在质量、速度与同步精度上均达
Boston Dynamics 在2026年CES展会上正式发布了其 Atlas类人机器人 的产品版本,并宣布将立即开始生产。新的Atlas机器人将在 现代汽车集团的机器人超工厂应用中心(RMAC)和 Google DeepMind 部署,预计2027年将扩展到更多客户。 这是他们开发的企业级类
Claude Scientific Skills 是由 K-Dense Inc. 团队开发的开源项目,旨在为 Anthropic 的 Claude 模型提供系统化的 科学计算与研究能力扩展插件集。 该项目包含 138 个预构建科学技能(Scientific Skills),覆盖从 生命科学、化学